医療データの“ソムリエ”

実験室のように管理された中で行う研究から得られる情報とは違い、RWD、現実世界のデータは以前にも述べた通り「クセがすごい」。項目の中には信頼性に足るものもあれば、空欄ばかりでおよそ役に立ちそうもないものだってある。特段、注意しなければならないのは前回取り上げた疾病名の信ぴょう性だが、それ以外にも多くの“落とし穴”があると覚悟しておいた方がよい。

例えば、電子カルテの入力仕様で設定される初期値はどうだろう。疫学分野では「初期値バイアス」として知られている。入力の手間を省くために、幾つかの項目についてはあらかじめ何らかのデータが入力されており、その値とたまに違うときだけ修正するという運用の仕方はよくある。例えば妊娠、喫煙、アレルギー等の有無に関して、はじめから「無し」が選ばれていて、「有り」のときだけ直す。こんな入力ルールだと確かに空欄は避けられるが、果たして本当に「無し」なのかどうか。有るか無いかの確認し忘れがあっても、初期値の「無し」がデータとなってしまうため、情報の信ぴょう性が下がる。

一般にデータを2次利用する立場の人にとってはこうした入力ルールを調べることは困難で、故に「その医療データのクセをよく知っている人」のアドバイスが欲しくなる。特に、海外の医療データを利用する際にはどのような「クセ」があるのか、皆目予想もつかないのでなおさらだ。データが作られる工程の内情をよく知る“ソムリエ”のような人に協力してもらえる機会が必ずあるわけではないだろうが、当該データ特有の「クセ」を知るために、例えばその国に住んでいる人とコンタクトをとる等、できる限りの努力はしたいところだ。

データインテグリティ(Data Integrity、DI)

一般論で言えば、品質確保の目標レベルは「顧客が求めるレベル」といえるだろう。500円のランチで求めるものと、3,000円のランチで求めるものとはクオリティレベルの要求は同じではない。さて、医薬品についてその承認申請に関わるデータの品質レベルを考えたとき、各国の規制サイドが要求するのは、「ねつ造は論外として、不可抗力的なミスも極限まで無くしたもの」レベルだ。これは医薬品という商品が特に我々の生命に直接的に関わるものである以上、「顧客が求めるレベル」を想定するならば妥当解ともいえるだろう。欧米の規制当局はこの要求レベルについて、データインテグリティ(データの完全性)と称して承認申請をする各企業に対し“完全”を求める。日本の行政当局も同様だ。

具体的なDIの要求については、ALCOA原則やCCEA原則として整理されている。データの「完全性」を満たす上での下記の構成要素の頭文字をとったものだ。

【ALCOA原則】
Attributable:帰属性(記録に戻れて責任が誰にあるか、わかるようにしておく)
Legible:判読性(鉛筆や水性ペンは×。バージョンが古く開けない電子ファイルも×)
Contemporaneous:同時性(作業タイミングでの記録であること。後で記録は×)
Original:原本性(コピーでは代用できない)
Accurate:正確性(真実でなければ話にならない)

【CCEA原則】
Complete:網羅性(関連情報に漏れがないこと)
Consistent:一貫性(判定がブレたりしていないこと)
Enduring:耐久性(「判読性」が永続すること)
Available when needed:要求時利用可能性(求められたときにサッと出せること)

>