対策としてのValidation Study

データ化された病名の信ぴょう性の課題については、その背景的な事情は違えども万国共通のようである。然るに、医療データを用いた研究を行った論文をそれなりのジャーナルに投稿すると、ほぼ確実に「このレセプト病名はValidation(信ぴょう性の確認)されているのか?」と、レビューワからの指摘がくるという。「No」であれば当然、論文は却下されてしまう。

「Yes」と答えるための方策の1つとして、当該研究に先立ってValidation Studyを実施しておくという手がある。また、別の研究者が行ったValidation Studyの結果を引用するというお手軽な手もある。Validation Studyとは、簡単に言えば当該のレセプト病名を実際の病名と比べ一致率を定量化するというものである。主にはカルテ上の病名と医療データ上の病名とを比べたり、学会の疾患登録データ等、“正解”といえそうな情報(ゴールドスタンダード)と照合することにより何パーセントの一致が見られたかを確認する研究である。

より詳しく知りたい方は、日本薬剤疫学会から先般リリースされた「日本における疾病名を中心とするレセプト情報から得られる指標のバリデーションに関するタスクフォース」報告書(※)を参照されたい。かなり理解が深まるはずだ。

しかしながら、Validation Studyを今の日本で実施するのは難しい。そもそも「Validation Study」という種の研究を、臨床現場の人がご存知だという期待がもてない。また、仮に研究の趣旨や目的について詳細を理解していただいたところで、保険請求のデータとゴールドスタンダードと覚しきカルテ上の病名とを見比べるという行為は、何やら検閲でもされるように医療者にとって心地良いものではないだろう。

一方、次世代医療基盤法の施行を受け、ようやく保険請求に記載の患者ID情報と専門の疾病領域学会が所有する疾患登録情報での患者ID情報とをリンク出来る可能性は出てきたが、現時点では学会の疾患登録データと照合できる環境には至っていない。「疾患登録」された病名をゴールドスタンダードと見立てて、一致率を調べることも今のところは難しそうだ。

加えて、得られた一致率の結果が、果たしてその医療データ全体の一致率を指し示すと言い切れるかどうかという問題もある。前述の通り協力してもらえそうな医療機関が限られてしまうと、仮に数百、数千の施設を含む医療データベースにあってもごく一部の、それも到底「無作為に選んだ」とは言い難い医療機関で得られた「90%が一致」といったような情報が、当該の医療データベース全体を代表しているという保証は出来ない。他の研究者による別の医療データでのValidation Studyの結果を引用するのは、もっと無理があるだろう。

ただ、それでもなおValidation Studyを行う価値自体は十分にある。レセプト病名の信ぴょう性に関する情報が何もないよりは、「〇〇病院ではレセプト病名の乳癌は90%正しい」といった情報は、例えば国が同じというだけであっても、国内における医療データを用いた研究結果を正当に解釈する上でかなり参考になるからだ。

然るに、こうしたValidation Studyがどうにか実施され、そこで得られた“一致率情報”を研究者間で、出来れば国として共通財産としたいところでもある。実際のところ、米国ではOMOP(※)の活動を引き継いだOHDSI(※)がこれを担っている。日本でもこうした社会的機能が待望されるところである。

「日本における疾病名を中心とするレセプト情報から得られる指標のバリデーションに関するタスクフォース」報告書

OMOP
Observational Medical Outcomes Partnership

OHDSI
Observational Health Data Sciences And Informatics
行政当局であるFDAと民間企業団体PhRMAの連携により設立。前回のコラムで紹介したCDM(common data model)等、研究成果は全て無料で公開している。
http://omop.org

一致度の指標

Validation Studyで用いられる「事実と一致している割合」の指標には、陽性的中率(Positive Predictive Value:PPV)が利用されることが多い。前述した「乳癌は90%一致」は、これをイメージしている。具体的には保険請求データの中から、乳癌についてこれから研究しようという研究者らがレセプト病名に「乳癌」と入力された症例を全て、または一部を抜き取り、それがカルテ上でも確かに乳癌であるかどうかを調べるやり方だ。表をご覧いただきたい。

 カルテ上
「乳癌」
カルテ上は
「乳癌」でない
合計
レセプト病名
「乳癌」
9010100
レセプト病名
「乳癌」以外
2048804900

PPVとは、この表では上の行(一致率90/100=90%)を確認したに過ぎず、下の行は気にしていないことになる。この表をご覧いただければ、「レセプト上は乳癌ではないのに、実際には乳癌という人は何人いるだろうか」という一致率だって気になってくるだろう。ただし、表中の「20人」という人数を特定するためには、保険請求データが5000件もあったらその全てを調べるわけにもいかず、何も手がかりがないとするとこれは容易ではない。

また、「レセプト上の乳癌が実際に乳癌かどうか」だけわかれば、ほぼ事が足りるというケースもある。例えば、乳癌患者の10年間での癌転移率を見たいならば、表中の「90人」だけを対象としても相応の研究成果が得られる。こうしたことからも、Validation StudyではPPVがその一致度をみる指標としてよく用いられるのだろう。

Validation Studyの話とは逸れるが、もしこの表が「乳癌健診」の性能評価という場面であるならば話は全然違ってくるだろう。実際には「90人+20人=110人」の乳癌症例がいるのに、5000人の検査により20人を見逃した上、10人の疑陽性、つまり乳癌ではないのに乳癌と間違って判定されてしまうとなると、健診としてはあまり精度の良いものではないことになる。この際、健診の精度を表す指標として、「90人/110人=81.8%」を「感度」、乳癌でない人を正しく「乳癌でない」と判定できた「4880人/(10人+4880人)=99.8%」を「特異度」と言うが、こうした指標の名前を聞いたことのある人もいるだろう。他に「陰性的中率(的中度)」や「陽性尤度比」「診断オッズ比」といった指標もある。