情報工学~データ処理と品質管理のスキル~

情報工学と一括りにしてみたものの、新旧、大きく2種類ほどの分類ができそうだ。従来型の情報工学的専門力といえば、医療現場における医療情報専門家や製薬企業における情報システム部といった呼称が、まずは頭に浮かぶだろう。医学研究をこれから行おうという局面では、電子カルテシステムを一から構築する技術力までは要求しないとしても、システムが正しく要求した通りに動くかどうかを筋道立てて保証するための方法論に関する知識は、持ち合わせていたい。

悪意をもったデータねつ造は論外であるが、人は悪意なくともミスはするし、ミスが発生することを前提とした情報管理のスキルが要求される。欧米ライクな合理主義の視点に立てば「ミスは悪」ということは決してなく、目指すべきは「ミスをする確率を極小にするための工夫」と、「ミス率(エラー率)が〇%以内」といった指標の明確化である。こうした品質管理に関する構成概念の理解が必要となる。

一方、これまでになかった新たな情報工学関連の要求がある。それが「莫大なデータから処理できる量のデータをスマートに抽出する」スキルだ。Microsoft Excelでは100万行のデータファイルであれば開くことができても、何億行、何兆行ものデータを開こうとしたら何日もかかるか、そもそも物理的に開くことができないだろう。

また、画像データや音声データも利用したいとした場合に、適切に研究主体者へデータを提供するにはどうしたらいいか。そもそもどのようにデータを格納しておくのかといった要求スキルが求められる。これは従来型の情報システム部門が必ずしも所有しているわけではない、ビッグデータ時代の新たな情報工学の要求スキルといえそうだ。

統計解析~フェアな解析をするスキル~

ごく単純にクロス集計表を作ることを目的とするならば多くの人が独力でできるだろうが、Real World Dataをフェアに比較したいということになると、生物統計の専門家の介在が必須となってくる。一般に比較したい「A治療」と「B治療」、あるいは「A薬」と「B薬」は、全ての医師にとって無作為に選択されるはずはなく、何らかの意図をもって、「先ほどの患者にはA薬だったが、この人にはB薬だ」としているはずだ。

こうしたReal World、現実世界の医療データを単純に「A薬投与群」と「B薬投与群」の治療成績を比べるわけにはいかない。なぜならば、純然たる物質としての「A薬」vs「B薬」の治療成績というよりも、「A薬が処方されるような(容態、背景の)患者群」vs「B薬が処方されるような(容態、背景の)患者群」の比較という色合いの方が、薬剤処方による違いよりも格段に濃くなってしまうからだ。

仮により重い容態の患者さんにはA薬を処方するという治療方針があったならば、たとえA薬がB薬よりも効き目の上でかなり優れていたとしても、「A薬が処方されるような患者群」の治療成績は惨敗という結果になってもおかしくない。こうした単純集計の結果は、治療方針やその医療現場の実態を承知している人が取り扱うならば相応の参考資料になるだろうが、ときに誤解や勘違いによる悲劇を招きかねない。多変量解析やデータマッチング等、フェアな比較を行うためのデータ処理技術は、生物統計の専門家や以下に述べる疫学の専門家が所有している可能性が高いだろう。