(1) データの量

量とはいっても、DB全体のボリュームというわけでは決してなく、あくまで利用者が興味のある対象の数ということになる。例えば、肺がん領域の研究者であれば、肺がん患者の数が重要である。もっとも、肺がんの抗がん剤を扱う製薬企業にしてみれば、それが例えば膵臓がんにも使われているのであれば、副作用の懸念を確認する上では肺がん患者の人数と膵臓がん患者の人数がデータ量の目安、基本単位となる。研究デザインにもよるが、この製薬企業の立場であれば、全体の数そのものが直接目安になるというわけでもない。例えば肺がん1000例、すい臓がん1000例の2000例ということなら良いが、肺がん2000例、すい臓がん0例の、計2000例ということでは想定している研究ができないということもあるからだ。

また、人数というのが常に基本単位というわけでもない。インフルエンザのような感染、伝染研究の場合は患者さん一人ひとりを単位とはせずに、例えば学校のクラス、地域における学校、国における都道府県といったものが基本単位になることもある。さらには、基本単位となる「人数」「学校の数」といったものとは別の基軸の「量」、すなわち利用可能な項目の数も同様に重要だ。この場合はDB上の項目そのものが重要なのではなく、果たしてちゃんとその項目が空欄なく入力されているのか。

また、以下に述べるように品質や操作性、例えば、単位や書式が揃っているのかという視点と切り離して考えることができない。さらにはビジット、要するに項目の繰り返し件数もデータ量に関わる。性別や身長は経過時間に沿って多くのビジットが欲しいという要求はさほどないだろうが(全くないことでもない)、体重や体温、検査値などは時に秒単位で、あるいは長い年月での情報を欲することが良くあるだろう。

(2) データの質

データの保証レベル、と言った方がわかりやすいかもしれない。どうやら日本では「信頼性の足りないもの」に出くわすことがあまりないせいなのか、DBを評価する上で案外と品質の視点が抜け落ちがちにも思える。特段、これからどうにか医療DBを構築していろんな研究者に使ってもらおうという人にお話をすると、その品質維持に要する時間、手間、そしてコストの検討がすっぽり抜けていたりするのだ。良い医療DBを、その品質を維持し続けるための創意工夫はビジネス的センスが重要で、こうしたスキルのある人との協業なくして良い医療DBにするのは難しそうだ。

ちなみに、「データの質」といっても、それを保証する上ではデータそのものだけでなく、その医療DBを作る人の質まで問われることになるので注意が必要だ。とはいえ、人格者であるかどうかという意味ではない。どのような教育を受け、あるいは研修を受講し、どのような認定や免状を所有し、何年の業務経験があるのか。教育記録については手書きで残すか、あるいは電子で残すならばその仕組みに監査証跡の機能はあるのか。

企業で働いている人であればこうした手間暇は肌感覚で承知しているのだろうが、医療現場の方でこうした視点を問われる監査や査察の経験値をお持ちの人はさほどいないだろう。また、その医療DBを作る団体の経済的な安定性や、社会的に好ましからぬ団体との関わりがないことの担保なども総合的な「信頼性」の概念の一部として問われることがある。

(3) 操作性

簡単に言えば取り扱いやすさ、使う人のニーズにあった便利機能がどれだけ付帯しているかである。先に述べたようなリスト化や要約集計、グラフ化はもとより、昨今のITないしはICTと称される技術レベルの進歩からすれば何らかのリコメンド機能、つまり「このようなグラフ表示が良いかもしれません」「こちらの方が安価となります」といった推奨機能の要求もあるだろう。

ただし、操作性とは便利機能がどれだけ付帯しているかとは全く別の視点があり、つまりその操作機能を見つけやすくしているのかどうか、ボタンがどこにあって、マニュアルを読まなければならない時間がどの程度かという視点も重要である。Webデザイナーという職種が生まれたように、デザイン的な視点や、ヒトの行動様式を熟知した心理学、行動学に根ざした色や大きさ、配置がなされた操作ツールが利用可能な医療DBであればより高い価値を生むだろう。

ただ、主役となるのはあくまでデータそのものである。然るに、操作性とはいっても、(1)に述べたデータ量を満足出来るレベルで十分確保した上での検索や並べ替え、ダウンロードといった処理スピードの視点がより重要だろう。ビッグデータと呼称される現代のデータには、写真や動画もその対象となり得るわけであり、旧来とは桁違いのデータ量を取り扱うことも想定される。仮に何億行、何兆行のデータ量があってもストレスなく必要なデータを取り出せるようにするには相当レベルのIT専門技術を要するが、周囲のIT技術者がこうした技術を必ずしも理解しているとは限らず、人材を見つけることは簡単ではなさそうだ。

また、物理的には病院や病院団体それぞれに分散しているものを、利用者にはそれを意識することなく利用させたいという場合や、クラウド型に1つところにデータがある場合も含め、(2)で述べたデータの質を保証するには、ウィルスの混入制御の技術導入といった要求も避けられないところだ。

(4) 価格

ユーザとして見た場合、価格は単純に安い方がよい。携帯電話サービスのような他の産業と同様、医療データ産業においても、その価格を単純に比較するのは容易ではなく、データそのものを全て提供するサービスから、1つの研究あたりで金額が決まるもの、あるいは1つの医薬品に関して副作用に関わる案件ならばいくつ研究しても同額に設定しているものもある。

また、本格的に研究を始める前に、(1)で述べた、研究者が知りたいデータ量に関わる情報を無償で提供するところと有償というところもある。さらに、国家レベルで見た場合、医療や医療サービス産業の発展を鑑み、国民に対して無条件で無料開放するような政策も重要であり、こうしたDBのことをオープンデータと呼称することもある。「タダほど高いモノはない」という言葉があるように、国としてオープンデータを提供している場合、要するに我々国民の税金などでその運営をまかなっているという図式になっているわけで、元をとるという意味でも積極的に活用していかないと国としては損失になってしまう。

(5) サービス・ケア

(1)~(4)で述べた量、質、操作性、価格の全てが要するにサービスの一部とも言えるだろうが、ここではその他のサービスやケアについて切り取って考えてみたい。何よりも医療データはそのほぼ全てが現実世界のデータ、今時の言い方を借りるならばリアルワールドデータなのであって、研究室や実験下でのデータではない。

「クセがすごい」のだ。であるが故にその医療データにはどのような“クセ”があるのか、それをよくよく理解している人がこうした医療DBを利用する場合には必要となってくる。例えば諸外国の医療データを利用しようとした場合、その国の保険制度や医療実態、文化慣習などを全く知らずしてこれを使うというのは無茶である。こうしたクセをよく知っているのは何より医療DBを提供する側の人であり、元々のデータを提供した人であるはずだ。医療DBを提供するサービスをするならば、適宜適切にこうしたデータの特徴を利用者にアドバイスしてくれるスタッフの介在がありがたい。

また、数多の産業の競争原理と同様、医療DBを提供する人たちの姿勢や態度、礼節なども、その医療DBそのものの魅力とは別に重要であろう。果たして提供者側に「ぜひ、我々の医療DBをお役立てください」という真摯な態度があるのか。「使わせてあげてもいいよ」といったような横柄な態度であったならば、代替もなければそれでも利用したいという研究者もいるだろうが、何れ代替となる医療DBサービスが登場してくれば自然淘汰されることになるだろう。