はじめに

今回から5回、研究デザインの基本的な考え方や方法論、注意事項について紹介したいと思う。このパートでは医療データを必ず使うという前提は、一旦取り払った方理解しやすいかもしれない。学問領域でいえば「疫学」と言って差し支えないと思うので、研究デザインにもしご興味を持っていただけたら、ぜひ疫学関連の入門書や専門書を手に取ってみて欲しい。

風が吹けば桶屋が儲かる

風が吹けば桶屋が儲かる。果たして一体、誰がいつ頃言い出したのかは定かではないが、江戸時代の文芸作品「東海道中膝栗毛」にはこれを模したくだりがあるらしく、然るにどうやら数百年も前から知られた話のようである。

強風による砂埃で失明者が増え→彼らが三味線弾きになる→三味線の材料となる猫の皮が消費→猫が減るのでネズミが増える→ネズミが桶をかじるので新しい桶が必要となる→桶屋が繁盛。ときに無茶なロジックの例え話として、また一方で無関係に思える事柄同士、例えば我々の言動が地球の裏側にも小さな影響をもたらし得るという因果応報の話として、何百年もの歳月伝えられてきたこのお話(ハイカラな言い方をすれば「ロジックモデル」という表現の仕方がある)は、「因果」の有り様を象徴している。

因果には常に原因と結果という“主従関係”があり、原因が必ず結果よりも先にあるという時間的な絶対関係がある。また、生活習慣→糖尿病→心臓疾患のように、いくつもの事柄がチェーンのように連なる。さらにはその推論が「鋭い洞察」なのか、それとも「単なる思い込み」に過ぎないのか、奇天烈さのニュアンスも加わる。例え話としては少々不謹慎であることをご容赦いただくならば、「風が吹く」ことと「桶屋が儲かる」ことの関係性判定は、医薬品とその処方後に発生するイベントとの微妙な因果関係の判定とも似ている。

一方、「因果」を推論するという難題と比べると、「相関」の方は気楽なものだ。事柄の関係に原因→結果という縛りはなく、時間的な関係性も問わない。指標として用いられる「相関係数」は“単なる偶然”であっても構わず、計算結果を掃き出してくれる。例えば、「地球の温暖化」と日本の「高齢化」はどうだろう。そこに因果性があるかどうかは別として、単に「相関係数」を求めるだけというならば、データさえあればExcelでも容易に計算が可能である。実際のところこの両者の相関はかなり高い値なのだが、相関係数が高いからといって、では地球の温暖化が進めば寿命は延びるのかといえばそれは違うだろう。両者の「相関」は高くても、「因果」関係があるかどうかは全く別の話だ。