珍しさを定量する

「私の誕生日、実は1月1日なんです。」「えー、珍しい。365分の1の確率ですね。」

珍しさとは何だろう。私は至って平凡な日の誕生日であるが、それだって365分の1の確率だ。かといって何か珍しいとは感じたことは無いし、上記のように「実は」のように打ち明けるような日付でもない。確かに1月1日生まれの人にそれと打ち明けられたら、私も何故だか珍しいと感じることだろう。今回とりあげる有意差検定の基本概念は、「珍しさを定量する」ことに他ならない。もし珍しさが365分の1ならばp=1/365=0.0027と記述することになる。この”p”というのが有意差検定で用いられる指標でprobability value(確率値)が正式名ではあるが、英語表記p-value、日本語ではP値(ピーチ、と読む)という。これはいわば「ありえる確率」を示すものであり、例えばp=0.50であれば「50%ありえる」、p=0.08であれば「8%ありえる」と読み替えておよそ差し支えない。

 (1)「私の誕生日、3月3日なんです。」「え、僕も3月3日だよ。珍しいね。」
 (2)「私の誕生日、3月3日なんです。」「え、僕は5月5日だよ。珍しいね。」

上記(1)と(2)ではどちらが珍しいと感じるだろうか。最初の発話者が女性かどうかハッキリしないが、もし女性だとしたら何となく(2)の方が珍しく―つまり、女性が女の子の節句、男性が男の子の節句生まれ―、この二人は付き合った方が良いかもしれない。冗談はさておき、どのくらい珍しいのか定量化するには何らかの定義が必要となってくる。1月1日や3月3日は月と日が同一であることが珍しさの源泉にも思え、もしそのように定義すれば年間12日あるのでp=12/365=0.0329の珍しさということになる。一方、1月1日の前日である12月31日も、クリスマスイブの12/24も、閏日2/29もそれぞれに珍しさを感じる。取りまとめて珍しい日とそうでない日と2分類して定義するならば、珍しい日に生まれた人は案外とそんなには珍しくないことになるかもしれない。

フィッシャーの農場実験

有意差検定は統計学者フィッシャーによる提案というのが起源である。彼は「3%ありえる」「1%ありえる」といったように、ありえる確率P値が所定の値(有意水準と呼ばれる)に満たないならば「ありえない」と言ってしまおうというアイデアを提案し、これを農業分野で用いた。得られた収穫量の差異が偶然による差異なのか、それとも偶然ではなく新たな肥料による効果なのかの区別に確率論を持ってきたのである。因みに、医薬系分野の研究では有意水準について当時のフィッシャーと同様に5%を使う慣習が定着しているが、この5%は単にフィッシャーの感性が決めただけのことであって、何ら科学的根拠や裏付けのある数字ではない。実際のところ分野が異なれば有意水準には10%や1%なども用いられている。

正規分布、再び

全くのブラックボックスから2つの値を取り出したところ「100」と「70」であったら、これはどのくらい珍しいことだろう。もしも単位が記載されていて100kg、70kgあるいは100cm、70cmというのであれば空想を働かせて少しは語ることも可能かもしれないが、単位も無ければ本当に何もわからない。次に取り出す値が「800,000」かもしれないし、「-0.6」かもしれない。ところが、そのブラックボックス、母集団がおよそ正規分布しているとみて間違いない、ということであったらどうだろうか。先回紹介したように測定のブレ等は正規分布することがわかっているので、状況がハマれば得られた数字の元となる“集団”が正規分布していると考えて良い局面は多い。例えば高血圧治療薬を処方する前の血圧値と、処方した後の血圧値の引き算した値はどうだろう。実際にはこの治療薬が全く効いていなくても、引き算をすれば常に0になるということはなく測定誤差として少なからずブレは生じることだろう。それでも「全く効かないとしたら、幾度も測定を繰り返せば平均値は0になる。ブレはおよそ正規分布とみなしてよい」とすることが出来そうだ。そこから得られたものが「100」「70」であったなら、それがどの程度、珍しいことなのかを少しばかり推定できるだろう。こうしたアイデアを提案したのが、匿名「スチューデント(生徒)」によるt検定(ティー検定、と読みます)で、これは最も有名な有意差検定の1つである。先ほどは前後の引き算を紹介したが、t検定は同じ人での前後値の比較だけでなく、別の人同士、例えばA薬処方をした人たちとB薬処方をした人たちとで比べることも出来る。前者は「対応のあるt検定」、後者は「対応のないt検定」と呼ばれる。なお、本来正規分布する筈のデータであってもサンプルが少ないと分布がちょっと歪むということを彼は指摘し、それをt分布と呼んだ。取り出す値がt分布していると見なせるときにはこのt検定が可能となる。