代表値としての平均値

先に述べたクラスの数学の平均点は「代表値としての平均値」といえるだろう。代表値というのは文字通り、ある集団を代表する値の総称であり、平均値の他に、中央値(メジアン)、最頻値、最小値、最大値などがある。四分位点も便利な代表値であり、小さい順に並べて上位25%のところをQ1(第1四分位点)、下位25%の値はQ3(第3四分位点)のように表現する。真ん中のQ2(第2四分位点)がつまり中央値であり、Q1,Q2,Q3で集団を3か所、四等分にするので四分位点という。医薬系の研究者は実感していると思うが、ヘルスケア分野においては平均値よりも中央値の方が代表値として適切、ということが割とよくある。例えば治療日数、治癒・回復までの日数といった期間や、医薬品の総投与量、併用薬剤数など「一部の患者で異様に大きな数字になる」系は、基本的に平均値が役に立たないか、誤解を与えかねない火種となることさえある。平均値が分布の真ん中から結構、離れているのだ。日本の総貯蓄額なども平均値が代表値としてあまり相応しくない好例で、一部の大金持ちの存在が中央値と平均値の間を大きく引き離すことに関与している*。こうした分布の場合には中央値を参考とし、平均値を使わない方がむしろ“平均的な”世帯のイメージに近づくだろう。

また、企業のマーケティング部門であれば最頻値を代表値として利用することも多い筈だ。20代の女性をターゲットした雑誌編集者にしてみれば仮に高齢者へも裾野広く読者がいたところで、その平均をとって34.2歳、のような数字は有効な指標とはなりにくく、中央値も良い代表値とはなりにくい。我々、医薬研究の分野でも“最頻値的”要求もある。例えばある種の医薬品において副作用が多い年代を調べたいといったケースを考えてみよう。「10歳代が最も危険」といった情報が重要なのであり、ここでは年齢の平均値や中央値は指標としては相応しくない。また、「10歳代と、80歳以上の2か所にピークがある」といった場合もある。この場合は1つの年代だけを最頻値としても集団の特性を表し切れることにはならない。無理に代表値としてデータを要約するのではなく、あくまで「2つのピークがある」としておいた方がよいだろう。

推定値としての平均値

野球の打率、ゴルフのパーセーブ率やテニスのサービスキープ率等々、スポーツ選手の力量を測るうえで何らかの割合の指標はもはや欠かせなくなっている。こうした割合の指標について少し視点を変えてみよう。例えば野球の打率ならばヒットを1、アウトを0に、ゴルフはパー以内を1、ボギー以上を0に、テニスのサービスキープを1、ブレイクされたら0、といったように「成功結果を1、失敗結果を0」としてみる。すると、打率、パーセーブ率、サービスキープ率のそれぞれが、当該選手の過去の成績を平均値の計算式で求めているのと同じであることに気づく筈だ。その意味においてこうした割合の指標が、他者と比較する上での当該選手の「代表値としての平均値」であることがみてとれる。

一方でこうした“平均値”は次の打席、コース、サービスゲームにおける結果を予測しているという側面もある。これまでの成績が50打数25安打(打率5割)であれば、今回の打席で安打(ヒット)を打つ可能性が5割と推定される。もちろん、対戦する投手の成績や自身の体調がどうかといった他の要因までわかればより高い推定精度にも成り得るだろうが、こうした他の情報が一切ないならば、今回の打席でヒットを打つ可能性が5割というのは合理的な予測であり、統計学ではこの5割のことを「点推定値」と呼ぶ。医薬の世界においても治癒率、改善率、回復率、副作用発現率といった割合の指標は、今から目の前の患者に対して行う結果の予測として役立っていることだろう。平均値には過去の結果を集約するだけではなく、こうした何らかの推定に用いるという側面がある。

また、推定という概念は未来予測のように必ずしもこれから起きることを推察するという時間的な意味合いだけではない。統計調査では「本来調べる対象となる全てをしらみ潰しに調べる」ことが現実的に不可能なことが多く、サンプルをとって全体を推定する、標本調査のアプローチがとられる。例えば湖での違法な外来魚の影響をみる際に今流行の「水を全部抜く」ことは叶わなくとも、標本調査によって「100匹捕まえたら50匹が外来魚だった」ならば「およそ半数ほどがこの湖では外来魚に占拠されてしまったようだ」と推察できる。これは未来予想ではなく、「標本から全体を予測する」推定のアプローチである。統計学者は得られた平均値を「全数を調べた平均値」として捉えるのか、それとも「全数を予測するために調べた、あくまで標本としての平均値」なのかについて母平均、標本平均と呼称を変えて区別する。「全数を調べた平均値」ならば、事実であって推定値ではない。ただし、調べた全数の結果を来年以降の予測に使うとなれば、これは推定値と成り得る。

「推定」の話のついでに「ベイズ推定」にも少し触れておこう。先の打率5割の選手の中には「50打席で25本のヒット」という猛者もいるだろうし、「控え選手が試合の決まったところで2打席に立ち、1本のラッキーヒットを打っただけ」という「2打数1安打」の選手もいる筈で、この両選手の次の打席でヒットを打つ確率が同じだとは誰も思わない筈だ。それでも古典的な統計学ではどちらも「打率5割というのが点推定値」という立場を譲らない。「後者の選手の打率5割という、その値の信頼度がかなり低い」という注釈をつけるのがせいぜいである。これに対してベイズ推定は大胆にも主観確率の採用を許容する。日頃、当該選手をよく観察している監督が「2打数1安打であっても、この選手は打率1割程度の実力だ」とするならば、「打率1割が推定値」としてよいという考え方に立つ。ベイズ推定や主観確率から推定値を更新する「ベイズ更新」は現在では様々な分野で実用されているが、非科学的ともいえそうなトーマス・ベイズのこうした大胆なアプローチに対して古典的な統計学者が当時、生理的な(?)拒否反応をした気持ちもよくわかる。