標準偏差(Standard Deviation、S.D.)

データのバラツキに関する指標には幾つかあるが、医療データを用いた研究に特化して言うならば標準偏差さえ理解すれば事が足りると言っていいだろう。標準偏差の計算式については省略するが、Microsoft Excel等、ソフトウェアを扱う際に少し戸惑うのが、平均値とは異なり複数の標準偏差の関数(ExcelならばSTDEV.PとSTDEV.S等)、計算式がある点だろう。これはどういうことか。先回のコラムで「全数を調べた平均値」としての「母平均」という用語と、「全数を予測するために調べた、あくまで標本としての平均値」としての「標本平均」という用語を紹介したが、この違いをデータのバラツキの世界で具現化しようとすると別々の計算式が必要となってくるのだ。本来調べたいデータの全てが入手出来ており、その分布におけるバラツキを指標として求めるのであれば母集団標準偏差(STDEV.P)が論理的には正しいことになる。つまり、平均でいうところの「母平均」よろしく「母集団標準偏差」は偏差、つまり平均との乖離具合を1データあたりに換算した計算式でシンプルに求めることが出来る。自身が担任をしているクラスの算数テストの標準偏差を知りたいならばこの計算式でよい。なぜならば自身が知りたい生徒児童全員の算数テストの点数は全て入手済みだからだ。ところが、何らかの全体が別途想定されていて、自身が入手出来たデータはあくまでその中の一部でしかない、そのうえで全体での標準偏差を“推定”したいならばデータ数で割り算をするのではなく、データ数から1を引き算した値で割り算をすることで「母標準偏差の推定値」を求めなければならない(何故1を引き算するのかの説明は長くなるため割愛させて頂く)。先の先生がクラスの生徒児童の算数テストの点数から学年全体の標準偏差を予測したいならば、こちらの計算式を使わなければならない。確かにややこしい。この「母集団標準偏差の推定値」のことを「標本標準偏差」というのだが、「母平均」の推定値である「標本平均」が実際のところは同じ値なのに対して、標本標準偏差は母集団標準偏差と計算式に違いがあるため混乱してしまいがちだ。

因みに、先の正規分布との関連で、データの分布が正規分布だろうと考えられるときには、平均値±標準偏差の範囲内には全データの約70%が、平均値±2倍の標準偏差の範囲内には全データの約95%が含まれることが知られている。分布が正規分布であることがわかるとこのように様々な追加情報を得ることが出来る。分布が正規分布していることを証明することは難しかったりもするのだが、先に述べた通り、実験誤差や測定誤差の類は基本的に正規分布していると考えて差し支えないだろう。

標準誤差(Standard Error、S.E.)

データの分布について基本的な理解が進まないと必ずと言ってよいほどつまずくのが標準偏差と標準誤差との違いだろう。医学系の研究においてデータをグラフ表記する際に標準偏差を上下に“ひげ”のように線を伸ばして描写することも多いが、この両者の違いが理解出来ていない先輩社員から「標準偏差だとひげが長すぎてみっともないので、標準誤差に変更してひげを短く描写して」というリクエストを受け閉口してしまったことがある。確かに両者には計算式上“ただならぬ”関係性があって「標準誤差は標準偏差をデータ数の平方根で割り算したもの」ということになるのだが、私はこの計算式上の関係性を一旦、完全に忘れてしまって全くの別モノ、別の世界の指標と捉えた方が理解しやすくなると考えている。そもそも標準偏差というのはデータのバラツキを示す指標であり決して「バラつくことは悪いことではない」のであるからして、単なるバラツキ度合、事実を算出しているに過ぎない。むしろ昨今は「多様性」を重んじる風潮があり、様々な国の文化慣習と共存、共生することでこそ国際競争力が維持出来るということからすれば、例えば身長、体重、肌の色、年齢、性別などはどんどんバラついた方が歓迎出来る局面も多いだろう。その一方で標準誤差はどうかといえば、英語ではErrorであり、日本語で「誤差」と呼称しているように「誤りの差」、すなわち値が大きいとは誤りが大きいということであり悪いことである。標準偏差の方は小さくても大きくても良くも悪くもないが、標準誤差は小さい方が絶対的に良いことである。

標準誤差の具体的な活用方法については、平均値±標準誤差、平均値±2倍の標準誤差といったような表記で用いられることが多い。前者であれば「真の平均値がこの範囲内に含まれている可能性は約70%」であり、後者は「真の平均値がこの範囲内に含まれている可能性は約95%」と解釈される。前回のコラムで平均値を“推定”として用いる際に「点推定値」という言葉を紹介したが、標準誤差を用いた“推定”は点推定のように1点勝負、という程には潔くないが、真実がそこに含まれている可能性は格段に高くなる。「区間推定」と呼称し、特に後者の「95%信頼区間」は医学系の研究では頻繁に登場する。数値の部分をもう少し繊細に表現すると、平均値±標準誤差の約70%は教科書的には「68%」、約95%の確証度を誇る「平均値±2倍の標準誤差」の「2倍」は教科書的には「1.96倍」と記載されることも多いので、参考書等で自学される際には混乱しないよう留意されたい。