2章 統計の理論と手法

代表値の種類
平均値:平均値=すべての数値の和/すべての数値の数
中央値:数値を大きさの順にならべたときの真ん中の数
最頻値:最も頻繁に出現する数

度数分布では、実際に観察された数値が観察されたそれぞれの範囲またはパーセンテージに分類される。

言葉の定義
交絡変数:実験状況に影響を与える未知のまたはコントロールされていない変数
連続変数:時間、スピード、距離など、量を極めて小さな単位に分割できる変数
共変数:複数の独立変数を伴う研究における複数の従属変数
従属変数:従属変数の結果は、独立変数と共変数に従う
二分変数:2つのうちの1つの分類にしか分けられない変数
離散変数:子どもの数や欠点の数のように、整数しかとらない変数
順序データ:重要度を高い者から低いものへと並べることができる数字や変数
無作為化:共変数を実験群と統制群に拡散するのを助ける手法
標準偏差:変数の平均からの散らばり度合いを示す指標

分散の測定でよく使われるのは標準偏差である。

非対称度は、サンプルデータの値の分布が非対称であることであると定義されている。

アウトライアーは、データの中で他の値に比べてはるかに離れているものである。

正規分布とは、値が均等に広がっているのではなく、特定の値の周辺に多く集まっている傾向が見られることである。

    4つの基本的なデータ分類
  • 名義データ
  • 順序データ
  • 間隔データ
  • 比率データ

    名義データ
    最も低い種類のデータであり、カテゴリーの分類を提供する
    例)
    以下の付加給付のうちあなたにとって最も重要なものは?
  1. 健康保険
  2. 障害保険
  3. 401K

    順序データ
    順序データでは、測定された項目を変数の質が高いか低いかという点から順番に並べることができる
    例)
  1. あなたは週に何時間働きたいですか?
  2. 40~42時間
  3. 43~45時間
  4. 46~48時間
  5. 49時間以上

    間隔データ
    間隔データでは、測定された項目を順番にならべるだけでなく、それらの間の大きさの違いを比較することができる
    例)
    あなたは大学でのコース学習をどの程度追加でとりたいですか?
  1. 絶対にとりたくない
  2. とてもとりたくない
  3. とりたくない
  4. とりたい
  5. とてもとりたい
  6. 絶対にとりたい

比率データ
比率データは間隔データと同様であり、それに加えて絶対的なゼロが存在する
例)
昨年あなたの部署に支払われた給料の総額は?
もし答えがある年は11万ドルで次の年は9万9000ドルであれば、給料は10%減ったということができる

分散とは、分布がどの程度散らばっているかという基準である
分散(S2)=平均からの偏差の2乗/観測された数字の数

    標準偏差とは、平均値が代表値として用いられる時に統計的に最もよくもちいられる分布の基準である
    標準偏差(S)=分散の平方根
    標準偏差の属性
  • 標準偏差はデータの平均値周辺の分布の散らばりを測定するためだけに用いられる
  • 標準偏差はネガティブなものではない
  • 標準偏差はアウトライアーに大きな影響を受ける。1つアウトライアーが存在すると、標準偏差の数値が上がったり、散らばりの図がゆがめられたりする可能性がある
  • ほぼ同じ平均値のデータであれば、散らばりが大きいほど標準偏差も大きい
  • もしすべてのデータセットの値が同じであれば、標準偏差はゼロになる(なぜなら、すべての値は平均値と同じだからである)

偏差値によって、あらゆるテストの素点を比較することができ、テストの解釈をより明確にすることができる。

相関の重要な目的は、2つかそれ以上の変数の関係を測定することである。しかし、相関は因果関係を明らかにするために用いるべきではない。相関はXであればYということを予測する。

    推測統計学の目的は、(帰無)仮説を検証し仮説を承認したり棄却したりすることである
    仮説検証プロセスの5つのステップ
  1. 仮説を立てる
  2. 有意水準を選択する
  3. 統計値を計算する
  4. 棄却値を得る
  5. 帰無仮説を承認または棄却する

    統計的有意性についての重要な概念
  • 統計用語において、“significant”(有意)は必ずしも“important”(重要)という意味ではない
  • 確率値は逆に読まれるべきである
  • あまりにも多くの有意差検定によって、誤った有意関係が生じる
  • バイアスを避けるためにはサンプリングの手順をチェックすることが大切である

効果量は2グループ間の量を決める方法である。効果量では2グループ間の違いを説明するために標準偏差を用いる。

信頼区間とは、あるものがどこに存在すると予測されるかという範囲である。

    もし適切に用いられなければ、統計的な情報や評価データは無意味である。評価データの不適切な使用は4つの主な問題につながる
  1. あまりにも多くの組織が評価データを全く使わない
  2. データが適切なグループに提供されない
  3. データが改善を推進するために使われない
  4. データが誤った理由で使われる

 大学のときの統計の時間は、禅問答をやっているみたいでちんぷんかんぷんだったけど、今はその重要性がそこはかとなく伝わってくる。「そこはかとなく」じゃなくて、「ちゃんと理解しろ!」って言われちゃいそうだけど、今の時点では、そのくらいで許してほしいな。

 それにしても、最後の「適切に用いられなければ、統計的な情報や評価データは無意味である」というのはなんだかショッキング。いつもは結果だけ聞いていたけど、後で、永塚さんがどんな分析をしているのか、ちゃんと教えてもらおう。