ノート
スライド ショー
アウトライン
1
STATISTICAL POWER ANALYSIS (Murphy, K.R & Myors, B. 2004)より 第2章 pp.33~43

  •  2004/06/23
  • M1 溝口るい
2
伝統的な帰無仮説の代わり
  • 伝統的な帰無仮説=“処理の効果はゼロ”
  •    →批判が増えてきている
  • まったく効果のない処理はそうそうない。 そもそも偽である帰無仮説を検定することは、必ずしも意味があるとはいえない。
  • 伝統的な帰無仮説の検定の結果は間違って解釈されている(検定の結果は研究された現象についてよりも、その研究の検定力について多くを語っている)
3
伝統的な帰無仮説はほとんどの場合間違っている

  • 伝統的な帰無仮説
  •   ≒物理学における「摩擦のない平面」
  •  (実際には存在しないが、単純にするために小さな効果を0と考える)
  • そのような現象は現実にはありえない
  • →伝統的な帰無仮説はほとんど常に偽
4
伝統的な帰無仮説はほとんどの場合間違っている(2)
  • 伝統的な帰無仮説はほぼ常に偽
  • ・・・第1種・第2種の誤りを考えるときに重要
  • →帰無仮説が常に偽なら第1種の誤りは起こらない。考えるべきなのは第2種の誤り(効果はあるのにないという確率)だけということに。
  • 第1種の誤りをコントロールするよりも検定力(効果があるときにあるという確率)に注意すべき。
5
2.検定の結果の間違った解釈
  • 伝統的帰無仮説の検定は直接的にその処理の効果サイズや重要度を評価するものではない
  • 対象となっている事象についてよりもその研究の感度についてのべている
  • ・・・真の効果量にかかわらず、サンプル数が少ないときは帰無仮説が棄却されることは少なく、サンプル数が多いと多い
  •  サンプル数についてよりも、対象となっている事象について述べるような検定法が必要
6
伝統的な帰無仮説の代わり
・・・最小効果検定
  • 根本的な改革よりは、伝統的帰無仮説を用いた仮説検定の過程を手直しする方が妥当。
  • →伝統的な帰無仮説のもとでの分布を(非ゼロの効果サイズの要素として)ちょっとシフトさせる最小効果検定を提案。
  •  (普通の)帰無仮説が正しいときの分布であるF分布を使うかわりに、Noncentral F分布(非心F分布)を用いる 。


7
"伝統的な帰無仮説では感度..."
  • 伝統的な帰無仮説では感度が十分に高ければ検定力は1.00(そもそも常に帰無仮説は偽だから、感度が十分ならば常に対立仮説“処理の効果はある”が採択される。)
  • つまり、検定して有意になっても・・・
  •  感度が十分に高かったから有意になっただけかも。その効果のサイズや重要度はどのくらいかはわからない。


8
最小効果検定
  • H₀ =処理の効果はない
  •  ではなく
  •  H₀ =処理の効果が無視できるほど小さい
  •  を検定する
  • →感度が十分に高くても検定力は1.00以下。
  • →検定をすることによってその効果が無視できるほど小さいか否かがわかる


9
最小効果検定と従来の検定
  • H₀ =処理の効果は無視できるほど小さい・・・仮説自体実際的な関心に基づく疑問を含む。検定力が十分なのにこのH₀を棄却できなかった場合には、効果が無視できるということの証拠とみなせる
  • H₀ =処理の効果はない・・・あらかじめ偽であることがわかっており、検定の結果がどうであってもH₀について新しいことは何もわからない
10
最小効果検定の方法
  • ■従来の検定と比較してみましょう
  •  伝統的な帰無仮説の検定(F検定)・・・得られたF値を(各有意確率での)Fの臨界値の表と比較する
  • 仮説“処理の効果はない”
  • 自由度2,100のときのFの臨界値
  •   α=.05 のとき 3.09
  •   α=.01 のとき 4.82
  •   F値がこれらの臨界値を超えるとき、帰無仮説は棄却され、処理に何らかの効果があったといえる
11
最小効果検定の方法
  • 最小効果検定・・・得られたF値を非心F分布に基づくFの臨界値と比較する
  • “結果の分散の1%以下しか説明しない(PV=.01以下)処理には、無視してよい効果しかない”とする
  •  →PV=.01に基づいて非心パラメータを推定し、対応する非心F分布を求める
  • 仮説“処理の効果は無視できる程度”
  • PV=.01,自由度2,100のときのFの臨界値
  •    α=.05 のとき 4.49
  •   α=.01 のとき 6.76
  •  F値がこれらの臨界値を超えるとき、“処理の効果は無視できる程度”という仮説は棄却される
12
例
  • 125人の被験者を5つの処理にランダムに割り当て
  •   F(4, 120)= 2.50, p<.05
  • Q. α=.05で有意だが、この処理の真の効果は無視できるほど小さいのではないか?
  •  “母集団の分散の1%以下しか説明しない処理の効果は、無視してよい効果である”とする
  •  “真の処理の効果は無視してよいほど小さい”という仮説を検定
  •   自由度 4,120 λ=1.21(←計算方法は既出)の非心F分布のFの臨界値
  •    α=.05 のとき 3.13
  •  F=2.50なので、帰無仮説は棄却されない
13
最小効果を定義する

  • ある効果が無視できるほど小さいか、そうでないかを決定する基準がいる
  • ある学問分野では無視できるサイズの効果でも、違う分野では重要な効果となりうる
14
最小効果を定義する
  • ある効果の重要性は、特定の従属変数が含まれているかによる。
  •  ex. 医学研究・・・従属変数が“生存率”や  “QOL(生活の質:quality of life)”を含むので、比較的小さい効果でも重要
  • どのような効果が“無視してよい”とみなされるかは、ある領域において第1種・第2種の誤りがおこる相対的な見込みと重要度による
15
第1種・第2種の誤りがおこる     相対的な重要度
  • “無視してよい効果”の定義が大きくなるにつれて検定力は小さくなる。(PV=0,1%,5%で検定力を比較すると 0 > 1% > 5%)
  • 第2種の誤りはある研究領域では非常に重大な誤りになる。
  •  →第2種の誤りをおかさないようにする     =検定力を高くする
  •  →“無視してよい”効果の定義に非常に低い   値を選択する
16
第1種・第2種の誤りがおこる     相対的な見込み
  • すでに効果のある処理が確認されている分野ではより要求の厳しい仮説の検定に意味がある
  • 例;認知能力のテストの分野(判断基準はパフォーマンスの測定値)で、テストが基準の20~25%の分散を説明することがわかっている(=効果量が大きい)
    • 伝統的な帰無仮説や“テストはこれらの基準の1%以下しか説明しない”という仮説は高い確率で棄却される
  • → “基準の10% 以下を説明するテストの効果は無  視してよい効果”とする定義が意味を持つ
17
最小効果を定義する;まとめ
  • 用いた例では
  •  分散の1% 以下を説明する処理は小さい効果
  •  5% 以下を説明する処理は小~中程度の効果
  •  という慣習によっている
  • が、分野によってはこの慣習が適用できないこともある
  • 研究者は特定の値を最小効果の定義として選択した理由について、注意深くならなくてはいけない
18
最小効果検定の検定力
  • 検定力は
  •  仮説“効果はある最小の値を超える” の検定の方が、仮説“効果はゼロ” の検定よりも小さい
  • ふつうのF分布から、帰無仮説に基づいた非心分布へ変換すると、有意になる臨界値が高くなるので臨界値を越すH₁の分布の割合もへる。
19
検定力分析の手法
  • 検定力分析を行うためのいくつかの方法
    • ある特定の事例における検定力を計算する
    • ある範囲の条件における、統計的な検定力に近似するグラフや表をつくる
    •  ・・・グラフで検定力を従属変数としてプロットするためにはN、α、効果サイズの3つの変数が必要なのでややこしい。表のほうがいい。
20
計算
  • 非心F分布の計算や近似値を使った検定力分析を紹介したが、これはF統計量に換算できる検定ならなんにでも適用できる手法。
  • F分布の表と計算機があればよい(表はα=.05 や.01での臨界値だけを示したものではダメ)
  • 付録A・・・非心F分布で臨界値を求める手法
  • (正確で柔軟だが)相対的に扱いにくくて時間を食う
    • 統計的・実際的な基準の(無視していい効果の最小値とか)の決定
    • 決定得られる非心F分布を推定
    • 基準値をこえる分布の割合を決定 などの処理が必要
21
表

  • J. Cohen (1998) が今手に入るものでもっとも完全なものかも


  • 付表のB ”One-Stop F table”参照
  •  (上のよりは簡潔)