Sharpe (2015) "Your Chi-Square Test is Statistically Significant: Now What?"

 

Sharpe, Donald. 2015. "Your Chi-Square Test is Statistically Significant: Now What?" Practical Assessment, Research & Evaluation 20(8): 1-10.

 

 カテゴリカル変数における独立性のカイ二乗検定が有意になった際に、さらに何をなすべきかに関して、(1)残差の計算、(2)個別セル間の比率の比較、(3)部分オッズ比の検定(ransacking)、(4)部分クロス表の分析(partitioning)という4つの方法が検討されています。

 

 いくつか大事そうなところを書き留めておきます。

  • 標準化残差と調整済み標準化残差の違い→標準化残差は{(観測度数)-(期待度数)}を、期待度数の二乗根、すなわち推定される残差の標準偏差で割るのに対して、調整済み残差の場合は残差の「標準誤差」で割る。
  • 特定のセルの比率どうし( p_i, p_j)を比較する場合は、 z= \frac{p_i -  p_j}{\sqrt{SE^2_{p_i}+SE^2_{p_j}}}を、対応する自由度におけるカイ二乗分布閾値の二乗根に対して検定する。
  • 部分オッズ比の検定は、対数オッズ比の標準誤差が SE={(1/f_{11}+1/f_{12}+1/f_{21}+1/f_{22})}^{1/2}で計算できることを利用する。
  • 部分クロス表は適切に分割した場合に、それぞれの尤度比カイ二乗値の合計が、全体クロス表におけるそれに一致する。ただし、Pearsonのカイ二乗値ではこれは当てはまらない。