Paul D. Allison "Missing Data"

Missing Data (Quantitative Applications in the Social Sciences)

Missing Data (Quantitative Applications in the Social Sciences)

欠損値をどう扱うかという内容。

初めに欠損値に対する仮定の類型が示され、次にconventionalな方法の中ではlistwise deletionが最も推定値のバイアスをもたらさないことが示され、そしてMaximum LikelihoodとMultiple Imputationによる欠損値の補正方法が紹介される。


欠損値の仮定について、Completely Missing at RandomはYが欠損値となる確率がXの値ともYの値とも独立であること。Missing at Randomは、Yが欠損値となる確率がXの値とは独立ではないが、Yの値とは独立であること。Ignorableとは、Missing at Randomであり、かつ推定したいパラメーターと欠損値に影響するパラメーターが独立であること。Nonignorableとは、Missing at Randomではない、すなわちYが欠損値となる確率がYの値と独立ではないこと。


実例が紹介されているのは親切だが、SASのコマンドなので分からない。STATAとLEMのレベルをもっと挙げたら、HLMとRに進出したいが、SASはやる予定がない。