Stegmueller (2013) "How Many Countries for Multilevel Modeling? A Comparison of Frequentist and Bayesian Approaches"

Stegmueller, Daniel. 2013. "How Many Countries for Multilevel Modeling? A Comparison of Frequentist and Bayesian Approaches." American Journal of Political Science 57:748-61.

  マルチレベルモデルにおけるレベル2のサンプルサイズはどの程度であればよいのかについて、議論を行っている論文です。比較政治学の論文に見られるように、異なる国々が含まれるデータを用いて、個人が国にネストされているとみなしてマルチレベルモデルを適用することがしばしば行われます。しかし、データの制約上、通常こうした分析で含められる国の数は多くなく、最尤推定を行った場合の漸近的不偏性が成り立つのかどうかが疑われます。
 どの程度の国の数が必要なのかということについて、これまでの研究は8や10あればよいという意見もあれば、30、50、さらには100必要だというものもあり、混乱しているとのことです。本論文では、シミュレーションによって最尤推定およびベイズ推定の精度が検証されます。
 具体的には、1つの国には500人の個人がおり、国の数を5から30まで、5つ刻みで増加させています(6つの条件)。また、級内相関について、0.05、0.10、0.15という3つの条件が考えられます。さらに、最尤推定と2つの異なる事前分布を用いたギブスサンプリングによってベイズ推定されます。また、ベイズ推定については、最頻値、中央値、期待値という3つの値が使用されています。また、従属変数は連続的なものと二値のものが想定され、二値のものはプロビットモデルが当てはめられます。データの発生回数は1000回となっています。
 シミュレーションの結果、国の数が少なくても個人レベルの推定値はほとんどバイアスがかからないことが明らかになっています。しかし、レベル2の推定値、およびクロスレベルの推定値については、国の数が5または10しかない時には、最尤推定値は10~15%のバイアスがかかるということが示されています。線形モデルは下方に、プロビットモデルは上方にバイアスがかかるという違いが現れています。これに対して、ベイズ推定の結果は、国の数が少ない時にもかなり頑健になっています。ただし、著者はレベル2のサンプルサイズが小さい時には、異なる事前分布を用いて、頑健性を確認すべきだとすすめています。
 推定面でのベイズの優位性だけではなく、著者は結果の解釈という面にもふれています。頻度主義的なアプローチをとった際に、国レベルの効果が「有意」であるとは、いったい何を意味しているのか、と著者は問います。通常は異なる国々が含まれるデータは、国をランダムに選んだものではないので、母集団に対する推論を行うことへの疑念が投げかけられているわけです。一方、ベイズ推定では、仮想的な標本分布を想定することなく、信用区間(credible interval)が求められます。すなわち、係数がある区間の中に含まれる確率として単純に解釈できるのでより望ましいとしています。