Western and Jackman (1994) "Bayesian Inference for Comparative Research"

Western, Bruce and Simon Jackman. 1994. "Bayesian Inference for Comparative Research." American Political Science Review 88: 412-23.

 

 ベイジアンの考え方を提示する前に言うならば、めったに出くわさないような非常に極端な事例(完全または完全に近い線形的な依存関係)を除けば、共線性は統計的な困難はもたらさない。最小二乗推定量の性質は維持され、統計的な推論は通常と同じく進めることが可能である。それならばなぜ、共線性は問題だと見なされるのだろうか。共線性に伴う困難―過大な標準誤差や回帰係数の予期しない符号―は、係数の符号や分散についての事前の期待(Leamer 1978, 170)から見た際にのみ、問題となるのである。つまりLeamerが述べるように、共線性とは統計的な問題ではなく、多次元的な証拠の解釈の問題なのである(pp. 170-73)。解釈の道具としては、共線性が存在する際には、ある係数と別の係数の情報を最小二乗推定量から区別することはできない。代わりに、最小二乗推定量は係数間の線形結合についての情報をもたらす。サンプル外の情報を用いると、主観的な基準に基づいてサンプルの情報を係数間に割り当てることが可能になる。
[中略]
 まとめれば、比較研究における小規模なデータや共線性がもたらす不十分な証拠は、モデルの特定化にきわめて左右されやすい、不十分で脆弱な推論をもたらす。これは不十分な証拠にもとづいた分析にともなう、自然な結果である。この問題に対する唯一の対処方法は、より多くの情報を導入することである。しかし現実的な問題として、より多くの情報が利用できることは多くはない。データはサンプルに含まれているすべての国からすでに集められている。近年注目を集めている、プーリング時系列国家間分析は、不十分なデータの問題に対する一つの改善法である(e.g., Alvarez, Lange, and Garett 1991; Beck et al. 1993; Radcliff 1992; Swank 1992)。しかし、対象となっているプロセスは時系列のばらつきよりも、国家間のばらつきがはるかに大きいので(e.g., Wallerstein 1989, 482)、時点を追加することが新たな情報をもたらすことは多くはない。たとえば制度は、時点による変化が大きくないものの、国家間では相当のばらつきがある。くわえて、共線性の問題は小規模サンプルの問題とは区別されるものであり、観察数にかかわらずプールされた国家間デザインの分析を困難にさせるものである。しかしながら、追加的な量的情報は通常は手に入らない一方で、比較研究・歴史研究における大規模で実質的に豊富な質的な情報はしばしば存在するものの、分析に適した形では手に入りにくい。ベイジアンの手続きは、比較研究における不十分な量的情報を、質的情報とプールし、より鋭敏な回帰係数を得ようとするものである。

[pp. 414-5]

 FisherとEfronによるこれらの[ベイジアンに批判的な]コメントは、「公正なデータ分析」、つまり事前の情報を用いないデータ分析が可能であるという考え方に立っている。しかしながら現実的には、コーディングの意思決定、変換、有意味な結果として期待される範囲に収まるという意味で、理にかなったように見える結果を得るための説明変数の探索を通じて、ほとんどの分析において事前の情報が入り込んでいる。すべてのデータ分析者は事前の信念を用いているものの、ベイジアンはこれらの事前情報をいくらか明確にして、分析において体系的に統合しているのである。その結果、ベイジアンのアプローチでは、主観性が客観性に通じるものだと認識されている(deFinetti 1974, 1:5-6)。 

[p. 419]