読者です 読者をやめる 読者になる 読者になる

Holm and Jæger (2011) "Dealing with Selection Bias in Educational Transition Models: The Bivariate Probit Selection Model"

論文

Holm, Anders and Mads Meier Jæger. 2011. "Dealing with Selection Bias in Educational Transition Models: The Bivariate Probit Selection Model." Research in Social Stratification and Mobility 29: 311-22. 

  • Mareによる教育の移行モデルは、異なる教育段階における観察されない変数間の相関が大きいほど、独立変数の係数にバイアスがかかる(シミュレーションでも示される)。
  • この論文では、bivariate probit selection model(BPSM)によって、セレクション・バイアスに対処する。
  • BPSMは、用いるの自体は楽である(例えば、Stataであればheckprobコマンドとして搭載されている)。しかし、パラメトリックな仮定および、それぞれの移行確率に対して、外生的なばらつきを与える「操作変数」が必要である点が、考えられる欠点である。
  • BPSMでは、異なる移行段階における観察されない要因どうしの相関パラメータを推定する。二変量ロジスティック分布というものはないので、ロジットではなくプロビットによる特定化でなければならない。
  • 観察されない変数によるセレクションにくわえ、誤差項のscalingの問題がある。第一段階の移行にくらべ、第二段階の移行におけるサンプルでは、誤差項の分散が小さくなる。そして、プロビットモデルでは、誤差項の分散を1に正規化するため、第二段階の移行における回帰係数には上方バイアスがかかる。BPSMはscalingの効果については対処できない。
  • BPSMがセレクションの効果を、独立変数による真の効果かから分離するためには、セレクションの式における関数形が正しく特定化されている必要がある。これは簡単な条件ではないものの、それぞれの移行段階において外生的な分散を与える「操作変数」を追加することが、改善法としてある。これにより、真の効果とは独立して、セレクションの効果がばらつくようにするのである。

 感想

  • Cameron and Heckman(1998)の批判以来、大きな問題があるとして認識されてきているテーマです。真の効果、セレクションの効果、scalingの効果をそれぞれ分解して考えるという操作が興味深かったです。