宮川雅巳『統計的因果推論――回帰分析の新しい枠組み』6章

 【定理6.4】バックドア基準を満たす共変量の選択基準

 因果ダイアグラム Gにおいて, Xへの矢線をもち,かつ途中に合流点のない X Yの道の途中に Z_{1} Z_{2}があり,それぞれ (X,Y)についてバックドア基準を満たすとする.このとき Z_{2} X Z_{1}を有向分離するならば, Xから Yへの総合効果の最小2乗推定量において

 Var(\hat{\beta}_{yx \cdot z_{1}})\leq Var(\hat{\beta}_{yx \cdot z_{2}}) かつ  Var(\hat{\beta}_{yx \cdot z_{1}})\leq Var(\hat{\beta}_{yx \cdot z_{1}z_{2}}) (6.23)

が成り立つ.さらに, \sigma_{yy \cdot xz_{2}}/(n-4)\geq \sigma_{yy \cdot xz_{1}z_{2}}/(n-5)であれば

 Var(\hat{\beta}_{yx \cdot z_{1}z_{2}})\leq Var(\hat{\beta}_{yx \cdot z_{2}}) (6.24)

が成り立つ. n \to \inftyでは,(6.24)式は常に成り立つ.

  回帰分析や傾向スコア分析における共変量選択は悩ましい問題ですが,1つの指針を与える定理です.要は,(1)処理変数とは関連し,目的変数とは関連しない変数,(2)処理変数とは関連せず,目的変数とは関連する変数の2つがあり,どちらも交絡を取り除けるのであれば,(2)を統制した方が,推定量の分散が小さいということです.前に読んだ論文では,Brookhart et al.(2006)がシミュレーションでこれが成り立っていることを示していました.