Elwert and Winship（2010）"Effect Heterogeneity and Bias in Main-Effects-Only Regression Models"

Elwert, Felix and Christopher Winship. 2010. "Effect Heterogeneity and Bias in Main-Effects-Only Regression Models." Rina Dechter et al. eds. Heuristics, Probability and Causality: A Tribute to Judea Pearl. College Publications. UK, 327-36.

　処置効果の異質性（treatment effect heterogeneity）が存在する際に、OLSが平均処置効果を復元しないという問題について、非巡回有向グラフ（DAG）の観点から掘り下げている論文です。

　Joshua Angristが指摘するように、OLSによる推定値は、処置確率の条件付き分散が最大となる層にもっとも大きなウェイトを置く（二値の処置変数であれば $P=0.5$ の時）という性質があります。このために、処置効果の異質性が存在する場合には、（ウェイトを置かない）平均処置効果に、OLS推定値は一致しないということが生じます。

　本論文では、次の図1のような変数関係を想定し、パラメータ $\alpha, \ \beta, \ \gamma$ が潜在的な2つのグループを表す $G$ によって異質であると仮定されます。

（Elwert and Winship 2010: 330）

　そして、シミュレーションの結果、たしかに異質性の組み合わせによっては、OLSの推定値は構造パラメータに一致しないことが確認されます。

　次に、この問題についてDAGの観点から理解することが試みられます。下の図3のように異質性をもたらす潜在的なグループ $G$ を、先ほどの図1に取り入れることが考えられます。

（Elwert and Winship 2010: 334）

　もし、 $\beta$ と $\gamma$ のどちらか（あるいは両方）に異質性が存在する場合には、 $G \to C$ の矢印がくわわり、 $\alpha$ に異質性が存在する場合には、 $G \to B$ の矢印がくわわります。

　そして、 $G \to C$ と $G \to B$ の両方の経路が存在する場合に、 $B$ は $A$ と $G$ の「合流点」（collider）になっています。この際に、 $G$ を条件付けない推定を行うことで、 $A \to B \to G \to C$ というバックドア経路を開いてしまうことになり、バイアスが生まれるという理解になります。すなわち、 $(\alpha,\beta)$ あるいは、 $(\alpha,\gamma)$ という組み合わせで異質性が存在する場合に、 $G$ が観察されない場合のOLS推定値は、平均処置効果に一致しないということです。

感想

・異質性の問題は社会科学では本質的であると考えられますが、にもかかわらずOLSが平均処置効果を推定しているという、しばしば行き渡っている誤解を指摘することの重要性を再確認しました。

・社会科学では変数間の関係がそれほど明らかではないので、DAGの有効性については未だに疑問はあります。しかし一方で、仮に「変数間の関係が明らかであった場合」という理想的な状況を想定することは、RQやモデルを構築してゆく際に役立つ部分もある気がします。そして本論文の事例は、シンプルながらも応用できる場面が多そうです。