Watson(2014)「継続中の縦断サンプルを追加サンプルと統合する上でのウェイト付け方法の評価」

 

Watson, Nicole. 2014. "Evaluation of Weighting Methods to Integrate a Top-up Sample with an Ongoing Longitudinal Sample." Survey Research Methods 8(3): 195-208.

 

  • パネルデータにおいてtop-upサンプルないしはrefreshサンプルが追加された際に、元サンプルと統合するためのウェイトをどのように作成するか
  • 2つの方法がある:(1)推定値の統合(combining estimates)、(2)サンプルをプールする(pooling samples)
  • (1)では2つのサンプルからの推定値のウェイト付き平均を使用する
  • ウェイトの値はそれぞれのサンプルの大きさと、それぞれのサンプルのデザイン効果に依存する
  • デザイン効果とは、単純ランダムサンプル(replacementを行わない)の分散に対する、実際のサンプルの分散の比率である
  • 2つのサンプルのデザイン効果を同じとみなすことも可能であるが、これが妥当であるという保証はない;というのも、元サンプルは時間経過による脱落を経験しているためである
  • 他にはデザイン効果をウェイトの変動係数から推定する方法などもある
  • (2)は、ある個人が2つのサンプルのどちらかに属して回答する確率を推定し、その逆確率を用いる方法である
  • しかし、ある個人に関してサンプルAとサンプルBのそれぞれに属する確率はわからないので、何らかの形で推定する必要がある
  • ここでは回答確率をロジット変換し、これをいくつかの共変量に回帰させる;そして、それぞれのモデルをサンプル外予測に用いる(サンプルAに属する人々がサンプルBにおいて回答する確率と、サンプルBに属する人々がサンプルAにおいて回答する確率を推定する)
  • (1)推定値を統合する方法と、(2)サンプルをプールする方法に関して、ベンチマーク統計と比較した際のバイアスと、平均平方誤差に基づいてパフォーマンスを評価した
  • おおむね、(2)のサンプルをプールする方法のパフォーマンスがよい
  • サンプルをプールする方法では、top-upサンプルにおける個人で、もし元サンプルに属していた場合に回答しにくい個人は、高いウェイトを与えられることになる;これは元サンプルの脱落効果をtop-upサンプルが弱めることを可能にする
  • これに対して推定値を統合する方法では、それぞれのサンプルに同様の重要性を与えるために、ウェイトの変動係数が大きくなる傾向にある