2022年3月

f:id:state0610:20220331193541p:plain

 

  • 3月は約178km走りました。家の近くの公園内を走っていますが、最近は梅の花がきれいに咲いています。
  • ここしばらく花粉症が辛いです。ランニング中でも日常生活でも、うまく呼吸ができません。今年は明らかに昨年より症状がひどく、薬を飲んでも抑えきれていません。自分のこれまでの人生でも上位のひどさに入るかもしれません。今年は舌下免疫療法を試すことを検討しています。
  • ストレスのせいか一時期62kgまで体重が増えていました。過去に60kgを超えたことがほぼなかったはずなので、結構な衝撃でした。20代の頃であれば少し食事を減らせばすぐに体重が戻っていたのですが、それが効きづらくなってきていることにも加齢を感じます。
  • 毎日走っているとさすがに体重が落ちてきて、58kg台まで戻りました。もう1kgくらいは絞りたいところです。

Simons et al.(2017)「一般化の制約(COG)」

Simons, Daniel J., Yuichi Shoda, and D. Stephen Lindsay. 2017. "Constraints on Generality: A Proposed Addition to All Empirical Papers." Perspectives on Psychological Science 12(6): 1123-28.

 

前に読んだ論文で引用されていたので、その関連で。

 

  • 提案:実証研究を扱うすべての論文は考察の節に、「一般化の制約」(Constraints of Generality: COG)について述べ、示した知見が対象とする母集団を明確に特定し正当化するべきである。

 

  • 実証的な論文の方法の節ではすでに用いるサンプルと手続きについては述べられているが、これらはCOGとして述べる内容とは異なる。方法の節で述べられるのは手元にある(proximal)集団、すなわち研究で差し当たって用いられるサンプルである。COGは意図する母集団と、サンプルに代表性があると考える根拠を特定するものである。

 

  • 現在の出版モデルでは、著者は可能な限りもっとも強い一般化を行うことにインセンティヴがある。ではなぜ著者は自らの主張に制約をくわえるべきなのか。
  • 第一に、複製(replication)の問題が強調されるようになってきたことなどで、一般化可能性を誇張した論文を出版することによる評判へのダメージはより大きくなっている。
  • 第二に、COGを述べることで他の研究者が自分の知見を複製できる可能性が増す。つまり、自分の研究で想定した母集団から正確にサンプリングを行うことができる。また、自らの結果の不確実性について付記しておくことで、他の研究者は主張のうちどれが暫定的なものであるかを認識できる。
  • 第三に、COGを述べることで、自らの研究では検証しなかった別の集団における一般化可能性を検証するような追跡研究を動機づけるかもしれない。

 

  • COGの記述は、直接の複製が可能であるためには参加者、資料、手続きのどの側面が維持されなければならないかを明らかにするものである。COGのとしての述べるものは包括的なリストにはなりえないが、以下の原則を提案する。
    • (1)常識に基づいてすべての読者に明らかであるものを除き(たとえば聴覚弁別の研究において聴力を境界条件として特定する必要はないだろう)、既知の実証的・理論的な境界条件を含めるべきである。
    • (2)その研究に実質的に結びついている境界条件については、たとえそれらによる制約が直接的な実証的・理論的な支持を欠いているとしても述べるべきである。たとえば、選挙の直前に実施された政党所属に関する研究は、結果がその時の政治情勢に左右されるかもしれないことを述べるべきである。
    • (3)ある分野において専門家が重要だと考えうる(既知・未知の)要因は、たとえそれらが一般化可能性を制約することが検証されていなかったとしても、言及すべきである。たとえば、言語におけるジェンダー・マーカーを操作する研究は、ジェンダー・マーカーのない言語の話者に対しては結果を一般化できないと予想するのは理に適っているだろう。たとえ同様の概念的問いがそうした言語において有意義であったとしてもである。
    • (4)その他の要因はリストアップする必要はない。COGの既知のあるいは予想される知見の限界を記述するものであり、「未知の未知」(unknown unknowns)による媒介を記述するものではないことを明確にするために、以下の19語の決まり文句を含めることを勧める。「結果が参加者、資料、または文脈の他の特徴に依存すると考える根拠はない」(We have no reason to believe that the results depend on other characteristics of the participants, materials, or context.)。
  • 対象とする母集団と制約を特定する際に、COGの記述はこれらの原則と、また自らの研究の以下の側面を考慮すべきである。
    • 参加者:手元の参加者のサンプルが、より広い対象とした母集団を代表しているかどうかを議論する。
    • 資料/刺激:自らの知見が一般化されるべき資料/刺激の集合を定義する。
    • 手続き:観察された効果を密接に再現するためには、自ら実施した手続きのどの面を守らなければいけないか。どのようなより広い手続きの集合が同様の結果を生み出すか。
    • 歴史的・時間的な特異性:観察された効果は時間によって変化する文化的規範に依存するか。

Stinchcombe(1997)「旧制度学派の美徳について」

Stinchcombe, Arthur L. 1997. "On the Virtues of the Old Institutionalism." Annual Review of Sociology 23: 1-18.

 

  • 研究会で読んだ文献との関連で読み直しました。院生時代から何度か読んでいる論文ですが、ようやく少し分かった気がします。
  • Stinchcombeで思い出すのは、K先生が「大学院時代に一番すごい先生だと思った。(James)Rosenbaumよりもすごかった」と仰っていたことがありました。

 

  • Oliver Williamsonに代表される新制度学派(new institutionalism)は、競争の概念を単なる組織間の関係性に単純化してしまっており、競争が起きる市場というものがなぜ正当性を有しているのかを問わない。これに対してCoase、Commons、Schmpeterなどの旧制度学派では競争や契約が正当性を持つ過程により自覚的であった。
  • 取引契約の道徳的なコミットメントという側面は、市場における組織の存在可能性にとって中心的なものである。
  • 現代の制度論を戯画的に表せば、集合表象がそれ自身を不透明な過程で作り出し、普及(diffusion)によって実装され、人間が存在せずに外的に拘束するものという意味で、Durkheim的である。
  • 旧制度学派の論者は、制度が常にそこに存在し、常に働くとは想定しなかった。
  • Schumpeterは経済成長は革新者、すなわち他の企業を模倣せず、しかし既存の事業に対して正当に損害を与えられる企業に依存することを説得的に議論した。
  • 新制度学派の問題点は、制度の中にもっとも重要な部分(guts)がないことである。制度のもっとも重要な部分とは、どこかで組織の基準を保つことに真剣な関心を持ち、またそのためにしばしば報酬を与えられる人間である。

 

Kennedy and Gelman(2021)「自らの母集団とモデルを知れ」

Kennedy, Lauren, and Andrew Gelman. 2021. "Know Your Population and Know Your Model: Using Model-Based Regression and Poststratification to Generalize Findings Beyond the Observed Sample." Psychological Methods 26(5): 547-558.

 

  • 心理学実験では大学生など有意抽出(非確率サンプル)の利用が多く、伝統的なデザインベースのウェイトを作成するのが難しい
  • マルチレベル回帰分析と事後層化(multilevel regression and poststratification: MRP)の有意抽出サンプルへの適用
    • 小区域推定(small area estimation)と無回答の補正に関する2つの研究分野を組み合わせた方法
    • 政治学の分野ではすでに多くの適用事例がある
  • 心理学ではランダム化実験の方法が用いられるが、人口学的特性との交互作用が存在する場合には、母集団を考えることなしには平均処置効果を解釈することができない

 

  • MRPの手続き
    • (1)調査を実施する際に重要な人口学的特性を測定する
    • (2)事後層化表の識別:考慮する人口学的特性の可能な組み合わせに関して、母集団における度数を推定する
    • (3)サンプルにおいて(母集団において推定したい)重要な統計量を測定する
    • (4)サンプルにおいて観察された人口学的特性を考慮し、マルチレベルモデルによる予測によって、関心のある統計量の母集団における値を推定する
    • (5)事後層化表のそれぞれのセルにおける従属変数の値を推定する
    • (6)母集団レベルの推定値を得るために、事後層化表のセルをそれぞれの大きさに基づいて集計する

 

  • MRPはサンプルの代表性がなく、かつ人口学的特性が交互作用を持つと考えられるときに有効である
    • この条件にあう事例であったとしても、サンプルが実際に異質性を持たない場合には十分ではない→処置効果が若年者と高齢者で異なると予想されるときに、サンプルが学部生である場合
  • MRPを適用するにはさらに、マルチレベルモデルをあてはめるために十分なデータである必要がある
    • 一般的なことを言うのは難しいが、個人間デザインのサンプルにおいて50人の個人しか含まれない場合には、MRPの推定値は不安定であるか、推論が事前分布に強く依存することになるだろう

 

  • MRPを適用するにあたり、どのような共変量を考慮すべきか
    • Simons et al.(2017)は一般化の制約(constraints of generality: COG)をすべての実証研究は明確に述べるべきと主張しており、これが予想される効果の異質性や統制する変数の参考になりうる

ウィリアム・プーレン(2017=2018)『心を整えるランニング』

 

 

  • 昨日の地震はかなり揺れました。体感としては昨年2月の地震以上でした。
  • 地下鉄が動いていなかったので、今日の朝はレンタサイクルで出勤しました。自転車にはめっきり乗らなくなりましたが、高校時代は自転車通学だったので懐かしい気持ちになります。
  • 職場では前に地震対策をするように指導されていて、落下抑制テープというのを本棚に貼っているので、ほとんど被害はありませんでした。自宅では電気ケトルが落下して蓋が閉まらなくなってしまいましたが。

 

  • 最近は花粉症で毎日しんどいのですが、ランニングは毎朝続けています。本書は「マインドフル・ランニング」というものを提唱しており、読む前からだいたい中身は想像はついたのですが、モチベーションを高めるために買ってみました。
  • 原題は、Run for Your Lifeとのことで、訳題の方が内容をより直接表しているでしょうか。
  • 以前は音楽を聴きながらでないとランニングが辛かったのですが、最近はそうでもなくなってきました。本書の言葉を使えば、「『今、ここ』に意識を集中する」力が前よりもついたのかもしれません。ランニング中はハイになって何でもできそうな気分になることもある一方で、ひどくネガティヴな思考が浮かぶこともあるので、そういったことに向き合えるようになってきているとも言えるでしょうか。

Elbers(2021)「異なる時点や場所による分離の差を検討するための方法」

Elbers, Benjamin. 2021. "A Method for Studying Differences in Segregation Across Time and Space." Sociological Methods & Research.  doi: 0049124121986204.

 

  • 分離の強さの変化を周辺分布の変化によるものと、「純粋な分離」の変化によるものに区別できることが望ましい。
  • 分離指数が周辺分布に依存することは、1つの時点における分離の「平均的な」水準を特徴づけるためには望ましいが、異なる時点や場所による分離の水準を比較する上では問題となる。

 

  • 合計Uのorganizational unitsと、合計Gのgroup unitsがあるとき、U×Gのクロス表を考える。
  • UとGのどちらの周辺分布にも依存しないのは、A指数のみ。H指数が周辺分布と独立でないことは必ずしも十分に理解されていない。

 

  • 周辺分布とは独立した構造的な分離の原因を検討する方法として、主な解決策は3つある。
    • (1)Charles and GruskyによるA指数を用いるアプローチ。A指数はそれぞれの職業における男女のオッズ比を計算し、それぞれの職業を等価に重みづけて集計する。そのため、それぞれの職業の規模が大きく異なる場合は問題となりうる。また、同等の分離の水準を持つ2つの職業が統合された際には分離は変化すべきではないという、organizational equivalenceの基準をA指数は満たさない。
    • (2)Karmel and Maclachlan(1988)による本論文に類似したアプローチ。周辺分布の変化と構造的変化のそれぞれどちらかのみを反映した反実仮想的なクロス表を用いる。これはiterative proportional weightingによって作成できる。この方法の欠点として、行と列方向の交互作用が分解に含まれることと、新規に出現あるいは消滅する職業を考慮できない。
    • (3)Mora and Ruiz-Castillo(2009)によるアプローチ。2つの時点におけるM指数を分解する。ただし、この方法で定義される「構成不変」(composition-invariant)な変化とは、オッズ比に基づいて定義される構造的変化とは異なる。また、この方法では2つの分解法があり、それぞれで構造的変化の大きさが異なりうる。
  • 本論文では、(1)~(3)の方法を拡張・統合する。Charles and Gruskyはいかなる構造的変化もオッズ比に反映されるべきだとする重要な洞察をもたらした。Karmel and MaclachlanはIPFを用いて反実仮想的なクロス表に到達した。Mora and Ruiz-Castillo(2009)はエントロピーに基づいたM指数の強みを明らかにした。

 

  • 基本的なアイディアは、t1のクロス表を周辺分布のみt2と一致するように調整した反実仮想的なクロス表を作るというものである。
  • IPFによる周辺分布の調整は必ず収束する。
  • 反実仮想的なクロス表からM指数を分解したときに、1つのありうる批判はt1を基準とするかt2を基準とするかで結果が微妙に異なることである。これは分解の方法論の中では経路依存性の問題として知られる。この解決法としては、 Shorrocks (2013)によって提案されたShapley分解、すなわちありうるすべての分解のパターンを考慮するというものがある。2時点における分離の差の場合は、単に2つのシナリオの平均値をとるというものになる。

 

  • 2時点間での特定の職業の創造や消滅を考慮するためには、M指数がbetweenとwithinに分解できることを利用する。すなわち、「残存職業・消滅職業間の分離」と、「残存職業内の分離」および「消滅職業内の分離」の加重平均に分解して考える。

 

  • 分離指数に向けられる懸念の1つとして、比率の小さいセルに基づいて計算されることがある。Winship(1977)は非類似指数Dの期待値が大きくばらつくことを示した。これと同様の設定を置いたときに、M指数とH指数はばらつきが小さい。比率の小さいセルでは、ln(p_gu/p_g*p_u)の値は大きくなるものの、加重平均を取る際にp_guを乗じることでその影響が緩和されるためである。

伊藤亜聖(2020)『デジタル化する新興国――先進国を超えるか、監視社会の到来か』

 

  • 以前の職場でお世話になったことがある先生の著作です。中国経済がご専門の先生ですが、本書では中国を含む新興国に一般化可能なデジタル化の影響があるとみなし、「デジタル技術による社会変革は、新興国・途上国の可能性と脆弱性をそれぞれ増幅する」と主張されます。
  • 新興国論」という分野はあまり馴染みがなかったのですが、扱われている話題はどれもニュースでしばしば聞いたことがあり、イメージはしやすかったです。図表に何度か用いられていた、世界銀行の「世界開発指標」は面白そうなデータだと思いました。
  • 脆弱性」として取り上げられている権威主義国家におけるデジタル化の話は、目下のロシアによるウクライナ侵攻にも大きく関係してくる論点と言えそうです。