医療統計学を学ぶ大学生のブログ

医療統計学、因果推論を専攻しています。R, SASユーザーです。

傾向スコアを用いたIPW(IPTW)法の概要

(2022年11月中に修正します)

 

先日は傾向スコアを用いたマッチングについての記事をまとめましたが、同じ傾向スコアを使う方法つながりとして、今回はIPW法についてまとめていこうと思います。

傾向スコアマッチングでは、マッチングという作業が入ってしまう分どうしても解析対象となるサンプルサイズが減少してしまうという問題がありました。これに対して後述するIPW法では、そのサイズが減らない、むしろ膨らませるという点で、変な話ですが医師の方などにはウケがいいなと個人的には感じています。

ただIPWについては詳しくは記事中でまとめますが、傾向スコアが極端に小さい値を持つ個人が推定に対して非常に大きな影響を与えてしまうといった問題もあるのでその点については注意が必要です。

傾向スコアの復習

IPWでは傾向スコアを用いた重み付けを行います。傾向スコア自体については以前のこの記事でまとめていますが再掲します。

norihirosuzuki.hatenablog.com

 

傾向スコア(PS; Propensity Score)とは、ある一連の共変量Xで条件付けた場合の条件付き確率です。(個人の確率というよりは、ある共変量Xの層の確率)

f:id:NorihiroSuzuki:20211013133959p:plain

このe(x)は共変量Xという情報が与えられたときの介入を受ける(A=1)傾向(Propensity)示しているスコアであるという理解ができ0~1の値をとります。0に近ければ介入を受ける確率が低く、1に近ければ介入を受ける確率が高いということです。もし仮にランダム化が行われる場合(1対1割り付け)には、すべての個人のその値は期待値としては0.5となります。

傾向スコアはバランシングスコアであり、因果推論の文脈でいうと、曝露とアウトカムの条件付き独立性(交換可能性)を仮定するのに用いられ、同じスコアの値を持つ集団では共変量の分布は等しい(バランスされる)という特徴を持っています。

傾向スコアの利用にあたっての注意点としては、傾向スコアの算出に用いた観察された共変量についてのみ両群でのバランスをとるため、もし未観測交絡が存在するためには推定結果にバイアスが含まれます。

 

IPW(IPTW)推定量について

IPW(Inverse Probability Weighting)推定量は後述のように各個人の傾向スコアを用いて、各個人に対して重みを与えることにより疑似母集団を作成して重みづけ平均をとる手法です。しばしばIPWはIPTW(Inverse Probability of Treatment Weight)とも書かれますが、これはただ、傾向スコアが”治療(Treatment)”への割り当ての確率ということをより強調しているだけで指している推定方法、内容は全く一緒です。

 

IPW定量

というわけでこの記事のメインの内容であるIPW定量についてまとめていきます。

 

この傾向スコアを用いた因果効果の推定にあたっては、”強く無視できる割り当て(Strong ignorability)”が成り立っているという条件が必要です。これは、

f:id:NorihiroSuzuki:20211020162617p:plain

というもので、十分な共変量Xが与えられたのであればアウトカムYと割り当てZは独立であるというものです。ここで、傾向スコアの定義に戻っていただきたいのですが、傾向スコアはバランシングスコアであるため、モデルに組み込んだ共変量が十分である(未観測交絡)がない場合には、Xで条件づけることと傾向スコアe(x)で条件付けることは同等なものとなります。つまり、

f:id:NorihiroSuzuki:20211020163914p:plain

となります。このことを利用しつつ、ATEの式展開を行っていきます。

f:id:NorihiroSuzuki:20211020170204p:plainつまり、一致性や割り当て遵守の仮定が満たされているのであれば傾向スコアを用いて因果効果を推定することができます。

 

ここでIPW定量とは、以下の傾向スコアの逆数による重み付け平均です。

f:id:NorihiroSuzuki:20211020170731p:plain

サンプルサイズnが大きいときに、この推定量は不偏推定量であるため差をとることにより、平均因果効果(ATE)を算出することができます。

ATT、ATUを推定する場合の重み

介入群、対照群への重みを1/e, 1/(1-e)とした場合に推定される値がATEとなる理由については上記で説明した通りで、一般的なIPW法ではATE(Average Treatment Effect)を推定していますが、それぞれの群に対して与える重みによって以下のように推定対象を変えることも可能です。

f:id:NorihiroSuzuki:20211020135511p:plain

なおここでは、

ATT: 介入群における平均因果効果(Average Treatment Effect on Treated)

ATU: 対照群における平均因果効果(Average Treatment Effect on Untreated)

e: 各個人の傾向スコア

です。

 

IPW法の問題点

一般的なIPW法の重大な問題点としては、極端な傾向スコアの値を持つ個人が存在している場合には、推定に対して非常に大きな影響をその個人が与えてしまうというものがあります。

例えば、対照群に傾向スコアの値が0.5, 0.001となるA, B,さんがいたとき、Aには2の重みが、Bさんには1000の重みが与えられます。つまり極端に小さな傾向スコアの値を持つBさんのほうがAさんよりも500倍推定に対して影響を与えています。同様に対照群に傾向スコアの値が0.5, 0.999となるC, Dさんがいた場合にもCには2の重みが、Dさんには1000の重みが与えられます。つまり、介入群においては傾向スコアが0に近い個人は1に近い重みを与えられ、1に近かければ無限大に近い(非常に大きな)重みを与えられるということです。なおこの関係は対照群であれば全く逆になります。

何が言いたかったかというと極端な傾向スコアを持つ個人がデータに含まれる場合、すなわち明らかに介入が行われる(行われない)ようなケースの場合には推定量が妥当なものではなくなってしまうという危険性をはらんでいるということです。

 

この単純な対策法としては、極端な傾向スコアを持つ場合には、その個人を解析の対象から外すというものがあります。しかしこの場合にはマッチング時と同様にそもそも解析対象がどんな集団を代表しているのか、つまり推定されたATEがなにに対する平均因果効果なのかが分からなくなってしまうという問題があります。

そんな話もあり、近年考えられ始めているのがoverlap weight(OW法)というものです。推定先がATEではなくなってしまうものの比較的安定した結果を得られることがいくつか報告されています。

 

ちなみにうちの研究室のボスがこんなものを出していたり、M2の先輩がそれに関連する研究をしていたりするのでもしかしたら自分も将来的にこの分野について研究するかもです。

 

参考

・調査観察データの統計化学. 星野崇宏(岩波書店

  • CAUSAL INFERENCE What If. Miguel A. Hernan, James M. Robins]

www.hsph.harvard.edu