医療統計学を学ぶ大学生のブログ

医療統計学、因果推論を専攻しています。R, SASユーザーです。

操作変数法(IV estimation)について

f:id:NorihiroSuzuki:20210430151406j:plain
(Image by PhotoMIX-Company from Pixabay)

つい先日、輪読を行っているWhat Ifの担当発表が終わり、せっかくなので簡単にまとめようかと思います。今回の内容はChapter16の操作変数法(Instrumental variable estimation)です。記事中の画像はWhat Ifより引用、編集しています。

実際に操作変数法が使われた研究についてはこちらで紹介しています。

norihirosuzuki.hatenablog.com

 

 

操作変数法とは

因果推論でよく使われるさまざまな手法(例えばIPW)には、交絡や選択バイアスの調整に必要な共変量がすべて特定、観測されているという検証不可能なかなり強い仮定の下で成り立っています。しかしこの仮定は、現実的には成り立たないため、得られる推定量には一定のバイアスが含まれています。

そこで、Chapter16で紹介されるのが先の仮定を必要としない方法である、操作変数法(Instrumental variable estimation)というものです。

 

操作変数法ではZとAが二値である場合、平均因果効果(ATE; Average treatment effect)を次のような式で算出します。

 

f:id:NorihiroSuzuki:20210430171020p:plain

※Zが連続である場合には、期待値ではなく、共分散になります

 

また線形モデルを二つ考え、それぞれで最小二乗法(LSM)を行うことによってもIV estimandを算出可能です。

①E[A|Z] = α0 + α1Z

②E[Y|Z] = β0 + β1E[A|Z]

③この時、β1がIV estimand

 

 

操作変数Zの3条件

操作変数法では、興味のある治療(A)のアウトカム(Y)への因果効果を推定するために、次の3つの条件を満たす操作変数という変数(Z)を利用します。

  1. Aと関連

  2. Aを通してのみYに影響を与える(除外制約)

  3. Yとcommon causeを持たない(Uと独立)

図として考えるとこんな感じ

f:id:NorihiroSuzuki:20210430162421p:plain

 

完全な余談ですが論文を見ていると、医療統計よりも経済系の分野の方が操作変数法についての研究が進んでいるような印象を個人的には受けたので、もし操作変数法に興味がある方は医療統計だけでなく、経済分野にも目を向けてみるのもありかなと思います。

 

 

Aと関連

このZとAが関連しているという条件では、必ずしもZはAに対して因果効果を与えている必要はなく、関連(相関)をしていれば十分です。また残りの二つの条件とは異なり、これは検証可能(データから判断可能)な条件です。

ただ、関連している変数であれば何でもいいわけではなく、相関が弱い場合には、いくつか重大な問題が発生するのでその点は注意が必要です。(後述)


Aを通してのみYに影響を与える(除外制約)

二つ目は操作変数(Z)が、アウトカム(Y)に対して直接的な効果を持たないというもので、日本語で除外制約などとも呼ばれます。また、DAGsでは、ZからYへの矢印が存在しないことを意味しています。

この条件は、先ほどの関連性の条件とは異なり、現実的には検証不可能な仮定です。もしかしたら別な経路でアウトカムに対して影響を与えているかもしれませんが、真実はだれにもわかりません。

 

Yとcommon causeを持たない(Uと独立)

最後の条件は、操作変数Zと、治療AとアウトカムYのCommon cause(交絡因子)であるUが独立であるというものです。ここで重要なのは、この共変量Uは全て特定、観測されている必要はないということです。(仮定を必要としない)

これが、共変量Uをすべて特定、観測する必要がある操作変数法以外の手法との大きな違いです。ただこの条件も同様に検証不可能な仮定であることには変わりはありません。

 

 

追加の条件

ここまでまとめた操作変数の3条件が、一般的によく知られているものかと思います。ですが、より厳密には以下のどちらかの仮定が必要です。

 

均一性(homogeneity)

通常のIV estimandで必要となるさらなる条件は、均一性(homogenity)です。

この条件は、歴史的に見るといくつかの内容が登場していますが、一般的には、治療群と対象群の平均因果効果がZに関わらず等しいという内容でいいかと思います。

 

この条件を追加することによってWhat IfのTechnical Point16.2で、IV estimandが平均因果効果に等しいことの証明がされているので、もし証明が気になる方がいれば、そちらも是非ご参照ください。

 

ただ、この均一性という条件は現実的には保証がされないケースがしばしばあるため、その利用は疑問視がされています。ということで、その解決策として考えられているのが

①ベースラインでの共変量をモデルに組み込む(今回は扱いません)

②均一性(homogeneity)ではなく、単調性(monotonicity)を使う

というものです。


単調性(monotonicity)

単調性を考えるにあたって、まず最初に割り当て(Z)と、治療(A)の潜在アウトカムを考えます。これはAとYの潜在アウトカムを考えたときと同様の概念です。

すると、この潜在アウトカムの取りうるパターンによって研究集団は下図のように四種類に分類することが可能です。

f:id:NorihiroSuzuki:20210430173641p:plain

ここで本題に入りますが、単調性は、上図の右下にあるDefierがいないという内容です。

他の三種類のサブグループの持つ潜在アウトカムをグラフ化したものを見ると、すべて増加 or 傾きが変わっておらず、単調増加をであるため、単調性という名前になっています。

 

この単調性は、均一性に比べてより現実的に保証される仮定ですが、その利用には注意が必要です。先ほどの均一性の仮定を使った場合には、IV estimandは平均因果効果を推定していることになりますが、単調性を使った場合には、Complier集団での因果効果を推定していることになります。また。この単調性自体にも様々な指摘、批判がされています。

  

 

 

”弱い”操作変数の問題点

弱い操作変数の定義として、本文中で紹介がされていたのは以下の二つです。

  1. IV estimandの分母の真値が小さい(E[A|Z=1] – E[A|Z=0]

  2. ZAの相関のF統計量が10未満

このいずれかに、操作変数が属するとき、操作変数法では重大な問題が発生します。

 

操作変数法をもう一度振り返ってみると、その推定量の分母はAとZについての関連性の指標です。

f:id:NorihiroSuzuki:20210430171020p:plain

操作変数Zと治療Aの関連性が非常に弱い(小さい)場合には、分子にその逆数がかかってくるわけですから、全体としては非常に大きな推定量になってしまいます。

 

さらに、ほかの諸条件が満たされない場合にも推定量には一定のバイアスが含まれます。つまり、そのバイアス自体も弱い操作変数は大きくしてしまうのです。

 

 

他の方法との比較

冒頭にも述べたように、操作変数法は、治療AとアウトカムYの交絡因子であるUをすべて測定するという強い仮定に依存しない点から他の因果効果の推定手法と大きく異なり、非常に魅力的な方法です。

しかし、操作変数法自身も検証不可能ないくつもの強い仮定に基づいています。それゆえどちらがいいというわけではなく、どちらの手法がよりその仮定が妥当なものであるかという点で比較、利用の検討をすべきなのかなと思います。