医療統計学を学ぶ大学生のブログ

医療統計学、因果推論を専攻しています。R, SASユーザーです。

Causal Inference: What If, Chapter1

 統計的因果推論という分野で世界的権威であるMiguel A. Hernan, James M. Robins教授の著書「Causal Inference: What If」で取り扱っている内容についてまとめていきます。両名とも2022年4月現在、ハーバード大学に在籍されておりまして、本書は以下のMiguel A. Hernan教授のサイトよりダウンロード可能です。データファイルや各種プログラミングコードも適宜ご活用ください。

www.hsph.harvard.edu

 個人的な学習や大学のゼミ活動の都合上、各チャプターごとにスライドも作成しております。スライドについては、こちらのspeaker deckで公開していますのでご自由にご活用ください。記事・スライドに誤りが含まれている場合には、ご指摘いただけると幸いです。

  本記事はWhat IfのIntoroduction および Chapter1: A definition of causal effectについてです。Capter1の構成は以下の通りです。

  1. Individual causal effect
  2. Average causal effect
  3. Measures of causal effect
  4. Random variability
  5. Causation versus association

 本章では、今後因果推論についての議論をおこなっていく上で、最も基本的かつ重要となる”因果とはなにか”についての内容となっています。

Introduction: Towards less casual causal inferences

 IntroductionはTowards less causal causal inferenceということで、日本語にすると「いい加減ではない因果推論のために」といったあたりでしょうか。(間違いを指摘してくださったTarotanさんありがとうございます)

 Causal Inference(因果推論)は単なるデータ解析の手法の一つではなく、複雑な科学的問題です。本書は健康・社会科学分野の研究者を特に読者として想定しており、因果的な疑問、データ分析の根幹にある仮定について、それぞれの研究者が明示できるようになることを目的としています。

 このブログの読者として、データ分析を行う方や学生、医学関係者などを想定していますが、現実に見かける多くの文献では、研究上の因果的な疑問や、解析にあたって満たすものとしている仮定が一体何であるのかが明確に記述されていないケースも多々あるかと思います。これについてWhat Ifでは、より混乱の少ない、解釈可能な研究を行うために、これらの因果的な疑問を明確にすること、データと仮定の役割を分けることの重要性を強調しています。

 

 本書はPartⅠ〜Ⅲまでの3部構成です。それぞれPartの内容は以下のようになっており、後半の章につれ難易度も上がっていきます。

  • PartⅠ:モデルを用いない因果推論
  • PartⅡ:モデルを用いた因果推論
  • PartⅢ:経時データでの因果推論

 また補足事項としてFine PointとTechnical Pointというものが登場します。Fine Pointは全てのレベル感の読者を、Technical Pointは統計の学習を中程度積んだ読者を対象としています。もし仮に数学・統計学の知識がそれほどなく、Technical Pointを読んでみてもちょっと、、、という方は本文だけでも因果推論の概要は掴めますので一旦飛ばしても構わないかと思います。

 特に健康、社会科学分野の科学者を対象としているとのことでしたが、それ以外の分野の方においても因果推論というのは非常に有用な学問分野です。このブログでWhat Ifの内容(統計的因果推論)を取り扱うことで、多くの方の研究に個人的にも役立てればいいかなと思っています。ということで、Chapter1に入っていきます。

 

 

Individual causal effect

Preface

As a human being, you are already innately familiar with causal inference’s fundamental concepts. Through sheer existence, you know what a causal effect is, understand the difference between association and causation, and you have used this knowledge consistently throughout your life. Had you not, you’d be dead.

 

人間である以上、生得的に因果推論の基本的な概念は既に理解しているはずである。因果関係とは何か、関連性と因果関係の違いは何かを理解し、これまでの人生において使用してきたはずである。もしそうでないなら死んでいたはずである。

 あえてChapter1の冒頭部分をそのまま記載させていただきました。因果推論という言葉を聞くとなにか難しいことをやっていると考えてしまい、勉強のハードルが高くなりがちです。しかし、我々は既に、直感的に”因果”と”関連”が何なのかを理解し、直感的にそれらを使い分けています。このChapter1での目的は、その直感で示される因果関係を数学的に表記することです。

 まずは個人レベルでの因果効果を数学的に記載するために具体例を用いつつ考えていきます。RobinsとHernanらしいというか、アメリカらしいというか、しばらくギリシャ神話で登場する神様を具体例として使用します。

 

ゼウスとヘラの例

 1節で登場するのはゼウスとヘラの2柱です。ここで、ゼウスとヘラは心臓移植を待つ患者とし、共に1月1日に心臓移植を受けるとします。現実には心臓移植を受けた場合の結果しかわかりませんが、何かしらの方法(Ex, 神の啓示)によって、心臓移植を受けなかった場合の結果も分かるものとします。そして移植から5日後の1月6日に生存しているか、死亡しているかが観測されます。

 ゼウスとヘラの心臓移植をした場合の結果と、しなかった場合の結果は以下の通りです。

  • ゼウスの場合f:id:NorihiroSuzuki:20220118162723p:plain
  • ヘラの場合

f:id:NorihiroSuzuki:20220118162754p:plain

 

 ゼウスについて見てみると、心臓移植を受けた場合は死亡し、受けなかった場合は5日後も生存しています。つまり心臓移植が死を引き起こしたとみることができます(心臓移植は5日後の生存と因果関係がある)。それに対し、ヘラは心臓移植をしてもしなくても生存するため、心臓移植は5日後の生存とは因果関係がありません。

 この例は、普段我々が直感的に因果関係を考えている場合と同じです。つまり、ある行動A(介入、曝露、治療)があった場合となかった場合の結果を比較し、結果が異なるのであれば行動Aによる因果効果ありと判断し、結果が同じであるならば行動Aによる因果効果はないものと判断しているわけです。これをもう少し数学的に表記してみようというのが次の内容です。

 

Individual causal effectの定義

 まず以下のように記号を定義します。

f:id:NorihiroSuzuki:20220118163701p:plain

ここで各個人に対し
f:id:NorihiroSuzuki:20220118163837p:plain
の時に治療AはアウトカムYに対して因果効果(個人レベルでの因果効果)があると定義されます。またこれは、個人を示す変数iを用いて
f:id:NorihiroSuzuki:20220118164017p:plain
とも記載されます。今後はこちらでの表記が多くなるかと思います。

 

 この個人レベルでの因果効果の定義で用いたYa=0, Ya=1は、Potential outcomes(潜在アウトカム)、またはCounterfactual outcomes(反事実アウトカム)と呼ばれます。重要な点は、一方は現実に観測されるがもう一方は観測されない(反事実となる)ことです。ただ、Fine Point1.1で扱う”Interference”がある場合にはこの定義とはなりません。

 余談として記載されていましたが、このPotential outcomes、Counterfactual outcomesのどちらを用語として使うかは人によって好みが出てくるそうです。ある介入を受ける(受けない)場合に、これらのアウトカムが”潜在的に”想定されるという点を強調したい人は前者を、現実としては一方は観測されない(反事実)となるという点を強調したい人は後者を使っているとのことでした。ちなみに自分はPotential outcome派です。

 

一致性(Consistency)

 個人レベルの因果効果を潜在アウトカムを用いて定義したわけですが、あくまでこの潜在アウトカムは理論上のものであり、現実に観測されるアウトカムとは異なります。そこでこれらをリンクさせる仮定が必要です。それが一致性(Consisitency)です。

 

一致性は以下のように定義されます。

 薬剤投与のような治療が単一であるケースにはこの一致性は妥当ですが、同じ治療Ai=aであったとしても、介入のバリエーションが複数ある場合(multiple version of treatment)には上記のようにはなりません。この点についてはFine Point1.2 でもう少し詳細に扱います。ただこの一致性は、因果関係を考えるにあたっては非常に重要な仮定ですし、その成立を認めているケースが大半です。

 

 

Average causal effect

 前節では興味のあるアウトカムY、比較する二値の介入A、潜在アウトカムYaを用いて個人レベルの因果効果を定義しました。しかしこの潜在アウトカムは現実にはどちらか一方しか観測できず、もう一方は観測されない(反事実)となるという問題があり、個人の因果効果は定義することは可能なものの、特定するのはなかなか厳しいものがあります。

 となると、個人について無理なら、集団での平均的な因果効果となるのは自然な流れかと思います。詳しくは次節以降で取り扱いますが、この平均因果効果はいくつかの仮定の下で求めることが可能になります。

 

集団での因果効果

 前節ではゼウスとヘラの2名(?)の潜在アウトカムしか考えていませんでしたが、それを以下の表のように20名にまで拡張してみます。なお、以前と同様にAは二値であり、それぞれの場合の潜在アウトカムの情報もすべて得ることができているものとします。

f:id:NorihiroSuzuki:20220129173136p:plain

 

 ここで集団での平均因果効果(Average causal effect)を次のように定義します。

20名の集団でのそれぞれの潜在アウトカムを見ると分かるように、介入時の死亡割合も、非介入時の死亡割合もともに0.5(10/20)となっています。つまり、この集団においては心臓移植による平均的な因果効果はなかったということになります。

 一つ重要なポイントとしては、平均因果効果がなかったとしても必ずしもそれは個人レベルで因果効果がないことを意味しているわけではないということです。個人レベルで因果効果がないのは(Ya=0,Ya=1) = (0, 0) or (1, 1)の時ですが、表を見ると(Ya=0,Ya=1)  = (0, 1) or (1, 0)となる個人も存在しています。

 

2つの帰無仮説

 因果効果に対する帰無仮説は2つ存在します。一つがFisher帰無仮説Sharp null hypothesis)、そして2つ目がNeyman帰無仮説です。Fisher帰無仮説はすべての個人に対して、Neyman帰無仮説は集団での期待値に関する帰無仮説であり、Fisher帰無仮説の方がより強い仮定です。これは、Fisher帰無仮説の仮定である、全ての個人で因果効果がないということが満たされるのであれば、集団での平均因果効果もないためです(期待値の線形性より明らか)。

 What Ifでは、以降この集団に対するNeyman帰無仮説の下で議論を進めていきます。単に帰無仮説という場合にはこちらを指していますので、誤解のないようお願いします。

 

Fine Point 1.1 

Interference

Interference(干渉)とは、ある解析対象(個人)への介入が別の解析対象の潜在アウトカムへ影響を及ぼすことを指します。これがある場合には、ここまで議論してきたような単純な潜在アウトカムで表記できません。この干渉がある場合の個人の潜在アウトカムは、介入Aが二値であり、考える集団のサイズがnだと2^n 通り存在します。

具体的に干渉がある場合のゼウスとヘラの例を考えてみます。ゼウスへの介入をA(0,  1)、ヘラへの介入をB(0, 1)とすると潜在アウトカムは

f:id:NorihiroSuzuki:20220129180557p:plain

となります。学習の都合上、以降はこの干渉がないということ(非干渉性)を仮定します。

 

Fine Point 1.2

Multiple versions of treatment 

 前節の一致性(Consistency)ですこしだけ言及がありましたが、介入Aが有無(0, 1)だけではなく、介入をするとしても(A=1)、複数の方法が存在する場合のことをMultiple versions of treatmentといいます。例えば手術をAとした場合に、手術を行う医師は複数考えられますのでそういったケースに当たります。 この介入の方法が複数存在し、かつそれぞれの方法による効果が一定でない場合(医師によって手術の腕が異なる)には、前節の一致性(Consistency)が成り立たず、介入の有無だけではなく、誰が(どのような方法で)介入を行ったかの情報が必要となります。

前述の非干渉性とともによく因果推論の文脈で見かけるSUTVA(Rubin, 1980)の一部に含まれます。 なお再度Chapter3でこの辺りは触れますが、Interferenceと同様に学習の都合上、Multiple versions of treatmentはないものとして議論を行います。

 

Technical Point 1.1

Causal effect in the population

 潜在アウトカムYa の期待値E[Ya]は、アウトカムが二値である場合には、

f:id:NorihiroSuzuki:20220129181718p:plain

アウトカムが連続値である場合には、

f:id:NorihiroSuzuki:20220129181818p:plain

と表記することができます。本文中での議論のように、集団での因果効果の定義に潜在アウトカムYa の期待値E[Ya]を使うことは最も一般的ですが、期待値ではなく、分散や中央値、ハザード等々様々な指標を使うこともあります。

 この場合の注意点が一つありまして、分散のような非線形関数を評価指標として用いる場合には平均因果効果を表す式の線形性は成り立ちません。

 研究目的によって何を効果指標とするのかは異なりますので、次節でも同様の言及がありますが、その点は十分考慮する必要があるかと思います。

 

 

Measures of causal effect

effect measures

 前節ではゼウスらで構成される20名に対し、心臓移植がその後の死亡に対して因果効果があるかどうかを議論しました。結局のところ、心臓移植は平均的には因果効果がないとの結論でしたが、このとき因果効果がないというとを確率記号(期待値記号)を用いて表記しました。

 

しかし”平均因果効果がない”ということを示すものは、これ以外にも様々なものがあります。

 上記のようなリスク差、リスク比、オッズ比では平均的に効果がない場合にはその値はそれぞれ0, 1, 1となります。またこれらの因果効果の指標をここでは、”effect measures”と呼んでいます。

 現実問題として、どういった効果指標(effect measures)を”因果効果”の定義に用いるかはその推論によって異なります。こういった指標は同じ効果を異なる目的のために、異なるスケールで定量化しているため、その解釈には注意が必要です。

 例えば、Aを喫煙の有無、Yを肺がんの発生の有無とし、ある1億人の集団での潜在アウトカムを考えます。そして全員が喫煙をした場合には3件の肺がんが発生し、同様に全員が喫煙をしなかった場合には1件のみの発生だったとします。すると、この場合のリスク差は0.000002、リスク比は3と計算されます。ではこれらの指標はそれぞれどういった意味を持つかというと、リスク差は「一億人いた場合に喫煙(介入)によって2人が肺がんを発生」を、リスク比は「喫煙(介入)によって肺がんのリスクが3倍」ということを意味します。

 

Fine Point 1.3

Number needed to treat

Number needed to treat(NNT)とは、「1件のアウトカムの発生を防ぐためには介入を行う集団が何人必要か」を示した指標です。この指標は費用対効果なんかを考える場合にはよく使う指標なのかなと個人的には考えています。定義としては、以下のようにリスク差の逆数にマイナスをかけたものとして定義されます。

f:id:NorihiroSuzuki:20220205151519p:plain

なお治療(介入)によってアウトカムの発生が増加してしまう場合(リスク差が正の場合)には、アウトカムの発現(harm)を1件増やすために必要な数を意味していることになります。

 

例えば1億人に対して介入をした場合としなかった場合のアウトカム発生数が2000万、3000万だったとすると、NNTは10と計算されます。集団全体で介入効果の有無を議論すると1億人に介入を行うと1000万人がアウトカムを発症しなくなるということですが、NNTの観点で見ると10人に介入を行えば1件のアウトカム発症を減少させることが平均的に期待されるということになります。

 

ただ個人的には、この定義だとリスク差が正の場合(介入によってアウトカムの発現増加)にはNNTの値が負になってしまうので、単にマイナスをかけるのではなく、絶対値を取って1件のアウトカムの発現に必要な集団のサイズとしたほうがいいのかなと思ったりもしています。(でも絶対値あんまり使いたくないっていう気も...)

 

 

Random variability

 偶然誤差が発生する原因として、ここではSampling variabilityとNondeterministic counterfactualsの2つを考えています。前者は統計をやっている人からすれば必ず聞いたことがあるかなと思いますが、後者に関しては大部分の人が初耳かなと思います。順に内容を見ていきます。

 

Sampling variability

 ここまでの節では、平均因果効果の定義を行うにあたり20名の潜在アウトカムを考えてきました。そして、この20人という集団に対しては潜在アウトカムに関しての情報は全て得られていました。しかし、現実には興味のある集団のサイズは20とは比較にならないほど大きいかと思います。すると、潜在アウトカムの情報が両方とも得られるかだけでなく、集団全員の情報を得ることは現実問題としてかなり難しくなってきます。そのような理由から標本の情報から母集団について推測するというのが一般的です。

そこで以下の表に表されるゼウスら20人を先ほどまでの母集団全体としてではなく、とある巨大な母集団(Super population)からの無作為標本であると考えます。

 因果推論を行う上で知りたいの母集団におけるPr⁡[Y^(a=1)=1]および Pr⁡[Y^(a=0)=1]です。しかしデータとして得られるのは標本のデータのみです。そこで推定を行うために、推定量として標本平均を考えます。

  • 定量(estimator):母数(今回だとPr[Y^(a=1)=1], Pr⁡[Y^(a=0)=1])を推定するのに用いる統計量の一種(関数)
  • 推定値(estimate):実際のデータから計算される推定量の値

 上記の20名の標本での推定量の値は、Aの値が0, 1のどちらの場合であっても0.5です。この推定値は母集団ではなく標本から計算された値ですので、必ずしも母数と一致するとは限りません。しかし今回推定量として考えた標本平均は一致推定量ですので、標本のサイズが無限に近づけば母数に“一致”します。

f:id:NorihiroSuzuki:20220207143438p:plain

 ここで注意が必要なのは、統計量としてのConsistency(一致性)と潜在アウトカムモデルでのConsistency(1.1節を参照)が指していることは意味が異なることです。今後もこういった同じ用語だが、違う意味を指しているということは度々出てきますので文脈を必ずご確認ください。

 

Nondeterministic counterfactuals

 標本のばらつきという内容に続いて紹介がされるのは、Nondeterministic counterfactualsです。この非決定論的反実仮想とは治療Aを受けた場合にYが一意に定義(決定論的)されず、実測のYは確率的に変動するということを意味しています。

 ここまでの節では潜在アウトカムは決定的に観測されることを前提としてきました。すなわち例えば上記の表のゼウスであればA=1(治療を受ける)だと、Ya=1が観測されたわけです(A=0の場合は0)。しかしこの潜在アウトカムが非決定論的である場合には、治療Aを受けても必ずYa=1となるわけではなく、例えば90%の確率でY=1が、10%の確率でY=0が観測されたりします。このように100%(もしくは0%)の確率で、Yaが決まらない場合をNondeterministic(非決定論的)と言っています。ただ実用上はほぼ使われていないと思います。(少なくとも自分は見たことがないです)

 これら2つの偶然誤差の原因については、学習上の都合で一旦Ch10までは無視します。すなわち標本のサイズは非常に大規模(20人の例であれば一人は10億人を意味)であり、潜在アウトカムは決定的であるとします。

 

Technical Point 1.2

Nondeterministic counterfactuals

 非決定的潜在アウトカムモデルの元での Yaの期待値は、

として定義されます。ここでYaの確率関数であるP_(Ya ) (y) は、 A=aを受けた際にYa=yとなる 確率Q_(Ya ) (y) について期待値をとったもので、Q_(Ya ) (y)自体も確率的に変動する(確率変数)として考えています。例えば先ほどのゼウスの話であれば、Ya=1となる確率が90%として考えていましたが、その確率自体も確率的に変動(0~1)していると理解しています。

 そして非決定的潜在アウトカムモデルでは、より一般には確率変数Yaを個人に対して割り当てるのではなく、0~1の間のランダムな値をとる統計分布Θ_(Ya ) (・) を個人に対して考えています。つまり集団における潜在アウトカムの期待値は以下の式で定義されます。

 

 

Causation versus association

「causation is not association」

こういった言葉を因果推論を学ぼうとしている方でしたら一度は耳にしたこともあるかと思います。この節では、因果と関連の根本的な違いについて考えます。

 

因果と関連

 個人レベルでの因果効果の定義を行う際に、最後に問題となったのは、潜在アウトカムは現実にはどちらか一方のみしか観測されないということでした。これは集団に対しても同様であり、集団を構成する各個人は潜在アウトカムのいずれか一方のみしか観測できません。ここで実際に受けた治療をA、観測されたアウトカムをYとしたとき、下表のようにゼウスらの潜在アウトカムは観測されます。(一致性は満たされるものとして)

 この時A=0, 1のそれぞれの群での死亡確率はPr[Y=1│A=1]=7/13、Pr[Y=1│A=0]=3/7となっています。ここで治療AとアウトカムYが独立である(A⊥Y or Y⊥A)というのは以下の関係式が成り立っている場合を指します。

 これらの指標のことを本書中では”association measures”と呼んでいます。仮にこの等式が成り立たない場合、例えば今回の様なケースではAとYは関連していると言うことができます。ここでのポイントは、3節では"effect"と言っていたのが”association”と変わっている部分です。今回の結果から治療AとアウトカムYについて言及できるのは以下の二つです。

  1. 因果関係は認められない(より正確には「わからない、断定できない」が適切かと思います)
  2. 関連性はある

 つまり、A=1(治療)の人が死亡リスクが高い傾向にあるはわかりますが、因果関係にまでは言及できないということです。これが何故か?ということを図示したのが下図です。論文や他の書籍で見かけることも多いかなと思います。

f:id:NorihiroSuzuki:20220212164519p:plain

 図中の白色の部分が治療を受けた集団を、グレーの部分が治療を受けていない集団を意味しています。因果関係とは治療を受けた場合と受けなかった場合の集団全体の比較(潜在アウトカム全体)であるのに対し、相関関係は治療を受けた集団と受けなかった集団の比較(ある部分)となっています。つまりリスク評価において、因果関係では条件付けなしでのリスクの比較であるのに対し、相関関係はあるaの層でのリスクPr[Y=1│A=a]になってしまっています。この比較をしている集団が異なるということが、因果と相関が異なるという根本的な部分です。

 

因果関係の議論には集団全体の各治療レベルaごとの潜在アウトカムすべてが必要とはいっても、現実に得られるデータは冒頭の表のようなものです。じゃあ関連しか言うことができないのでは?となるかもしれませんが、特定の条件の下では前述のデータを因果関係の議論に用いることが可能です。その条件を満たす方法の一つが次のChapter2で紹介されている”ランダム化”という方法になります。