Causal Inference: What If, Chapter1 ② - 生物統計学を学ぶ大学院生のブログ

　Miguel A. Hernán, James M. Robinsらの著書であるCausal Inference: What IfのChapter1: A definition of causal effectについてまとめていきます。個人的な学習やゼミの関係で作成したスライドも下部に載せています。誤記等ある場合にはご指摘いただけますと幸いです。この章では反事実アウトカムという概念とそれを用いた因果効果の定義、データから因果効果を識別するための条件について紹介が行われます。前回の内容はこちら。

norihirosuzuki.hatenablog.com

Measures of causal effect
- 因果効果を表す指標
- Fine Point 1.3: Number of needed to treat
Random variability

Measures of causal effect

因果効果を表す指標

　前回の記事で紹介したように、”心臓移植”（治療） $A$ はゼウスら20名で表される母集団における死亡（アウトカム） $Y$ に対し因果効果を持たず、2つの反事実リスク $Pr[Y^{a=1}=1]$ , $Pr[Y^{a=0}=1]$ がともに0.5と等しいため因果帰無仮説 (causal null hypothesis) は保持されます。例えば2つのリスクの差が0であること ( $Pr[Y^{a=1}=1] - Pr[Y^{a=0}=1]=0.5-0.5=0$ )や、リスクの比が1であることが1であること ( $Pr[Y^{a=1}=1] / Pr[Y^{a=0=1}]=0.5/0.5=1$ )といったことも、このcausal nullを示す同等な方法として考えることができます。つまりcausal nullは以下のように表現することが可能です。

(i)から(iii)の左辺を順に因果リスク差 (causal risk difference) 、因果リスク比 (causal risk ratio) 、因果オッズ比 (causal odds ratio) と呼びます。なお、母集団における因果リスク差は差のスケールでの個別因果効果 $Y^{a=1} - Y^{a=0}$ の平均であり、個別因果効果の平均を表す指標の1つです。対照的に、母集団における因果リスク比は比のスケールでの個別因果効果 $Y^{a=1} / Y^{a=0}$ の平均ではなく、個別因果効果の平均を表す指標の1つとはなりません。

　ここで、喫煙という治療 $A$ が母集団における肺がんというアウトカム $Y$ に対し因果効果を持つ状況を考えると $Pr[Y^{a=1}=1]$ , $Pr[Y^{a=0}=1]$ は等しくないため因果帰無仮説は成立せず、因果リスク差、因果リスク比、因果オッズ比のそれぞれの値は0, 1, 1とはなりません。むしろこれらの因果パラメータというのは異なるスケールで同じ因果効果の強さを定量化するものです。因果リスク差、因果リスク比、因果オッズ比（および他の要約指標）は因果効果を測定するため、効果指標 (causal measures) と呼びます。

　それぞれの指標は異なる目的で使用がされます。例えば、仮に治療を行えば100万人に3人がアウトカムを発現させ、治療を行わなければ100万人に1人がアウトカムを発現させるような大きな母集団を考えたとき、この因果リスク比は3、因果リスク差は0.000002です。因果リスク比（乗法的スケール）は無治療と比較して治療が何倍疾患リスクを高めるかを計算するために用いられ、因果リスク差（加法的スケール）は治療に起因する疾患の絶対的な症例数 (case) を計算するために用いられます。乗法的・加法的なスケールのいずれを用いるかについては、その推論の目的によります。

Fine Point 1.3: Number of needed to treat

　治療を受けた場合 ( $a=1$ ) には2000万人が5年以内に死亡し、治療を受けなかった場合( $a=0$ ) には3000万人が死亡するという1億人の母集団を考えます。この情報は、以下の同等な方法で表現することができます。

因果リスク差の値が-0.1 ( $Pr[Y^{a=1}=1] - Pr[Y^{a=0}=1]=0.2-0.3=-0.1$ )
1億人に治療を行った場合には行わなかった場合よりも1000万人死亡者数が少ない
1000万人の（5年間の）生存のためには1億人に治療を行う必要がある
平均的に1人の患者の（5年間の）生存のためには10人に治療を行う必要がある

一番最後に示された、症例 (case) $Y=1$ を1件減らすために、治療を受ける $a=1$ 必要がある平均的な人数のことをnumber of needed to treat (NNT) といいます。上記の例ではNNTは10です。症例の平均的な数を減少させる（i.e., 因果リスク差が負）治療に対しては、NNTは因果リスク差の絶対値の逆数となります。

症例の平均的な数を増加させる（i.e., 因果リスク差が正）治療に対しては、同様にnumber of needed to harmを定義することができます。NNTは (Laupacis, Sackett, and Roberts, 1988) において提案がされました。因果リスク差のように、NNTはそのベースとなる母集団と時間間隔に対し適用がされます。効果指標としてのNNTの関連した利点と欠点についての議論については (Grieve, 2003) をご参照ください。

Random variability

1^st source of random error: Sampling variability

　ここまでの段階で効果指標の計算手順が多少なりとも信じ難いと思う読者もいるかと思います。例えば、ゼウスは（神であるので）死ぬことがないという周知の事実を無視しただけではなく、因果効果に興味のある母集団はたった20人によって構成されていました。しかし興味のある母集団はより大規模であるのが一般的です。

　具体例での母集団は小規模（20人）であったため全ての個人から情報が得られましたが、実際には（実現可能性の観点から）興味のある母集団の標本 (sample) のみの情報が得られます。たとえ全ての研究対象についての潜在アウトカムの値を知ることができたとしても、標本を扱う以上、治療 $a$ を受けた下でアウトカムを発現させる個人の母集団における正確な割合は得られません。例えば未治療下での死亡割合 $Pr[Y^{a=0}=1]$ といった値を直接計算することはできず、その割合を推定することのみ可能です。

　前回の記事で扱った下表で示される20人の例を再度考えます。

以降ではこの20人を前回扱ったような母集団としてではなく、サイズがはるかに大きい、ほぼ無限である超母集団 (super population) （e.g., 全ての不死者）*1からの標本として考え、標本において非曝露であった場合に死亡した個人の割合を $\hat{Pr}[Y^{a=0}=1]=10/20=0.5$ と表記します。この標本における割合 $\hat{Pr}[Y^{a=0}=1]$ というのは、超母集団全体が非曝露であった場合に死亡する個人の割合 $Pr[Y^{a=0}=1]$ と正確に一致はしません。例えば母集団においては $Pr[Y^{a=0}=1]=0.57$ であったのに対し、偶然誤差 (random error) によって上記の20人の標本では $\hat{Pr}[Y^{a=0}=1]=0.5$ となるといったことが考えられます。また治療値 $a$ の下での標本での割合 $\hat{Pr}[Y^{a=0}=1]$ を超母集団での割合 $Pr[Y^{a=0}=1]$ を推定するために、すなわち $Pr$ の上部にあるハットは標本における割合 $\hat{Pr}[Y^{a=0}=1]$ が $Pr[Y^{a=0}=1]$ の推定量であることを意味するものとします。なお標本のサイズが大きくなればなるほど $\hat{Pr}[Y^{a=0}=1]$ と $Pr[Y^{a=0}=1]$ の差は小さくなることが期待されるため、ここで $\hat{Pr}[Y^{a=0}=1]$ というのは $Pr[Y^{a=0}=1]$ の一致推定量 (consistent estimator) *2となっています。これはサンプリングのばらつきによる誤差がランダムであり、よって大数の法則に従うためです。

　超母集団における割合 $Pr[Y^a=1]$ は計算することができず一致推定量である標本での割合 $\hat{Pr}[Y^a=1]$ によって推定を行わざるしかないため、因果効果があるのかないのか明確な結論を出すことはできません（"真の値"はわからない）。むしろ因果帰無仮説 $Pr[Y^{a=1}=1] - Pr[Y^{a=0}=1]$ に関する経験的なエビデンスを評価するためには統計学的な手続きを踏む必要があります。この点の詳細についてはChapter10で紹介を行います。

一致性 (consistency) についての注意点

統計量の性質としての一致性と統計的因果推論（Rubin因果モデル）における一致性は言葉としては同じですが意、図する内容が異なりますのでご注意がください（1.1節を参照）。Chapter2以降でもこのように複数の意味を持つ用語がしばしば登場しますので文脈を必ずご確認ください。

2^nd source of random error: Nondeterministic counterfactuals

　上記では偶然誤差の原因としてサンプリングのばらつきだけを考えました。しかし、個人の反事実アウトカムの値が事前に固定されていないことも偶然誤差の原因として考えることができます。ここまで反事実アウトカム $Y^a$ を、その個人が治療値 $a$ を受けた場合のアウトカムとして定義しました。例えば本章の初めの例では、ゼウスは治療（心臓移植）を受ける場合には死亡し、未治療である場合には生存します。定義したように反事実アウトカムの値は各個人に対し固定 (fixed) もしくは決定論的 (deterministic) であり、例えばゼウスについては $Y^{a=1}=1, Y^{a=0}=1$ です。言い換えると、ゼウスは治療を受けた場合には100%の確率で死亡し、受けなかった場合には0%の確率で死亡することを想定しています。しかし、ゼウスは治療を受けた場合には90%の確率で死亡し、受けなかった場合には10%の確率で死亡するといったシナリオも考えることができます。

このシナリオにおいては、ゼウスの治療下での死亡確率 (0.9) と未治療下での死亡確率 (0.1) はどちらも0でも1でもないため、反事実アウトカムは非決定論的 (nondeterministic) または確率論的 (stochastic) であるといいます。表に示した $Y^{a=1}=1, Y^{a=0}=1$ の値は、これらの確率をもつ「死亡コインのランダムフリップ」の可能な実現値として見ることができ、さらに全ての個人が等しくアウトカムを発現させないため、その確率は個人によって異なることが期待されます。古典的な力学と対照的に、近年の量子力学においてはアウトカムは本質的に非決定論的であるとされ、すなわちゼウスの量子力学的な死ぬ確率が90%であったときには、どれほどゼウスに関する情報を集めたとしても治療を受けた際にゼウスが実際にアウトカムを発現させるかどうかの不確実性が残ります。

　従って統計的因果推論においては、サンプルのばらつき、非決定論的な反事実、もしくはその両方によって偶然誤差が生じます。しかし本書では学習上の都合、この偶然誤差をchapter10までほぼ無視します。具体的には反事実アウトカムは決定論的であり、非常に大きな（おそらくは仮説上の）超母集団における全ての個人のデータを記録したものと仮定します。これは10億人がゼウスと、もう10億人がヘラと同一である（それ以外の神についてもも同様）といったように、20人によって構成される母集団を200億人の個人によって構成される母集団とみなすことと同等です。従ってchapter10までは計算結果は十分な確実性があるものとします。

Technical Point 1.2: Nondeterministic counterfactuals

　非決定論的な反事実アウトカムに対し、治療値 $a$ の下での反事実アウトカム $Y^a$ の期待値 $E[Y^a$ ]は以下のように確率変数である $Y^a$ の全ての可能な実現値の加重平均として定義されます。

$\sum_{y}yp_{Y^a}(y)$

ここで確率質量関数 $p_{Y^a}(・)$ は $E[Q_{Y^a} (・)]$ であり、 $Q_{Y^a} (y)$ は治療レベル $A=a$ の下で $Y=y$ となるランダム確率です。本文におけるゼウスの例では $Q_{Y^{a=1}} (1)=0.9$ です。なお連続であるアウトカムに対しては加重平均の部分が積分に置き換えられます。

　より一般には、非決定論的な反事実アウトカムの定義は各個人に対し確率変数 $Y^a$ の特定の実現値を与えるのではなく、個人特有の $Y^a$ の統計分布 $Q_{Y^a} (・)$ を割り当てるものとして定義されます。非決定論的な因果効果の定義は、 $Q_{Y^a} (・)$ が0~1の間をとるランダムな累積密度関数としたときの決定論的な定義を一般化したものです。集団における反事実アウトカムの期待値 $E[Y^a ]$ は $E[E|Q_{Y^a} (・)]]$ に等しいため、 $F_{Y^a} (y)$ $=$ $E[Q_{Y^a} (y)$ ]を用いて

$E[Y^a]$ $=$ $E[\int ydQ_{Y^a} (y)]$ $=$ $\int ydE[Q_{Y^a} (y)]$ $=$ $\int ydF_{Y^a} (y)$

となります。

　もし反事実アウトカムが二値かつ非決定論的であるならば、集団における因果リスク比 $\dfrac{E[Q_{Y^{a=1}} (1)]}{E[Q_{Y^{a=0}} (1)]}$ は相対的なスケールでの個別因果効果 $Q_{Y^{a=1}} (1)$ $/$ $Q_{Y^{a=0}} (1)$ の加重平均 $E[W(Q_{Y^{a=1}} (1) / Q_{Y^{a=0}} (1))$ ]と等しくなります。なお $W = \dfrac{Q_{Y^{a=0}} (1)}{E[Q_{Y^{a=0}} (1)]}$ であり、 $Q_{Y^{a=0}} (1)$ は集団におけるいずれの個人に対しても決して0にはならないものとします（i.e., 決定論的ではない）。