医療統計学を学ぶ大学生のブログ

医療統計学、因果推論を専攻しています。R, SASユーザーです。

因果推論におけるHillの考慮事項

f:id:NorihiroSuzuki:20210521145158j:plain

(Image by geralt from Pixabay)

 

因果推論を行うにあたって、因果関係であるか否かを判断するための何かしらの基準を作ればいいのではないかという発想は自然なことかと思います。この一定のルールを作ろうとするアプローチの始まりは、イギリスの哲学者であるJohn stuart Millが因果関係が従うと思われる論理体系を作ろうとしたことに依ります。

この記事はこういったアプローチの中でも特に引用がされているAustin Bradford Hillの考案したリストの内容について紹介、説明を行います。

 

Hillのリストについて

Austin Bradford Hillはイギリスの疫学者であり(詳しくはWikiへ)、彼が考案した因果関係を考えるにあたって考慮すべき事項のリストは、健康科学の分野で広く知られています。この彼の死後も様々な議論、改良がおこなわれており、もっとも有名なリストの一つと言っていいかと思います。

 

各項目の解説を行う前に、一般的に述べられていることの中で、一つ重大ななことがあります。それはこのリストがHill's criteria(基準)と紹介されている記事や、書籍があることです。彼自身は”criteria”という言葉を使っておらず、”viewpoint”や”perspective”

と呼称しています。つまり、因果関係が満たすであろう確固たる基準があると考えていたわけではなく、因果関係か否かを判断するにあたって”考慮すべき点”と考えているのです。

というわけで、この一般的な誤りは頭の片隅に入れたうえでリスト中の各項目を見ていただけるといいかなと思います。また9つの項目のうち因果関係であることの必要条件となっているのは4番目のTenporalityのみです。

 

  • Strength(強固性)

Strengthは関連の強さを意味します。つまり相関の強さが高いこと、すなわちリスク比やオッズ比の値が大きいことを指しています。しかし、どの程度の大きさがあればいいのかといった基準はありません。

 

因果関係であっても関連が弱い例

因果関係でなくても関連が強い例

 

このような例が考えることが可能であるため、Strengthは因果関係であることの必要条件でも十分条件でもないことがわかります。

 

  • Consistency(一致性)

二つ目は一致性です。ここでいう一致性の意味は、統計学上、潜在アウトカムを考えるときの一致性の意味とは異なるのでご注意ください。

Hillが提案している一致性の内容は、異なる研究デザイン、複数の集団、時間でも同様の研究結果が得られているかということです。同一の研究デザインで一致性があれば偶然誤差を除外することができますし、異なる研究デザインで一致性があれば、特定のバイアスがないことへの根拠になりえます。

 

しかし、一致性がなかったとしてもその研究結果に意味がないというわけではありません。例えばある部分集団のみで効果がある場合(集団全体では効果が見られない)といったことも十分考えうるので、暴露、介入の特徴や集団の違いを理解したうえでの解釈が必要です。

また、この一致性の判定に統計的有意性が用いられる場合がありますがそれもまた誤りです。統計的な推測は誤差を含むため、仮に一連の研究結果に統計的に有意であるものとそうでないものが混ざっていても、真の結果はどういうつである可能性はあります。

 

  • Specificity(特異性)

HillのSpecificity(特異性)は下記のいずれかを指します

  1. 原因が単一の効果を持つ
  2. 効果(アウトカム)が単一の原因を持つ

しかしこれは現実的には守られないケースのほうが非常に多いです。例えば喫煙と肺がんの発生の関係を考えたときには

f:id:NorihiroSuzuki:20210521154346p:plain

このような関係性があるため特異性は守られていません。

 

  • Temporality(時間的前後関係)

このTemporality(時間的前後関係)、原因が結果に対して時間的に先行していることは、Hillのリストで述べられているもののうち、唯一因果関係であることの必要条件になっています。

よって考えている関係性において、明らかに原因が結果に対して先行することがないことがわかっている場合には因果関係であるという仮説を否定します。

 

ただ原因と結果が互いに影響を与え続けている場合(下図の赤枠)も考えられるので、観測された結果のみからすぐに因果関係でないと判断するのは危険です。

f:id:NorihiroSuzuki:20210521155019p:plain

 

  • Biologic Gradient(生物学的勾配)

生物学的勾配とは、Dose-response / Exposure response curve、用量反応曲線がある形で存在していることを指します。これは、特定の曝露、介入の程度が上がった時に、それによって引き起こされると考えられるアウトカムの発症の程度も増加するというものです。Hill自身は”直線的な”関係と提案していましたが、一般的には単調であることを意味します。

Ex)喫煙と肺がん発症

→タバコをより吸う人(ヘビースモーカー)のほうが肺がんになりやすい

 

しかし、ある要因の程度が低すぎても多すぎてもリスクが上がってしまうといった関係性(U字型曲線)は疫学、医学分野ではしばしば観察され、この反応の関係性が単調でないケースもでは多いです。

 

  • Plausibility(妥当性)

これは、仮説を支持する観察結果があるかという内容です。

例えば19世紀に流行したコレラの例をとってみると、当初はコレラの原因は瘴気(病気を伝えるナニカを含んだ空気)だと思われていたが、この仮説は集団でコレラが発生することと一致していたので当時は非常に高い妥当性をもっていました。(結局は下水が原因)

 

f:id:NorihiroSuzuki:20210521160649p:plain

Wikiから持ってきた図です。当時の宗教観もあって面白いですよね。

 

観察された関連性が、疾病プロセスの現段階の理解と一致することを指します。

 

アインシュタイン相対性理論が出たときに、ニュートンの重力理論に反すると批判されました。しかし結局のところニュートンの理論ではなく、アインシュタインの理論が正しかったことがのちに証明されたように、そもそも現在認められている見解自体が間違っている可能性があるため、一貫性がなかったとしてもそれは因果関係でないことの証明ではありません。

 

一般には基礎研究、動物実験臨床試験といった人為的に介入が行われた研究によって得られた結果によるエビデンスを指します。介入実験をしてみてどういう結果が得られたかということですね。

 

しかしHillがリスト中で述べていたのは、有害とされる曝露要因を減少させることで、疾病の発生が減るかどうかを観察し得られた結果という、一般的な意味合いとはやや異なるものです。(実験を行うという点では同じですが)

 

ただ、こういった実験を行う際にはRCTのような適切な研究デザインがなければ、バイアスが結果に含まれる可能性があります。

 

  • Analogy(類似性)

類推とは、ある曝露と疾病の関連性(仮説)について、既に知られている他の関連性に基づいて推論を行うことです。多くの研究者が研究仮説を立てる際に自然に行っていることであり、研究の種となる非情に重要な部分です。しかし類推は、その研究者の知識や想像力の幅によって制限されるため、多くの観点や知識が必要となります。

 

まとめ

Hillのリストは因果関係の”基準”として用いられる場合がありますがそれは誤りであり、研究を行う上で重要な視点です。

今回紹介をした9つの項目以外にも、様々な観点が研究上重要です。また、統計的有意性といった現代で用いられている項目についても様々な意見があり、勉強を行う側としては、概念や結果の解釈を正しく行っていく必要があるなと強く感じています。

 

もし今回紹介した内容をさらに詳しく知りたい方は、ぜひ一緒にModern Epidemiology読みましょう。