医療統計学を学ぶ大学生のブログ

医療統計学、因果推論を専攻しています。R, SASユーザーです。

書評:『ローゼンバウム 統計的因果推論入門: 観察研究とランダム化実験』

 

 こちらの本を訳者である本学の阿部貴行先生から、田栗研究室宛に恵贈いただきました。本書は、統計学的因果推論を行うにあたって重要となるランダム化実験や観察研究といった実験デザインについて概説し、そしてその後一部のバイアスや手法に関するトピックに触れていくといった流れになっています。

 読者対象者としては、統計学の初歩的な知識を持っていることを前提とはしていますが、数式でゴリゴリにやっていくわけではなく、具体例とともに解説がされていくので、因果推論の外観を掴みたい初学者にもお勧めできるかなと思います。

 

 ということで、一通り読んでみた感想・内容を簡単にまとめます。個人的な感想、意見、解釈がかなり含まれますので、その点はご理解よろしくお願いします。もし解釈が間違っていると思われる場合にはコメント等でご指摘いただけると大変助かります。 

 

 

本書の概要

 医療統計に既に関わっている人や、他の書籍等である程度知識をつけている人にとっては、章のタイトルでおおよその内容は推測できるかと思いますが、簡単に各章ごとの内容をまとめます。

 

第Ⅰ部 ランダム化実験

 第Ⅰ部は「ランダム化実験」ということで、介入がランダムに行われ、処置群と対照群の比較が可能な下での因果推論を考えます。

 具体例として、敗血性ショックへの治療法に関するProCESS試験を例にとりつつ解説が行われており、特に事前知識がなくとも読んでいけるかなと思います。

 

第1章 ランダム化臨床試験

 この章ではまず初めに、因果推論を行う上で重要なアウトカムや共変量といった用語が解説されます。そして共変量がランダム化が行われた実験の下ではどういったバランスになるのかが紹介されています。

 アウトカムと共変量をよくごちゃごちゃにする人がいますが、本書の例は個人的には簡潔で分かりやすかったと思います。

                                                       

第2章 構造

2章で登場するのが、現代の因果推論で非常に重要となる”潜在的アウトカム”という概念です。この潜在的アウトカムというものを使って、集団での平均因果効果をどのように考えていくのかについて解説がされます。

 なぜ処置群と対照群といった部分集団で得られた結果を母集団に適用できるかといった話も登場します。

 

第3章 ランダム化実験における因果推論

 3章で中心となる話題は仮説検定の話になります。特にトランプの例は秀逸でなかなかに面白かったです。ただ有意水準とP値のことについては、誤解をしやすいかなと思う記載があったので厳密さよりもわかりやすさ(本書のタイトルの通り)をとったのかなと思いました。Fisherの正確確率検定が後に続くのでそこを意識したのかなと。検定のことを十分に理解できている方であれば問題ないかとは思いますが、統計初心者や疫学系の人にとっては後々悩むかもしれないです。

 

第4章 非合理性とポリオ

 工学といったほかの分野と比較すると、疫学、医学研究は必ずしも合理的な判断を伴わない場合も多くあります。この章ではそういった研究における非合理性を、1954年にアメリカで行われた小児へのポリオワクチンのランダム化臨床試験を例にとりつつ議論しています。

 章の冒頭にもあるように、この章は読まなくても後半特に問題はありませんが、このポリオワクチンの例はかなり有名ですので、一般教養として知っておくべきだと思います。ただ、他の章と比べてやや哲学的な側面もあるので、人によっては読み進めにくい可能性はあります。

 

第Ⅱ部 観察研究

 第Ⅱ部ではランダム化が行わている実験研究ではなく、観察研究に関しての話題が主なテーマとなります。文章量としてはこの第Ⅱ部のほうがだいぶボリュームのあるものになっています。

 

第5章 観察研究と実験研究の間

 5章では観察研究に関する議論の第一歩として、観察研究で最も大きな問題となる交絡の問題をシミュレーションによって生み出されたデータを例にとり、議論がされています。こういった観察研究における諸事項と簡単な対応について紹介がなされた後には、処置群への割り付け確率である”傾向スコア”について紹介がされます。ここは筆者であるローゼンバウムらしさが出ているなと率直に感じました。

 

第6章 自然実験

 6章では自然実験と呼ばれる、意図した介入は行われないが、ランダム化比較試験といくつか類似した特徴を持つ研究について議論、比較がされています。また、この章の大部分は様々な例によって構成され、その一つである2010年チリ地震と心的外傷ストレスについては以降の章でも使われます。 

 

第7章 理論の精緻化

 7章では、因果関係を考えるにあたって理論をより精緻なものにすることで得られること、ロジックについて論じられています。また、研究の一致性に関する話もあり、数学的な話というよりは、研究をより実のあるものにするためにはどう考えていくべきなのかといった目的で書かれていたように感じました。

 

第8章 準実験の諸手法

 ランダム割り付けが行われない場合には、得られた結果が介入によるものであるのか、それとも介入群と対照群がそもそも比較可能でないことなのかが不明確となります。本書ではこのことを”曖昧さ”と呼んでおり、これを軽減する方法として準実験というものを紹介しています。準実験の方法としては、複数の対照群の設定や、不連続デザイン(RDD)などが簡単に述べられています。

 

第9章 バイアスに対する感度

 この章のメインテーマはタイトルの通り、バイアスに対する感度、および感度解析です。ほぼすべての研究は何かしらの過程に基づくものですが、この感度分析は想定している過程が満たされない場合にどれほど計算結果や、結論が影響を受けるかを判断するものであり、研究の妥当性を測るものです。本章ではCornfieldらによって導入された方法と、類似した考えに基づく一つの方法が簡単に紹介されています。

第10章 デザイン感度

 10章で扱うのはデザイン感度ということで前章に引き続き”感度”にまつわる話です。9章で扱った感度解析は観察研究によって得られたデータを用いて行うものですが、これに対しデザイン感度は研究デザインそのものの特性を示すものです。こういった感度にまつわることを始めて学ぶ人にとっては、デザイン感度の使用法の話は分かりにくいと思うので、具体例とともに大まかに何を行っているのかの概論のみを見るだけでもだいぶ雰囲気はつかめるかなと思います。

 

第11章 マッチングの技法

 この章ではタイトルの通り傾向スコアを用いたマッチングの技法に関して紹介がされています。条件付き交換可能性の話からマッチング時の距離の考え方、様々なペア数の取り方など広く紹介がされています。ローゼンバウムらしさがあったかなと思いました。

 

第12章 気質によるバイアス

 12章は気質によるバイアスが大きなテーマであり、ジェネリックバイアスやラッシュ行動といった人間の行動に関するいくつかの内容が、自動車事故の例とともに初めに論じられています。そして差分比較や分離といったバイアスの軽減を目的とする事項について紹介がされるといった流れになっています。

 

第13章 インスツルメント

 13章のタイトルにある”インスツルメント”は、経済学の分野では操作変数と呼ばれますが、訳者まえがきにもある通り、ローゼンバウムは"instrument"という語に明確な意図を持っているためここではそのまま使用がされています。内容としては操作変数法についてというよりは、研究におけるインスツルメントとは何かということに対して焦点が当てられていたように印象を受けました。

第14章 結論 

総論です。省略します。 

 

個人的な感想

 個人的な感想を述べさせてもらうと、非常に具体例が多く、疫学や統計をそれほどやってない人にとってもとっつきやすい書籍だったと思います。いい意味で数学の証明や展開などはなく、それぞれのテーマに関して大体どんなことをしているのかをイメージしやすい内容です。Modern Epidemiologyやほかの疫学所と共通する内容もあり、それなりには満足のいく内容でしたまた地味なことですが、巻末に記号と専門用語の解説ページがついているのはすごい親切だと思いました。

 ただ欲を言うのであれば、文章の理解が結構難しい部分もあるので、これは原著自体の問題ですが、もう少し解説や紹介が柔らかくあってほしかったかなとは思います。あとは入門書と専門書の兼ね合いはなかなかに難しいとは思いますが、詳細な説明、より厳密な定義が欲しかった部分がちらほらとあったかなという印象です。

 

 

 著者であるローゼンバウム先生、また訳者である岩崎・阿部の両先生に敬意を表して今回の記事は終わりとさせていただきます。