医療統計学を学ぶ大学生のブログ

医療統計学、因果推論を専攻しています。R, SASユーザーです。

感度と特異度、検査法の評価と基準率の誤謬に関する話

f:id:NorihiroSuzuki:20210624141153j:plain

(Image by geralt from Pixabay)

 先日のゼミの中で、base-rate fallacyやPCR検査の感度に関する話題になり、一度そのあたりを整理したほうがいいかなということで、今回まとめていこうかなと思います。

 

 統計や疫学、医療にかかわっていない人からすると、感度や特異度といった話はあまり馴染みのないことだとは思いますが、病院での診断など特に最近のご時世だと理解しておくのは非常に重要かなと思います。

 

 

はじめに

何かしらの疾患が疑われる場合には、医療機関に行って検査を受けたり、最近だとドラックストアで検査キットを買って検査してみたりすることが一般的な話かと思います。基本的な判断方法としては、ある検査項目に対しその値が一定の基準(カットオフ値、閾値)以上であれば陽性、下回れば陰性となります。

ここで、簡易検査で陽性となり精密検査を受けるという流れを考えてみます。すると、この二つの結果は必ずしも一致しません。より正確性のある検査法のほうが我々にとってはありがたいわけですが、それをどう評価しようかというのがここで問題になってくるわけです。ということで検査の評価に使われる各概念をまとめます。

 

評価の概念

まず以下のように分割表を用いて、検査結果と真の状態を関係を考えます。

f:id:NorihiroSuzuki:20210624155028p:plain

※N = a+b+c+d

 

 この表の行は、簡易検査の結果(陽性、陰性)を表しており、列は検査を受けた個人の特定の疾患に対する真の状況(疾患持ち、健康体)を意味しています。ここで検査を受けた患者は4つのパターンに分かれます。

  1. 真に疾患を持ち検査でも陽性とされる(図中のa)
  2. 真に疾患を持っていないが検査では陽性とされる(図中のb)
  3. 真に疾患を持っているが検査では陰性とされる(図中のc)
  4. 真に疾患を持っておらず検査でも陰性とされる(図中のd)

 この分割をもとに様々な評価概念が考えられており、実際に用いられています。

 

正診率

 一つ目は正診率(accuracy)で、一致度や一致割合、正確度とも呼ばれます。正確には率ではなく、割合ですが、いったんそれはおいておきます。

 

正診率が意味するのは、検査結果が正しい結果を示している割合です。つまり、先ほどの4分類であれば、1の本当に病気の人をきちんと陽性と判断する割合と、4の病気ではない人を陰性と判断する割合の和になります。

式で表すと、(a+d) / N です。

 

この正診率は診断が正しい割合を意味していますが、逆に診断が間違っている場合(2,3のケース)もあります。これらはそれぞれ疑陽性、偽陰性と呼ばれます。

 

感度

感度(sensitivity)は、1の真に病気の人を陽性と判断する割合を意味します。

式で表すと、a / (a+c) です。

 

一般的には感度と呼ばれることが多いですが、他にも真陽性率や有病正診率と表記される場合もあります。

 

特異度

特異度(specificity)は、4の真には病気でない人を、陰性と判断する割合を意味します。式で表すと、d / (b+d) です。

 

特異度以外にも、真陰性率や無病正診率とも呼ばれます。

つまり感度と特異度は4分割の表を列で見た場合、つまり真の疾患保有状態がどちらであるかに着目した場合の評価になります。

f:id:NorihiroSuzuki:20210624163141p:plain

 

また、感度や特異度はそれぞれ見落としがどれだけ少ないか、過剰に診断することがどれほど少ないのかといったことを評価する指標と考えることも可能です。

 

陽性的中度

次に紹介するのが、陽性的中度(positive predictive value)です。

これは、検査で陽性とされた場合に真に疾患を保有している人の割合です。

式で表すと、a / (a+b) です。

 

陰性的中度

陰性的中度(negative predictive value)です。

これは、検査で陰性とされた場合に真に疾患を保有していない人の割合です。

式で表すと、d / (c+d) です。

 

つまり先ほどの感度、特異度は真の疾患ベースでの概念でしたが、この二つの的中度は検査の結果ベース、行で見た場合の話です。

f:id:NorihiroSuzuki:20210624163014p:plain

まとめ

初めに出した四分割表を上記の概念を用いて整理するとこんな感じです。

f:id:NorihiroSuzuki:20210624171006p:plain

 

 また、感度と特異度の二つの概念はトレードオフの関係にあります。

 仮により多くの陽性者を見つけようとして、検査で陽性を出しやすいように基準を下げれば、当然のことですが、陽性と診断される人は増えます。しかし逆に本当に陰性である人も陽性と診断される(偽陽性)可能性も上がります。

 極端な話ですが、検査に来た人すべてを陽性としてしまえば感度は100%、特異度は0%になります。この逆も同じで、全員を陰性としてしまえば、感度は0%、特異度は100%となります。

 

 実際問題として、検査法の評価には、感度と特異度を用いることが推奨されており、かつ特異度よりも感度のほうが重視されています。(感度が高い検査のほうが良い)

 

 これは、感度が高い検査の方が、病気の人を見落とすことがなくなるためであり、特異度が低いことは精密検査で対処が可能であるからです。

 つまり、病気の人を逃してしまうと、病気の進行を進めてしまうことになり、取り返しのつかないことになる可能性がありますが、逆に簡易検査で誤って陽性とされても、精密検査でその人を除外すればいいからです。

 

 

基準率の誤謬(base rate fallacy)

関連する話題として紹介するのが、base rate fallacy、日本語だと基準率の誤謬などと呼ばれるものです。これは、ある事項に関する基本情報と、具体的な特定の情報が提示された場合に、人々はそれら2つを平等に扱い、判断するのではなく、後者の情報を優先する傾向があるという一種のバイアスです。

 

例えば、会社の定期健診で胃がんの疑いあり(陽性)と診断された場合を考えます。

胃がんの有病率を0.2%、この検診の感度は80%、特異度は90%だとした場合、はたしてこの患者は胃がんなのでしょうか?胃がんである確率を80%と考えるのは正しいことでしょうか?

 

この問題におけるbase rate fallacyは、基本情報である、有病率が0.2%を無視して、胃がんである確率を80%と考えてしまうことになります。

実際にこの患者が本当に胃がんである確率(陽性的中度)は、

(0.02×0.8) / (0.02×0.8) + (0.998×0.1) ≒ 0.0158 

となり、約1.58%と感度のみを見た場合と大きく異なります。つまり有病率が低い場合であれば感度が高い検査であっても、慌てる必要はないということです。