PPVとNPV:有病率と診断精度の関係【ChatGPT統計解析】
PPV(陽性的中率)とNPV(陰性的中率)は、母集団の有病率だけでなく、検査の感度や特異度にも依存する。例えば、HIVの有病率が1%で、感度96%、特異度99%の検査を用いると、PPVは49%、NPVは99.96%になる。この結果、陰性結果は信頼できるが、HIV陽性者が少ないため、陽性の検査結果でも半数が誤判定となる可能性がある。稀少疾患を対象とする場合、特異度が高い検査が必要である。卵巣がんのように発生率が低い疾患では、PPVを10%にするために少なくとも75%の感度と99.9%の特異度が求められる。また、連続値を持つバイオマーカーの診断検査では、閾値の選択が重要で、厳しすぎると真陽性の見逃し、寛容すぎると誤陽性のリスクがあり、選択した閾値によってこれらの誤りに伴うコストが異なる。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
PPVとNPV
PPVとNPVは,検査する母集団の有病率だけでなく,健康な被検者と疾患を有している被検者に対する検査の精度にも依存している.
説明のために,ある母集団の1%がHIV陽性(有病率= 1%)で診断検査が96%の感度と99%の特異度を持っていると仮定しよう.
PPVは96/ (96 + 99) = 0.49で,対してNPVは9801/ (9801 + 4) 351となる.
したがって,陰性だった検査結果は確実にHIV感染を除外していたけれども,HIV陽性は一般集団においては希少であるために,その診断検査の高い精度にもかかわらず,陽性の検査は1人のHIV陽性に対応しそうなたった49%であった.希少疾患を考える時,検査の特異度は集団スクリーニングでの実際の使用において極めて高くある必要がある.
その発生率が17/100,000人である卵巣がんでは,スクリーニング検査はそのPPVがちょうど10%に達するためには最低でも75%の感度と99.9%の特異度を持っている必要があるとされる.
多くの診断検査は,例えば糖尿病に対するFPGのような連続値を持つバイオマーカーを測定の対象にする.
連続値を測定する診断検査において,陽性の判定は,大抵その結果がある閾値εを上回っているかどうかで行われる.
一般に右側のカットオフポイントの選択には,厳しくしすぎたカットオフによる真の陽性の見逃しと,寛容にしすぎたカットオフにより誤って過多な健康被検者を有病であると判断してしまうこととのトレードオフがつきまとう.
これらの2つの誤りのうちの1つを犯してしまうことによって派生するコストは一般にしきい値の選択に依存して大きく異なる.
PPV(陽性的中率)とNPV(陰性的中率)は、診断検査の重要な指標であり、これらは検査の性能だけでなく、母集団の有病率にも大きく依存します。PPVとは、検査で陽性と判定された人のうち実際に疾患を有している確率を示し、NPVは、陰性と判定された人が本当に疾患を持っていない確率を示します。これらの指標は、検査結果をどれほど信頼できるかを評価するために不可欠ですが、その解釈は単純ではありません。まず、感度(sensitivity)は疾患を持っている人のうち検査で正しく陽性と判定される割合で、特異度(specificity)は疾患を持っていない人のうち正しく陰性と判定される割合を意味します。これらの数値が高いほど検査は「良い」とされがちですが、実際の有病率が低い場合には、感度や特異度が非常に高くてもPPVは低くなり得ます。例えば、HIV感染を診断するための検査があり、母集団の1%がHIV陽性であると仮定します。もしこの検査の感度が96%、特異度が99%であるとすれば、PPVはわずか49%にとどまります。つまり、陽性と判定された人のうち実際にHIVに感染している確率は約半数しかなく、残りの半数は偽陽性である可能性があることを示します。この結果が示すのは、稀少疾患のスクリーニングにおいて、陽性の検査結果が必ずしも疾患を有していることを意味しないということです。対してNPVはほぼ100%に近い値となり、陰性とされた人はほとんど確実にHIVに感染していないと考えられます。このような背景により、稀少疾患のスクリーニング検査を考える際には、特異度の高さが求められるのです。特異度が低いと、陽性と判定される人が多すぎて偽陽性の割合が増え、実際の陽性者を見つけるのが難しくなるためです。実際、一般的に有病率が非常に低い疾患、例えば卵巣がんのように、発生率が10万人に17人程度である場合には、PPVを高くするために極めて高い特異度が必要とされます。具体的には、卵巣がんのスクリーニング検査ではPPVを10%以上にするために、感度75%以上、特異度99.9%以上が求められるとされています。このように有病率が低い疾患の検査においては、感度や特異度だけでなく、これらの組み合わせが非常に重要となります。また、多くの診断検査では連続値を持つバイオマーカーが使用され、糖尿病における空腹時血糖値(FPG)のように、ある基準値を超えた場合に陽性と判定されるケースが多くあります。この場合、検査値がある閾値を上回るかどうかで判断されますが、閾値の設定が高すぎると真陽性(実際に疾患を持っている陽性者)を見逃す可能性が増え、低すぎると健康な人を誤って陽性と判定する偽陽性が増えるというトレードオフが生じます。例えば、糖尿病診断の基準として空腹時血糖値が126 mg/dL以上の場合に陽性と判定するという基準があるとすると、この基準値より高くすると偽陽性は減りますが、真陽性も減少してしまいます。逆に基準値を低くすれば真陽性は増えるものの、偽陽性も増えるため、より多くの健康な人が「疾患あり」と誤診されるリスクが高まります。このような閾値の設定によって、診断精度が大きく影響を受けるため、特にスクリーニング目的での検査においては閾値の選択が重要な課題となります。閾値設定の影響は疾患によって異なるため、検査の目的や対象疾患の特性に応じて適切な閾値が選ばれるべきです。さらに、閾値の選択は単に真陽性と偽陽性の数に影響するだけでなく、誤った診断がもたらすコストや影響も大きく関わってきます。偽陽性が多くなると、不必要な追加検査や治療が行われる可能性があり、それによって医療費が増加し、患者の心理的・身体的負担も増すためです。特に稀少疾患のスクリーニングでは、偽陽性の数が膨大になると現実的な運用が難しくなるため、閾値を厳格に設定して偽陽性を減らす必要がある一方で、真陽性を見逃さないようにする工夫も求められます。例えば、稀少疾患であれば、まずは簡便な検査で幅広くスクリーニングを行い、陽性者に対して二次検査を行うなど、複数段階の検査プロセスが採用されることもあります。このようにPPVやNPVは、単に検査の性能指標として使われるだけでなく、実際の診療やスクリーニングの運用方針にも大きく影響を与えます。これらの指標の理解と適切な運用は、診断精度を向上させ、誤診を減らすための重要な要素です。
関連記事