ROC曲線とAUCで見る診断精度のすべて【ChatGPT統計解析】
ROC曲線(受信者動作特性曲線)は、X軸に偽陽性率、Y軸に真陽性率を取り、各カットオフ値に対応する点を結んで描かれます。この曲線は、検査の精度を全カットオフ値で視覚的に示し、1982年にSwetsとPickettによる研究で医療分野に普及しました。理想的な検査は、偽陽性や見逃しがなく、左上の(0,1)付近にROC曲線が位置します。一方、実用性のない検査は45度の直線を描き、コイン投げと同等です。診断精度の指標として一般にAUC(ROC曲線下面積)が用いられ、完全な検査ではAUC=1、不十分な検査ではAUC=0.5です。AUCは検査がランダムに選んだ症例と対照を正確に識別する確率と解釈され、低い偽陽性率のみに関心がある場合、部分AUC(pAUC)が使用されることもあります。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
受信者動作特性曲線
受信者動作特性曲線(receiver operator characteristic (ROC) curve)は,x軸に偽陽性率,Y軸に真陽性率をとってそれぞれ個々のカットオフ相当する点の集合を描いたものである.
ROC曲線は検査の精度をあり得るすべてのカットオフ値全体と同時に視覚的に示すもので. 1982年にSwetsとPickettによって画期的な研究がなされた後に医療の分野で広く使われるようになった。
完全な検査は,あるカットオフで症例と対照を完全に分ける,
すなわち1つの偽陽性も症例の見逃しもないようなものであろう.
低いFPFと高いTPFを持つ検査は,故に左上側の角の点(0, 1)の近くに現れるROC曲線として容易に認識することができる.
実用にならない検査は,すべてのカットオフで症例と対照の両方に対して同じ陽性確率という 45度の直線に相当するコイン投げも同然なものであるかもしれない.
診断の精度に関する要約尺度で一般に使われるのは,ROC曲線下面積(area under the ROC curve. AUC)である.
完全な検査はAUC=1(単位正方形の面積)を持ち,実用にならない検査ではAUC = 0.5で45度の直線下の面積である.
AUCはまた,連続値を測定する検査が,ランダムに選択される症例と対照を正しく整理する確率と解釈することもできる。
ほとんどの場合,低い値のFPFだけに関心があるので,他のある者たちは部分AUC (partial area under the curve,pAUC)を検査の比較に使用すること提案している.
pAUCは対照群中の偽陽性のある特定された(対応する)範囲のROC曲線下面積を計算するものである.
ROC曲線(受信者動作特性曲線)は、二項分類問題において、モデルの性能を視覚的に評価する手法の一つです。ROC曲線では、X軸に偽陽性率(False Positive Rate, FPR)を取り、Y軸には真陽性率(True Positive Rate, TPR)を取って、それぞれ異なる閾値(カットオフ値)に基づく識別の精度を表す点をプロットし、それを結んで曲線を描きます。ROC曲線は、さまざまなカットオフ値における偽陽性と真陽性のトレードオフを示し、分類モデルの性能を判断するための視覚的な手段として特に医療やバイオインフォマティクス、機械学習などの分野で広く使用されています。ROC曲線の利点の一つは、モデルが異なる閾値でどのような性能を示すかを一目で理解できることです。特定のカットオフ値を選ぶことなく、あるいはどのカットオフ値が最も適切かを決定する際の参考として使用され、一般的には、モデルの適用範囲が異なるケースであってもROC曲線を比較することで、どのモデルがより適しているかを相対的に評価することが可能です。ROC曲線の歴史を遡ると、1982年にSwetsとPickettによって行われた研究がきっかけとなり、医療分野での使用が広がりました。当初は診断性能を評価するための視覚的なツールとして用いられ、その後、様々な分野で性能評価手法として採用されるようになりました。ROC曲線の形状は、モデルの診断能力を反映しており、完全な検査では、あるカットオフ値で症例(疾患の有無)と対照(非疾患)のデータを完全に区別できるため、ROC曲線は左上の角に近づき、(0,1)に非常に近い位置でプロットされます。具体的には、真陽性率が高く、偽陽性率が低い状態を目指し、これを理想としたROC曲線の形状は、左上の角に極めて近い位置に現れるようになります。これに対し、性能が低く実用性のない検査は、すべてのカットオフ値で症例と対照の両方に対して同じ陽性の確率を示し、ROC曲線が45度の直線に近くなります。このような場合は、検査の結果が単なるランダムな予測に等しく、検査が有用でないことを意味します。ROC曲線の曲線下の面積、つまりAUC(Area Under the Curve)は、モデルの性能を数値的に表すための重要な指標です。AUCは、ROC曲線が単位正方形内で占める面積として表され、一般的には0.5から1の範囲で評価されます。AUCが1に近いほど、モデルの診断能力が高く、1に達する場合は完全な検査、すなわち理想的な診断能力を有していると見なされます。一方で、AUCが0.5の場合はROC曲線が45度の直線に沿う形となり、これは単なるランダムな予測、すなわち「コインの裏表を当てる」程度の診断性能しか持たないことを示しています。このように、AUCはモデルが症例と対照を正確に識別する能力を示す指標として広く用いられています。AUCは、検査が症例と対照を正確に識別する確率としても解釈することが可能です。例えば、ある患者が疾患を有している場合、その患者が疾患を有していない別の人と比較して、適切な診断結果をもたらす可能性が高いことを示します。つまり、AUCが高い検査ほど、疾患の有無を正確に見分けることができると期待されます。さらに、ROC曲線とAUCは、特定のケースでは部分AUC(partial AUC, pAUC)という形で使用されることもあります。pAUCはROC曲線の中で、特に関心のある偽陽性率の範囲に限定して評価を行うものであり、特に低い偽陽性率に注目したい場合に有用です。例えば、特定の診断検査において、低い偽陽性率の範囲内で性能を比較する際に、pAUCを用いることで、実際の使用場面により即した評価が可能となります。
関連記事