統計学におけるベイズの定理【統計解析講義基礎】

統計学におけるベイズの定理【統計解析講義基礎】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

統計学におけるベイズの定理|【統計学・統計解析講義基礎】

統計学におけるベイズの定理【統計解析講義基礎】


目次  統計学におけるベイズの定理【統計解析講義基礎】

 

 

統計学におけるベイズの定理

 

ベイズの定理(ベイズの公式とも呼ばれる)は、条件付き確率の最も一般的な応用の1つです。

 

医療分野でベイズの定理は、特定の疾患に対するスクリーニング検査で陽性の人が実際にその疾患を持つ確率を計算することに使われます。

 

ベイズの定理は確率のいくつかの基本概念の理解が必要となります。

 

任意の2つの事象AとBのベイズの定理を以下に示す。

 

ベイズの定理

 

統計学におけるベイズの定理【統計解析講義基礎】

 

この式はP(A)、P(B)、P(B|A)はわかっているがP(A|B)を調べたい場合に使用します。

 

ベイズの定理の分子では、2つの事象の積事象の確率は、最初の事象の確率に最初の事象を前提とした2つ目の事象の条件付き確率を掛けたものであるという事実を利用します。

 

この例では、Aを前提としたBの条件付き確率にAの確率を掛けると、AとBの積事象(つまり、AとBの両方が起こる)の確率が求まります。

 

分母では上記と同じ事実と、ある事象とその余事象で標本空間全体となり、ある事象とその余事象を合わせた確率は1になるという事実を利用しているので、Aを前提としたBの条件付き確率にAの確率を掛けたものと~Aを前提とした召の確率に~Aの確率を掛けたものの和がBの確率に等しくなります。

 

 

疾患を持つ人に対する疾患の発見率が95%であり、疾患を持たない人に対して疾患であると誤診断しない率が99%であるスクリーニング検査があるとします。

 

臨床医なら、この検査の感度は95%であり、特異度は99%と言う。また、母集団における疾病率は1%であるとします。

 

疾患には記号D、疾患がないことには~D、検査で陽性にはT、陰性には~Tを使うと、各確率は次のように表します。

 

統計学におけるベイズの定理【統計解析講義基礎】

 

これは感度や特異度としては非常に高い値であり、一般的に利用される多くの検査や処置はもっと正確性が低いです。

 

しかし、検査は完璧ではなく、検査で陽性の人が実際には疾患ではなかったり(偽陽性)、検査で陰性の人が実際には疾患を持っていたり(偽陰性)する可能性があります。

 

多くの場合、検査で陽性の人が本当に知りたいのは、実際の疾病率です。

 

条件付き確率の表記法を使うと、P(D|T)が知りたいのです。

 

この確率はベイズの定理と感度、特異度、母集団における疾病率を使い、以下の式に示すように計算します。

 

疾病と検査結果の観点で表したベイズの定理

 

統計学におけるベイズの定理【統計解析講義基礎】

 

この式を見ると、検査で陽性の場合に疾病を持つ確率は、単に検査で陽性と疾患の両方を持つ確率を(疾患の有無に関わらず)検査で陽性となる確率で割ったものであることが明らかです。

 

ある事象とその余事象で標本空間全体を成し、確率が1になることを利用すると、偽陽性率は1−特異度です。

 

P(T|~D)=1-0.99=0.01

 

同じ理由から、母集団における疾患を持たない確率は1−疾病率です。

 

P(~D)=1-P(D)=1-0.01=0.99

 

これらの事実と前述の情報を使うと以下式に示すようにP(D|T)を計算できます。

 

ベイズの定理を使った検査で賜性の場合に疾患を持つ確率の計算

 

統計学におけるベイズの定理【統計解析講義基礎】

 

この例は、スクリーニング検査に関して重要であるのに(少なくとも一般には)正しく評価されていない事実を例示しています。

 

特異度と感度が高いスクリーニング検査でも、疾患が稀である場合には偽陽性率が真陽性率に比べて高くなります

 

この例では、検査で陽性の人の約半数が偽陽性(つまり、疾患を持っていない)であると思われます。

 

これは必ずしも検査を使わない理由にはならず(特に疾患が深刻な結果を招く場合)、真陽性と偽陽性を区別する正確な追跡検査をすればよいということです。

 

しかし、普遍的スクリーニングの策定を提案する際には(疾患に対するものや空港での荷物検査などのその他の状況でも)、必ず偽陽性率とその潜在的影響を考慮すべきです。

 

偽陽性率は、母集団における疾病率とスクリーニング検査の感度と特異度に左右されることに注意しましょう。

 

疾病率が0.01ではなく0.005であると、以下式の計算に示すように陽性が真陽性である場合が少なくなり、偽陽性である場合が多くなります。

 

ベイズの定理を使って検査で陽性の場合に疾患を持つ確率を計算する別の例

 

母集団における疾病率が下がると、真陽性率が下がります。

 

統計学におけるベイズの定理【統計解析講義基礎】

 

この例では、陽性の3分の1未満が真陽性です。

 

 

統計学におけるベイズの定理【統計解析講義基礎】


セミナー詳細                    解析ご相談                    LINEでお友達

統計学におけるベイズの定理【統計解析講義基礎】

統計学におけるベイズの定理【統計解析講義基礎】