Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学におけるベイズの定理【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学におけるベイズの定理【統計解析講義基礎】

統計学におけるベイズの定理【統計解析講義基礎】


統計学におけるベイズの定理【統計解析講義基礎】

 

条件付き確率に関し重要でかつ応用範囲の広い定理としてベイズの定理があります。

 

2つの事象A、Bに対し、Pr(A)≠0およびPr(B)≠0 のとき、

 

Pr(A|B)=Pr(B|A)Pr(A)/Pr(B)

 

=Pr(B|A)Pr(A)/(Pr(B|A)Pr(A)+Pr(B|Ac)Pr(Ac))

 

が成り立ちます。これをベイズの定理といいます。

 

ベイズの定理の意味は重要で少なくとも2つの解釈ができます。

 

@事象Bが観測される前の事象Aの事前確率Pr(A)が、事象Bの生起により事後確率Pr(A|B)に、Pr(B|A)Pr(B)倍だけ変化します。つまり、事象BがAの生起確率に及ぼす大きさを知る定理です。

 

A事象Bをなんらかの結果としたとき、結果Bの原因がAである確率Pr(A|B)を、Aが原因でBが結果として生起する確率Pr(B|A)およびAが原因でなくBが生起する確率Pr(B|Ac)により表現します。すなわち、結果を見てその原因を探る定理です。

 

まれな事象の観察

 

事象Aの生起はまれで、その生起確率をpとします。

 

Aを1回以上観測する確率を0.95とするために必要な試行回数nを求めます。

 

n回中でAを1回以上観測する事象は1度も観測しない事象の余事象ですから、1−(1−p)n≧0.95より、(1−p)n≧0.05となります。

 

この両辺の自然対数をとり、log(0.05)=−3およびxが小さいときはlog(1+x)=xであることを用いると、n≧3/pを得ることができます。

 

p=0.001では、n≧3000となります。

 

検査の精度

 

ある疾患をもつ人をD、もたない人をNとし、この疾患の有無を調べる検査での陽性を+、陰性を−で表します。

 

疾患をもつ人が陽性となる条件付き確率Pr(+|D)を検査の感度といい、疾患をもたない人が陰性となる条件付き確率Pr(−|N)を特異度といいます。

 

例えば、Pr(D)=0.01とし、感度をPr(+|D)=0.9、特異度をPr(−|N)=0.8とします。検査で陽性になりかつ疾患をもつ確率はPr(+∩D)=Pr (+|D) Pr(D)=0.9×0.01=0.009と求められます。

 

同様に、Pr(+∩N)=0.198、Pr(−∩D)=0.001、Pr(−∩N)=0.792 となります。

 

検査で陽性になる確率はPr(+)=Pr(+∩D)+Pr(+∩N)=0.009+0.198=0.207となります。

 

陰性になる確率はPr(−)=1−Pr(+)=1−0.207=0.793となります。

 

検査で陽性であった人が疾患をもつ条件付き確率Pr(D|+)はベイズの定理により、

 

Pr(D|+)=Pr(D∩+)/Pr(+)=0.009/0.207=0.0435 となります。

 

検査で陽性であっても疾患をもつ確率はそう高くないことがわかります。

 

同様に、検査で陰性だった人が疾患をもたない条件付き確率は、

 

Pr(N|−)=Pr(N∩−)/Pr(−)=0.792/0.793=0.9987 となります。

 

この場合、検査で陰性であれば、ほぼ疾患をもたないことになります。

セミナー詳細こちら                    解析ご相談こちら


 

統計学におけるベイズの定理【統計解析講義基礎】

統計学におけるベイズの定理【統計解析講義基礎】

統計学におけるベイズの定理【統計解析講義基礎】