Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における条件付き確率と独立【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における条件付き確率と独立【統計解析講義基礎】

統計学における条件付き確率と独立【統計解析講義基礎】


統計学における条件付き確率と独立【統計解析講義基礎】

 

統計学では「独立」という言葉がよく出てきます。

 

独立とは、簡単にいえば、2つのランダム現象があるとき、一方の結果がもう一方の結果に影響しない、という意味です。

 

たとえば、2つのくじびきがあるとき、一方に当たるともう一方に当たりやすくなるのであれば、この2つのくじびきは独立ではありません。

 

独立の概念は、正確には条件付き確率を使って定義されます。

 

今日、雨が降っているときに、明日も雨が降る確率は、ただ単に「明日雨が降る確率」とは異なるということは、日常生活でも実感できることです。

 

前者のように、何かが起きるという情報が得られているときの確率が、条件付き確率です。

 

条件付き確率

 

サイコロで、「3以下の目が出る確率」を図に表すことを考えます。

 

サイコロで、可能なすべての目は1,2,3,4,5,6の6通りで、これを集合Ω={1,2,3,4,5,6}で表します。

 

一方、3以下の目は1,2,3の3通りで、3以下の目が出るという事象をΩの内部にある集合A={1,2,3}で表します。

 

Ωのことを全事象といいます。

 

このとき、3以下の目が出る確率は、集合Aの要素が起きる確率なので、事象Aが起きる確率といい、P(A)で表します。P(A)は、集合Aの要素の数を|A|で表すと、

 

P(A)=|A|/|Ω|=3/6=1/2

 

となります。

 

さらにもうひとつ、「偶数の目が出る確率」を考えます。

 

同様にして偶数の目は2,4,6の3通りで、これを集合Bで表すと、偶数の目が出る確率P(B)は、

 

P(B)=|B|/|Ω|=3/6=1/2

 

となります。これらを目に見えるように表したのがベン図です。

 

では、「3以下かつ偶数の目が出る」確率を考えましょう。

 

この事象は集合A∩Bで表されますから、その確率P(A∩B)は、

 

P(B)=|A∩B|/|Ω|=1/6 となります。

 

ここで、|A∩B|/|B|という確率を考えてみましょう。

 

図の青いアミの入った部分です。

 

分母が|Ω|から|B|に変わっていますから、ここでは「偶数の目」がここでの「可能なすべての目」になっています。

 

一方、A∩Bは「3以下かつ偶数の目が出る」という事象ですが、今は「偶数の目が出る」という事象のなかでしか考えていませんから、この事象は単に「3以下の目が出る」という事象ということができます。

 

したがって、

 

|A∩B|/|B|=偶数の目が出るとわかっているとき(偶数の目が出るのが確実なとき)、それが3以下である確率

 

になります。

 

これを、Bを条件とするAの条件付き確率といい、P(A|B)で表します。

 

P(A|B)=|A∩B|/|B|=1/3 ですから、偶数の目が出たという情報が得られているときは、そうでないときよりも「3以下の目が出る」確率は小さくなることがわかります。

 

ところで、

 

P(A|B)=|A∩B|/|B|=(|A∩B|/|Ω|)/(|B|/|Ω|)
=P(A∩B)/P(B)

 

と表され、これを条件付き確率の定義とする場合もあります。

 

ただし、この場合、分母・分子それぞれの確率は、いずれも同じ|Ω|を分母とする確率でなければならないことに注意する必要があります。

 

また、上の式から、
P(A∩B)=P(A|B)P(B)

 

となります。この式を、確率の積の法則あるいは乗法定理といいます。

 

積の法則は、簡単にいえば、

 

「AとBの両方が起きる確率」=「Bが起きたとしたときにAが起きる確率」×「ほんとうにBが起きる確率」

 

であるということを表しています。P(A|B)とP(A∩B)の違いも、これでわかると思います。

 

「独立」と条件付き確率

 

条件付き確率を説明したサイコロの例で、事象Aが「3以下の目」ではなく「2以下の目」だったらどうでしょう。

 

このときは「2以下の目が出る確率」P(A)=1/3です。

 

一方、P(A∩B)=1/6やP(B)=1/2は変わりません。したがって、

 

P(A|B)=|A∩B|/|B|=1/3 も変わりません。

 

したがって、このときはP(A|B)=P(A)となります。

 

このときは、事象Aが起きる確率と、事象Bが起きるとわかっているときに事象Aが起きる確率が同じです。

 

すなわち、事象Aが起きる確率は、事象Bが起きるかどうかに関係がないことを意味しています。

 

このとき、事象Aと事象Bは独立であるといいます。

 

数学や統計学でいう「独立」という概念は、物理的に独立に動作する、といったこととは関係ありません。

 

この例でも、事象Aと事象Bは、どちらも同じひとつのサイコロで起きています。

 

事象Bが起きるという情報がもたらされても、事象Aが起きる確率には影響がない、というのが、独立という意味です。

 

事象Aと事象Bが独立のとき、上式で表される積の法則は、

 

P(A|B)=P(A)ですから、

 

P(A∩B)=P(A)P(B)

 

となります。事象Aと事象Bが独立のとき、A,Bが同時に起きる確率は、それぞれが起きる確率の積になります。

 

事象Aと事象Bが独立のときにかぎり、こうなるのであって、いつもこうなるのではないことに注意しましょう。

セミナー詳細こちら                    解析ご相談こちら


 

統計学における条件付き確率と独立【統計解析講義基礎】

統計学における条件付き確率と独立【統計解析講義基礎】

統計学における条件付き確率と独立【統計解析講義基礎】