成功か失敗?二項分布で確率をマスター!【ChatGPT統計解析】
二項分布は、成功か失敗の2つの結果しかない事象に適用される確率分布です。硬貨を5回投げる場合を例に、表の回数は0〜5の整数をとり、これは離散変数です。二項分布は、機械部品の不良品の数や、試験の合否など、二値の結果を持つ実データに使われます。ベルヌーイ試行を繰り返すことで得られる分布で、特定回数の試行で特定の成功回数を計算する公式が存在します。例えば、硬貨を5回投げて1回だけ表が出る確率は、この公式で計算できます。また、試行数が多いと二項分布は正規分布に近づきます。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
統計学における二項分布
二項分布とは
離散分布(特定の値だけを取る変数の分布)の例として二項分布を使う。
硬貨を5回投げる場合を考えてほしい。
硬貨が表になる回数は0、1、2、3、4、5などの整数を取れるが、3.2や4.6などの値は取れない。
したがって、「硬貨を5回投げたときの表の回数」という変数は離散変数である。
二項分布は、欠陥品か許容可能のどちらかである機械部品から科目に合格か不合格のどちらかである学生に至るまで、二値の結果(2つの僖しか取れない結果)を持つ多くの種類の実際のデータに適用される。
二項分布の事象はベルヌーイ過程で作成される。
ベルヌーイ過程の1つの試行をベルヌーイ試行と呼ぶ。
二項分布は、ベルヌーイ過程の、1回の試行における成功回数を表す。
この場合、「成功」とは必ずしもよい結果を意味するのではなく、単に求めている結果が起きたことを意味する。
例えば、10個の機械部品の標本の中のいくつが欠陥品かを表す場合には、それぞれの部品は別個の試行と見なし、部品が欠陥品であればその試行は成功に分類される。
二項分布は、所定の全体的な推定欠陥率の場合に、10個の標本の中の特定の数の部品が欠陥品である可能性を表す。
二項分布で表すデータは、以下の4つの要件を満たさなければいけない。
@各試行の結果は2つの互いに排反な結果のいずれかである。
A各試行は独立なので、ある試行の結果は他の試行の結果に影響を及ぼさない。
Bpで表す成功の確率は試行ごとに一定である。
Cnで表す固定数の試行がある。
二項分布で表せる種類のデータの例には、硬貨を10回投げたときの表の回数(表の出る確率はいつでも50%であるとわかっている場合)、65%が男性であるとわかっている大きな母集団から取り出した5人の標本における男性の数(母集団は、全体から5人を取り除いても男性の割合が目立って変化しないだけ十分に大きくなければいけない)、
欠陥率が1%であるとわかっている大きな母集団から取り出した20個の標本における欠陥品の数などがある。
特定の回数の試行での特定の成功回数の確率を求める式を以下に示す。
二項分布の公式
組合せの公式を以下に示す。
組合せは、n個の対象群から順番を無視してk個を選ぶ方法の数を表す。
二項公式を表記する際の括弧の書式は公式全体を読みやすくするために組合せを表す。
式中の記号!は階乗を意味する。
例えば、5!=5×4×3×2×1 = 120である。
nは試行回数である。硬貨を10回投げる場合、n= 10である。
kは成功回数である。p(0から1の間の数値)は成功の確率である。
偏りのない硬貨を投げて事象が表の場合、p= 0.5 (つまり、1回投げて表が出る確率は0.5 (50%))である。
二項公式は、試行ごとの成功確率と試行回数が一定の場合に特定の成功回数が得られる確率を計算するのに利用できる。
二項確率の簡略表記法はb(k;n,p)またはP(k = k;n,p)であり、
kはn回の試行での成功回数、pは各試行の成功確率である。
p= 0.4の20回の試行で2回成功する確率を計算したい場合、6(2;20,0.4)またはP( k = 2;20,0.4)と表記する。
図は2つの二項分布のグラフを表す(pとnのそれぞれの組合せで異なる分布が作成される)。
pが一定でnが増えるにつれ、二項分布は正規分布によく似てくる。
一般的な経験則では、npとn(1-p)の両方が5以上の場合、二項分布は正規分布で近似してもよい。
図はこの経験則に従うと次の計算から分布(p= 0.5、n = 40)には正規近似を適用できる。
np = 40(0.5) = 20、n(1-p)= 40(1 - 0.5) = 20
しかし、p= 0.1、n = 40の分布では次の計算から二項分布に正規近似を使うのは適さない。
np=40(0.1)=4
通常、二項分布に基づく複雑な計算は統計ソフトを使って実行するが、簡単な例でこの公式の働きを示す。
偏りのない硬貨を5回投げる場合、1回だけ表が出る確率はどのくらいだろうか。
「表」を成功とし、二項公式を使ってこの問題を解決する。
この例では、
p= 0.5 (偏りのない硬貨の定義は表と裏が同様に確からしいことである)
n = 5 (5回の試行を行っているため)
k = 1 (1回だけ成功する確率を計算しているため)
各試行の成功の確率が0.5の場合に5回の試行で1回だけ成功する確率は、以下の式のように計算する。
b(1 ;5,0.5)の計算
関連リンク