どんなデータも正規分布に!中心極限定理の魔法【ChatGPT統計解析】
中心極限定理は統計学の基本的な原理であり、元の分布がどのような形状であっても、その分布から無作為に多数の標本を抽出し平均を取ると、標本平均の分布は正規分布に近づくと述べています。これは、正規分布でない歪んだデータにおいても同様で、標本平均は正規曲線の形を取ります。この性質により、歪んだ分布のデータに対しても、推測統計のルールを適用することが可能になり、統計的推測の方法が広く有効であることを示しています。中心極限定理の存在は、記述統計および推測統計における多くの基本的概念が正規分布の性質に基づいているため、特に重要です。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
中心極限定理
記述統計および推測統計を支える基本的概念の多くは、正規曲線(ベル曲線)の形と性質に基礎をおいています。
しかし、分布が歪んでいるなど、データの分布が正規分布でなかったらどうでしょうか。
同じ推測ルールが適用できるのでしょうか。
答えはイエス、つまり適用できます。
歪んだ分布から抽出した標本平均の分布も正規分布
中心極限定理により、ほとんどのデータの分布に対して、推測統計のルールを適用することができるのです。
中心極限定理は、正規分布でないデータにおいても、その分布から標本抽出を繰り返したとき、標本平均の分布は正規分布となるということを述べています。
たとえば、1から5の値をとる100個のデータがあり、度数が観測された(たとえば、1という値は25回)とします。
これらのデータをプロットし、この100個のデータから大きさ5の無作為標本をとり出して、平均値を計算します。
次に、もう一度別の無作為標本をとり出します。
こうして、大きさ5の標本を何百も抽出し、それぞれについて平均値を計算して、その値をプロットします。
すると、この分布は正規曲線と類似した多くの特徴をもっています。
ベル型のような形をしており、左右対称であり、抽出される平均値の数がたとえ無限になっても、分布の裾はx軸に接しないことがわかっています。
ここで学ぶべきは、もとになる分布(ほとんどの場合、標本を抽出する母集団)の形がどのようなものであっても、標本平均の分布は正規分布に近づくということであり、これは統計的推測の方法が意味を成すために必要なことなのです。
関連リンク