データの傾向を検定しよう|【ビジネス統計学・統計解析】
データの傾向を検定しよう
P値を利用したt検定
データの傾向を統計学的な手法で調べる
データに見られる傾向が、偶然の産物ではなく本当の傾向なのかを統計的な手法によって調べる方法を、統計的仮説検定と言います。
データは常に誤差による揺らぎを含んでいるため、統計的に誤差を補正することで、傾向値が本当にあるのかを確かめます。
最も一般的な方法は、t検定です。
2つのグループの平均値を比較して、等しいのか差があるのかを判断する仮説検定です。
t検定では、2つのグループの平均値を比較できます。
この仮説検定を行うときには、P値を使って判断します。
P値は「傾向がないと仮定したときに、今回の傾向が出る確率」を表しています。
そのため、P値が小さいほど、その仮定が間違っている可能性が高くなります。
慣習的にP値が5%を切ると、「傾向がないという仮定」が間違っていたと判断します。
しかし、P値は統計学的に難しい性質を持っており、データの多さや集め方によって変化することが知られています。
P値を正しく解釈することは、統計学に精通した専門家でも難しいことです。
ビジネスシーンでは、あくまでもひとつの目安として利用することをおすすめします。
ビジネスシーンで仮説検定を行うときは、P値よりも平均値やデータの動き方を解釈することが重要です。
関連記事