Python・R・エクセルによるデータサイエンス | 統計解析講義

母集団および標本【統計解析コラム】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

母集団および標本【統計解析コラム】

母集団および標本【統計解析コラム】


母集団および標本【統計解析コラム】

 

一人一人が朝食のために何カロリーを食べましたか?

 

今日、誰もが家からどのくらい離れたところを旅行しましたか。

 

家庭と呼ばれる場所はどれくらい大きいでしょうか?

 

他の何人が家に帰ると呼んでいる?

 

この情報のすべてを理解するためには、ある種のツールと考え方が必要です。

 

統計学と呼ばれる数学科学は、この情報過負荷に対処するのに役立つものです。

 

統計学は、データと呼ばれる数値情報の研究です。

 

統計家はデータを獲得し、組織化し、分析します。

 

この工程の各部分についても精査します。

 

統計学の手法は、他の多くの知識分野に適用されます。

 

以下に、統計学を通しての主なトピックのいくつかを紹介します。

 

母集団および標本

 

統計学の繰り返しのテーマの1つは、そのグループの比較的小さな部分の研究に基づいて、大きなグループについて何かを言うことができるということです。

 

集団全体を集団と呼び、我々が研究するグループの部分はサンプル、つまり標本と呼びます。

 

その一例として、米国に住む人の平均身長を知りたいと思ったとしましょう。

 

私たちは3億人以上を測定しようと試みることができたが、これは実行不可能です。

 

だれも見逃さず、誰も数えられないような方法で測定を実行するのは、ロジスティックな悪夢です。

 

米国のすべての人々を測定することは不可能であるため、代わりに統計を使用することができます。

 

集団内のすべての人々の身長を見つけるのではなく、数千の統計的標本をとります。

 

集団を正しくサンプリングした場合、サンプルの平均身長は集団の平均身長に非常に近くなります。

 

データの取得

 

良好な結論を導き出すためには、われわれが協力するための良好なデータが必要です。

 

このデータを得るために集団を標本化する方法は、常に精査すべきです。

 

どのような標本を用いるかは、母集団についてどのような質問をしているかによって決まります。

 

最も一般的に標本に使用される手法は以下です。

 

単純ランダム
層別
クラスター化

 

標本の測定がどのように行われるかを知ることも同様に重要です。

 

前述の例に立ち返ると、標本中の高さをどのようにして獲得するのでしょうか。

 

自身の身長をアンケートで報告させていますか?

 

全国各地の複数の研究者が異なる人々を測定し、その結果を報告していますか?

 

一人の研究者が、同じテープメジャーで標本中の全員を測定しますか?

 

これらのデータ取得方法にはそれぞれ長所と短所があります。

 

この研究のデータを使っている人は誰でも、それがどのようにして得られたかを知りたいと思うでしょう。

 

データの整理

 

時には多数のデータがあり、われわれは文字通りすべての詳細を失うことができます。

 

木のために森を見るのは難しいです。

 

だからこそ、私たちのデータをきちんと整理しておくことが重要なのです。

 

データの慎重な組織化とグラフ表示は、実際に何らかの計算を行う前に、パターンと傾向を特定するのに役立ちます。

 

なぜなら、私たちのデータをグラフ化する方法は、さまざまな要因に左右されるからです。

 

一般的なグラフは以下の通りです。

 

パイチャートまたは円グラフ
棒グラフやパレートグラフ
散布図
時間プロット
幹葉プロット
箱とひげのグラフ

 

これらのよく知られたグラフに加えて、特殊な状況で使用されるものもあります。

 

記述統計

 

データを分析する1つの方法は、記述統計と呼ばれています。

 

ここでの目標は、我々のデータを記述する量を計算することです。

 

平均値、中央値およびモードと呼ばれる数字はすべて、データの平均または中心を示すために使用されます。

 

範囲と標準偏差は、データがどのように広がっているかを表すのに用いられます。

 

相関や回帰のようなより複雑な手法は、対になったデータを記述します。

 

推測統計

 

まず、標本から始めて、個体群について何かを推測しようとすると、推測統計を使います。

 

この統計学の分野を扱うにあたり、仮説検定の話題が生じます。

 

ここでは、仮説を述べるように、統計学の主題の科学的性質を見てみましょう。

 

次に、標本とともに統計学的ツールを用いて、仮説を棄却する必要があるか否かを決定します。

 

この説明は、統計学のこの非常に有用な部分の表面を実際に引っ?くだけです。

 

統計の応用

 

統計学の道具はほとんどすべての科学研究分野で使われていると言っても過言ではありません。

 

統計に大きく依存している領域は複数あります。

 

心理学
経済
医学
広告
人口統計学

 

統計学を数学の一分野と考える人もいますが、数学に根ざした学問として考えるほうがよいでしょう。

 

具体的には、統計は確率として知られる数学の分野から構築されます。

 

確率は、ある事象がどのくらい起こりそうかを決定する方法を与えてくれます。

 

また、ランダム性について話す方法も与えてくれます。

 

典型的な標本は母集団から無作為に選択する必要があるため、これは統計の鍵となります。

 

確率は1700年代にPascalやFermatのような数学者によって最初に研究されました。

 

1700年代もまた、統計の始まりでした。

 

統計学は確率論の根源から成長し続け、今日では、数学的統計として知られるものにおいて、理論的範囲が拡大され続けています。

 

セミナー詳細こちら                    解析ご相談こちら


 

母集団および標本【統計解析コラム】

母集団および標本【統計解析コラム】

母集団および標本【統計解析コラム】