Python・R・エクセルによるデータサイエンス | 統計解析講義

記述統計でスムーズなコミュニケーション【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

記述統計でスムーズなコミュニケーション【統計解析講義基礎】

記述統計でスムーズなコミュニケーション【統計解析講義基礎】


記述統計でスムーズなコミュニケーション【統計解析講義基礎】

記述統計でスムーズなコミュニケーション

記述統計は、推測統計と並んで統計解析の2本柱の一つです。

 

記述統計は文字通り、データをいかにして記述するかについての統計解析です。

 

人にわかりやすく説明することを主眼としています。

 

私たちはデータに囲まれて生活していますが、多くの場合、データの羅列というのはわかりにくいです。情報量が多すぎるのです。10個や20個のデータならまだしも、何百というデータの場合、それをただ眺めていても、何が言えるか判断するのは難しいです。

 

そこで、データを要約してまとめることが必要になります。

 

 

要約統計量

 

では、データを要約してまとめるにはどうすればよいか、それには、要約統計量というものに置き換えるという方法があります。

 

簡単な例が平均です。

 

たくさんあるデータを平均として表現すれば、それを代表値として認識することができます。

 

代表値だけでなく、ばらつきも説明したいという場合は、標準偏差を示せばよいでしょう。

 

平均、標準偏差、いずれも要約統計量ですが、最低限この2つがあれば、代表値のまわりにどんなばらつきで分布しているかをイメージすることができます。

 

例えば平均が10、標準偏差が2という場合、
代表値が10で、そのまわりすなわち、8〜12の範囲にデータの68%を含むばらつきの分布である、とイメージすることができます。

 

たくさんあるデータを、平均と標準偏差でまとめることにより、データをイメージすることができます。

 

また、報告書を作成したり、人に話して伝えたりする上でも、要約統計量でまとめておくと簡単であり、コミュニケーションが円滑に進みます。
記述統計にはもう一つの重要な機能があります。それはデータのグラフ化、可視化です。

 

データの可視化

 

表でまとめられたデータというのは、私たちは解りにくいですが、これを散布図で表現すれば、データの特徴が一目でわかります。

 

例えば散布図が右上がりの挙動を示している場合は、これら2変数の間に相関があるとかないとかを視覚的に判断することができますが、表を見ているだけではわかりません。

 

また、散布図では外れ値を発見しやすいですが、表を見て外れ値を発見するというのは難しいでしょう。

 

また、300人の入院患者の年齢のデータが羅列してあるときは、平均をとってもよいのですが、もっと有効な手段が度数分布表、ヒストグラムです。

 

記述統計でスムーズなコミュニケーション【統計解析講義基礎】

 

15歳〜20歳が35人、50歳〜55歳が121人、70歳〜75歳が23人といったように各年齢層にどれだけの人数がいるか、一目でわかります。

 

小児が多ければ小児科医を増やそうとか、高齢者が多ければ認知症外来を増設しようとか、経営判断に結びつけることができます。

 

記述統計の手法をたくさん知っておくと、相手にわかりやすく伝えることができるので、人とのコミュニケーションが円滑に進みます。また報告書作成なども効率よく進めることができます。

 

是非、記述統計の手法を身につけましょう。

セミナー詳細こちら                    解析ご相談こちら


 

 

記述統計でスムーズなコミュニケーション【統計解析講義基礎】

記述統計でスムーズなコミュニケーション【統計解析講義基礎】

記述統計でスムーズなコミュニケーション【統計解析講義基礎】