Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における歪みと尖りとは【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における歪みと尖りとは【統計解析講義基礎】

統計学における歪みと尖りとは【統計解析講義基礎】


統計学における歪みと尖りとは【統計解析講義基礎】

 

データの分布すべてが、完全に正規分布となるわけではありません。

 

実際、正規型に近いデータは多いですが、異なった分布になるデータも多いです。

 

分布は歪むことがあります。

 

すなわち、分布の片方の裾がもう片方の裾よりも長くなり、対称性を欠く分布となる場合があります。

 

大きな値が小さな値よりも多いときのように、分布の左側の裾が右側よりも長いとき、分布は負に歪んでいると言います。

 

たとえば、プロバスケットボール協会に所属する75人の選手(彼らは非常に背が高い)を含む、100人の大人の身長の分布を考えることができます。

 

小さな値が大きな値よりも多いときのように、分布の右側の裾が左側よりも長いとき、分布は正に歪んでいると言います。

 

たとえば、クラスの4分の1だけが準備のための適切な教材を与えられたテストでの得点(受験者のほとんどは予想よりも悪い成績になる)の分布を考えることができます。

 

データの分布についてのもう1つの違いは、平坦さ、あるいは、尖りの程度です。

 

ある分布は他の分布よりも平坦となっている場合を想定します。

 

尖り具合の大きい分布は、データが分布の中央付近にまとまっており、極端な値は少なくなっています。

 

このような状況になるのは、テストでの全員の得点が平均値にとても近いときのように、データの変動が比較的小さいときです。

 

尖り具合の小さい分布では、データの分布は正規分布に比べて平坦であり、データは全体にわたって等しく散らばる傾向にあります。

 

たとえば、全員がほぼ同じくらいよい点数(あるいは、全員がほぼ同じくらい悪い点数)で広がりがないような最終試験の得点分布は、正規分布や、大多数が平均点にとても近い点数であり、かつ裾があるような分布に比べ、尖度が小さくなります。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学における歪みと尖りとは【統計解析講義基礎】

統計学における歪みと尖りとは【統計解析講義基礎】

統計学における歪みと尖りとは【統計解析講義基礎】