統計学における最頻値【統計解析講義基礎】

統計学における最頻値【統計解析講義基礎】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

統計学における最頻値|【統計学・統計解析講義基礎】

統計学における最頻値【統計解析講義基礎】


目次  統計学における最頻値【統計解析講義基礎】

 

 

統計学における最頻値

 

最頻値とは

 

最頻値は,データの中で最もたくさん現れる値であり,値の出現回数(度数)を数え,最も出現回数の多い値を特定することによって計算されます。

 

たとえば,以下のデータを見てみましょう。

 

ここでいう値は,個々の結果に対して与えられたラベルのことです。

 

この場合は,異なる色です。

 

統計学における最頻値【統計解析講義基礎】

 

それぞれの値の度数を数えると,以下のようになります。

 

統計学における最頻値【統計解析講義基礎】

 

最も多く現れる値は青なので(9回現れている),最頻値は青です。

 

最頻値に関して最もよく見られる誤りの1つは,値それ自体ではなく,値の出現回数を最頻値として報告してしまうことです。

 

上記の例では,最頻値は9ではなく最も多く現れる値,すなわち青です。

 

最頻値に関して覚えておくべき1つの重要な点は,データのすべての値が同じ度数の場合は,そのデータには最頻値はないということです。

 

また,データは複数の最頻値を持つ場合があり、2つの最頻値がある場合,値の分布は双峰分布と言われます。

 

 

最頻値をどのように使うのですか

 

最頻値は,値それ自体ではなく,値が現れる度数を扱っているので,中心傾向の測度として最も精密ではありません。

 

しかしながら,一群のラベルを代表する最も中心的な値を算出する場合には、中心傾向の測度として最頻値が最も適切です。

 

たとえば,次は。5つの異なる政党に所属しているメンバーの数のリストです。

 

統計学における最頻値【統計解析講義基礎】

 

この例では,最頻値は最も度数が大きい政党Dです。

 

次の双峰型の例では,度数が最大となる政党が2つあります。

 

統計学における最頻値【統計解析講義基礎】

 

政党Aと政党Dはともに同じ度数であり,この分布では2つの最頻値があります。

 

したがって,この分布は双峰型です。

 

統計学における最頻値【統計解析講義基礎】

 

図のように,双峰分布には,2つの「高い点」,あるいはこぶがあります。

 

 

統計学における最頻値【統計解析講義基礎】


セミナー詳細                    解析ご相談                    LINEでお友達

統計学における最頻値【統計解析講義基礎】

統計学における最頻値【統計解析講義基礎】