平均・中央・最頻値：非対称度数分布の秘密【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

平均・中央・最頻値：非対称度数分布の秘密【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】
度数分布が対称的なとき、平均値と中央値はほぼ一致するが、非対称の度合いが強いと中央値は最頻値よりも大きくなり、平均値と最頻値の間に無理やり割り込む形となる。各値は分布の中心を示す。中央値は異常値の影響を受けにくいため、安定したデータ解析に適しており、傾向的な変化を捉えやすい。一方、最頻値は特定しにくく、データが少ないとその決定が困難である。これらの統計量は、それぞれの場において異なる利点を提供する。

▼▼▼▼▼▼▼▼
チャンネル登録はこちら

目次平均・中央・最頻値：非対称度数分布の秘密【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

最頻値と平均値の間に中央値

中央値は異常値に影響されない

特定しにくい最頻値

最頻値と平均値の間に中央値

度数分布が対称型に近ければ、平均値と中央値はほぼ一致します。

たいていの度数分布は、山が一つで分布が左寄りの非対称型ですが、このときの中央値は平均値よりも小さくなります。

非対称の度合いが著しいほどそうなります。

しかし、このときの中央値は最頻値よりは大きいです。

したがって、平均値と最頻値の狭い隙間に中央値が無理に割り込んだ形になります。

逆Ｊ型分布の場合も同様です。

どの値も同じように、度数分布の中心の位置を表す特性値の役割をもっています。

そして、狭いところで押し合いながら、それぞれの居場所を譲らずに主張しているのが、どれに声援をおくるわけでもないですが、なんともユーモラスです。

中央値は異常値に影響されない

ところで、どれに声援をおくるわけでもないと述べましたが、中央値の特筆すべき特徴は、異常値にまったく影響されないことです。

端のほうのデータがどのように動こうとも、真ん中辺のデータの順位にとっては痛くもかゆくもないからです。

この意味で、データの個数が少ないときは、異常値に左右されてブレやすい平均値よりは、中央値を用いたほうが安定していてよいのです。

読者の手もとに、月別とか週別の継続的な記録があるとき、平均値と中央値とを、すこし長い期間についてそれぞれ計算して、月（週）変化をあらわすグラフを描いてみるといいでしょう。

中央値のほうが、安定度合いがすぐれていること、そして傾向的な変化をとらえやすいことが容易に納得できます。

特定しにくい最頻値

最頻値はどうか。

データの多数派みたいなもので、これも異常値に強いです。

他がいくら動いても、それによって新たな多数派が現れない限り安泰なのです。

ただ、データ個数が少ないときは、みなバラバラで、もっとも多い値はどれかといわれても困ります。

たまたま同じ数字が２個あった、だからそれが最頻値だというわけにもいきません。

傾向的に多数を占めていてほしいのです。

また、度数分布が描けても、いままで見たように、たいてい分布の天辺（てっぺん）はフラットです。

そのため、最頻値がどこかを精密に特定するのは困難です。

「まあ、データはだいたいこの辺りに集中してますな」と、説明はそれなりにわかりやすいのですが、そのあとが続かず、以後こまかいデータ分析に最頻値を駆使する、というわけにはいかないのです。

関連リンク

Pythonの開発環境Jupyter

研究デザインの理解の重要性

メタアナリシスにおけるばらつきと信頼区間

無料ツールを使って自力で分析が可能

統計学的意思決定に役立つ情報処理

統計的データ分析は科学の基礎

p値と基準率の誤り

統計学における確率変数と確率分布

統計学は今後ますます必要

クラウンデッド・セオリーの研究例

1

2

3

4

5

6

平均・中央・最頻値：非対称度数分布の秘密【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【トップページへ戻る】
【YouTubeChannel】
【統計解析講義基礎】
【統計解析講義応用】
【ChatGPT・Python・Excel】
【多変量解析】
平均・中央・最頻値：非対称度数分布の秘密【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【医療統計解析】

平均・中央・最頻値：非対称度数分布の秘密【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【社会経済統計】
【ビジネス統計】
【AI・デジタル】
【統計解析コラム】
【統計解析用語集】
【統計解析セミナー】
平均・中央・最頻値：非対称度数分布の秘密【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【お問い合わせ】

セミナー詳細解析ご相談 LINEでお友達

平均・中央・最頻値：非対称度数分布の秘密【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

平均・中央・最頻値：非対称度数分布の秘密【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

最頻値と平均値の間に中央値

中央値は異常値に影響されない

特定しにくい最頻値

メニュー

サブメニュー

最新記事