中心傾向を示す代表値:中央値で見るデータの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

セミナー案内             AIデータサイエンス動画           インスタグラム

中心傾向を示す代表値:中央値で見るデータの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

中心傾向を示す代表値:中央値で見るデータの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】
中央値は中心傾向を示す代表値で、データの分布を二等分し、それより大きいケースと小さいケースがそれぞれ50%になる点です。極端な値に強い影響を受けず、平均値より実際の代表値としての役割を果たすことが多いです。中央値の算出は、データを降順に並べ、中央の値を選ぶことで行われ、偶数個のデータセットの場合は中央二つの値の平均が中央値になります。この計算法は、極端な値の影響を受けにくいため、データをより適切に代表する値として機能します。中央値は、データセットの50パーセンタイルに相当し、得点分布の中央に位置します。

中心傾向を示す代表値:中央値で見るデータの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】▼▼▼▼▼▼▼▼
チャンネル登録はこちら


目次  中心傾向を示す代表値:中央値で見るデータの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


中心傾向の測度としての中央値の計算法


中央値は、中心傾向のもう一つの測度で、代表値の一種です。


中央値は、それよりも大きなケースが50%、小さなケースが50%となるような、データの分布中の点でもあります。


中央値は、しばしばMdという略語を用いて表されますが、Mと表現されることもあります。


中央値を算出するには、以下の段階を踏みます。


@すべての数値について、最大値を最初あるいは一番上にして、以下のように降順に並べる


87、72、65、45、23


A中央の得点を選びます。この場合、三番目の得点であり、中央値は65です。2つの得点がそれより前にあり、2つの得点がそれより後にあります。


データが偶数個の得点から成る場合、中央値は、真ん中の2つの得点の算術平均になります。


たとえば、87、72、67、65、45、23の場合、中央値は67と65の平均、すなわち66となります。



極端な得点の影響を緩和した代表値


中央値は中心傾向の興味深く有用な測度ですが,それには1つ理由があります。


中央値は,極端な値に対して鋭敏ではなく,極端な値を含むデータにおいては,平均値よりも本当の代表値としてのイメージをより明確に与えてくれるからです。


私たちは,平均値であろうと中央値であろうと最頻値であろうと,データから最も代表的な得点を代表値として得たいということです。


たとえば。以下のデータには極端な得点が1つ含まれています。


107、30、28、25、24


平均値は42.8 (214/5)であり,中央値は28です。


極端な得点(107)が,平均値を上方に引き寄せています。


一方,中央値は28であり,このデータを代表するのによりふさわしい値になっています。


中央値を使うことで,極端な得点の影響を緩和することができます。


最後に,中央値は,データに含まれる値をすべて使って計算するのではなく,データの個数に基づいた順位に対応して決まる1つの値(つまりちょうど真ん中の値)がすべてです。


中央値は,常に50パーセンタイル,あるいは得点分布を二等分する点です。



中心傾向を示す代表値:中央値で見るデータの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


セミナー詳細                    解析ご相談                    LINEでお友達

中心傾向を示す代表値:中央値で見るデータの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

中心傾向を示す代表値:中央値で見るデータの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】