レンジから標準偏差を見極める30秒テクニック【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

セミナー案内             AIデータサイエンス動画           インスタグラム

レンジから標準偏差を見極める30秒テクニック【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

レンジから標準偏差を見極める30秒テクニック【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】
レンジと標準偏差の関係について、データの個数が少ない場合(3〜5個)では、標準偏差はレンジの約半分になります。データの個数が10個前後の場合は、標準偏差はレンジの約3分の1となります。この関係を利用すると、標準偏差の計算の手間を省けることがあります。例えば、1日に飲むコーヒーの量の最大値と最小値がわかれば、そのレンジから標準偏差を推定することができます。また、データが正規分布している場合、±1標準偏差の範囲内には約68%のデータが含まれ、±1.96標準偏差の範囲内には約95%のデータが含まれます。これらの値は、データ解析において基本的な理解を助け、効率的なデータ処理を可能にします。

レンジから標準偏差を見極める30秒テクニック【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】▼▼▼▼▼▼▼▼
チャンネル登録はこちら


目次  レンジから標準偏差を見極める30秒テクニック【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


レンジ(範囲)と標準偏差:標準偏差はレンジの約2-3分の1


標準偏差は、もとのデータのバラツキの度合いの何を、どのように表しているのでしょうか。


言い換えれば、この標準偏差の大きさから、データのバラツキをどのように読み取れるでしょうか。


計算さえすれば、分散でも標準偏差でも、一応出てきます。


しかしその結果の数字の意味がいまひとつピンときません。


したがって、「標準偏差が理解できた」という人の大部分は、計算の手続きがわかったにすぎない場合が多いです。


一方、「レンジ」は具体的意味を持っていました。


レンジは最大値と最小値の差なので、これはわかりやすいです。


では、このレンジと標準偏差とには関係があるのでしょうか。


あるとすればどんな関係でしょうか。


完全な1対1の対応関係はありませんが、両者にはおおよそ次のような関係があります。


@データ個数n=3-5くらいのとき、標準偏差はレンジの約2分の1


Aデータ個数n=10前後のとき、標準偏差はレンジの約3分の1


本当は、もっと精密な数表があるのですが、ここではこの程度に理解しておきましょう。


この関係を用いれば、標準偏差の計算の煩わしさを回避することができます。


たとえば、コーヒー好きの友人数人が集まって、1日何杯のコーヒーを飲むかという話をしていて、最大が10杯、最小が2杯だとすると、


すぐレンジの8÷3=約3と暗算して、標準偏差は3杯くらいと見当がつきます。


あとでExcelで標準偏差を計算してみると、だいたい合っています。


ただし、データ個数が多くなるにしたがって、レンジでは無視されるデータ数が増えてくるので、両者の関係はうすくなります。



度数分布と標準偏差


では、原データの分布と標準偏差との関係はどうか。


ある計算実験を行ってみましょう。


以下のデータで、平均値標準偏差を計算してみましょう。


122, 126, 123, 125, 123, 128, 123, 127, 125, 128


計算すると、


平均値=125
標準偏差=2.2


となります。


ここで、下限=m−σ、上限=m+σ


として、この幅をとります。


すると、


122.8から127.2の幅になります。


この幅の中には、


126, 123, 125, 123, 123, 127, 125


の7個のデータがあります。


つまり、±標準偏差の中に、約7割のデータが入っているのです。


データが正規分布をしているならば、±標準偏差の中に68.3%のデータ(約68%)が入っていることになります。


この68という数字は覚えておくとあとあと非常に便利です。


ついでに、データが正規分布をしているならば、±1.96×標準偏差の中に95%のデータが入っていることになります。


よく教科書ではこれを標準偏差の2倍と解説していますが、2ではなく1.96で覚えましょう。


1.96倍にするとちょうど95%になるからです。



レンジから標準偏差を見極める30秒テクニック【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


セミナー詳細                    解析ご相談                    LINEでお友達

レンジから標準偏差を見極める30秒テクニック【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

レンジから標準偏差を見極める30秒テクニック【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】