Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学におけるバラツキ【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学におけるバラツキ【統計解析講義基礎】

統計学におけるバラツキ【統計解析講義基礎】


統計学におけるバラツキ【統計解析講義基礎】

人生いたるところにバラツキあり

 

体型が同じだと、混んでいる電車に乗っているとき、肩と肩、尻と尻がぶつかりあって、窮屈で困るでしょう。

 

それぞれ体型が異なるから、満員電車にあんなに詰めこむことができるので、みなが同じ寸法、格好ではそうはいきません。

 

もっとも乗車効率がよいのは、つまりたくさん詰めこむことができるのは、男女半々のときだそうです、という記事を読んだことがあります。

 

女性の体型が三角形、男性の体型が逆三角形になっていて、すきまなく詰め込むからであるといいます。

 

ほかに陰陽説、引力説、心理説といろいろありました。どの説も眉唾の感じはあります。

 

ここで言いたいことは、すべてのデータにはバラツキがあるということです。

 

果物屋の店主は、できるだけバラツキが小さくなるように選んで、果物を高く積み上げたり、小皿に並べたりします。

 

反対に客のほうは、些細なバラツキを発見して果物を選ぼうとします。

 

中年のおばさんなど、あちこちさわるものだから店主は渋い顔をしています。

 

バラツキをめぐるちょっとした駆け引きは日常至るところにあります。

 

バラツキの効用

 

地球上における生物の種類は何百万種にもおよぶといいます。

 

材料は同じ遺伝子のもととアミノ酸その他であるのに、神はよくそれだけの変種を設計したものだと感心します。

 

形だけとってみても、どんな想像力豊かなイラストレーターもおよばない種がいくらでもいます。

 

なぜそんなに種のバラツキが大きいのでしょうか。

 

地球の資源を最大限に活用するためです。

 

種によって違うものを食物とし、それぞれ違う環境が住みやすいように作られています。

 

できるだけ競合関係を小さくするねらいです。

 

したがって、極寒の極地、炎熱の砂漠、常闇の深海にさえ適応した生物がいるのです。

 

このようなバラツキの効用は、人間関係だけをとってみても納得できます。

 

若い人が好きなタイプの相手を選ぶのも、会社が人材を集めて発展するのも、世の中が異なる意見の活力で進歩するのもそうです。

 

バラツキのない世界を考えると気味が悪いともいえます。

 

コピー人間が遺伝子操作で可能になるらしいですが、想像しただけで不気味です。

 

体型くらいなら似ていてもよいですが、考えること、なすことのすべてが一緒だったらどうなることでしょう。

 

バラツキがないと困る例としては、以下があります。

 

@出勤時にバラツキがあるからラッシュが多少は軽減される

 

A好みの異性が好き好きだから血をみないですむ

 

Bジグゾーパズルの何百何千という多数のピースの形がそれぞれ異なるからこそ、ただひとつのパズルの解が得られる

 

バラツキという名の特性値

 

たくさんの個別データが持っている情報をできるだけ減らさないで、統計データとしてまとめるには、度数分布がもっともすぐれています。

 

ところがそれらの分布データをまとめて、ただ1個の統計データである平均値としてしまうと、もとの情報が著しく失われてしまいます。

 

度数分布の特性値として、平均値だけではダメで、分布の広がりを表す特性値も最低必要です。

 

分布の広がりとは、個々のデータのバラツキのことです。

 

もっともこの言葉は、工場での製品検査などで使われ出したものらしいです。

 

バラツキという言葉の感じからは、データ個数があまり多くない場合のほうが適切なような気がします。

 

一方、データの広がりというときは、データ個数の多い度数分布を想定してしまいます。

 

もちろん単なる言い回しの違いです。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学におけるバラツキ【統計解析講義基礎】

統計学におけるバラツキ【統計解析講義基礎】

統計学におけるバラツキ【統計解析講義基礎】