Python・R・エクセルによるデータサイエンス | 統計解析講義

数字から受ける印象の統計学【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

数字から受ける印象の統計学【統計解析講義基礎】

数字から受ける印象の統計学【統計解析講義基礎】


数字から受ける印象の統計学【統計解析講義基礎】

 

数字自体には、その値以上の意味はありませんが、人間では自分の常識や感覚と比較することによって、勝手な印象をもつものです。

 

逆に、どのような印象を与えるかを考えて、数字を公表するという手が使われることもあります。

 

次のような表現について、どのような問題があるかを考えてみましょう。

 

@この宝くじには、1等1億円の当たりくじが100本入っています。

 

A高速道路の入り口の表示 環状線までの所要時間:70分

 

B以下の2つの表現は、どちらが適切かを考えてみてください。

 

A:平成22年国勢調査によると、日本の人口は128,057,352人、65歳以上の人口は29,245,685人である。

 

B:平成22年国勢調査によると、日本の人口は約1億2805万人、65歳以上の人口は約2925万人である。

 

@ 宝くじの広告によく書かれている表現ですが、そのくじが何本発売されたかがわからなければ、100本の当たりというのが多いのか少ないのかはわかりません。

 

A 分という単位には、短い時間という印象があります。70分と書いてあるほうが1時間10分と書いてあるより短く感じます。

 

B よく、演説などで細かい数字を並べたてて、数字に強いところを見せようとする人がいます。しかし、1億人の人口の最後の一桁にどれほどの意味があるのでしょうか。通常はBのような表現で十分です。

 

何を表現する数字なのか

 

日常見かける数字は、現実の何かを数字で表したものです。

 

ですから、その「現実の何か」が何であるかを見誤ると、まったく意味のない数字になってしまいます。

 

次のような表現について、どのような問題があるか考えてみましょう。

 

@あるいくつかの食料品販売店を調査したところ、全体の3%の商品について、内容量が表示されている量に足りない、という不正が発見されました。したがって、消費者は平均して3%損をしていることになります。

 

A1時間あたりに発生する交通事故件数は、朝と夕方が多い。朝や夕方の時間帯には、何か生理的に事故を起こしやすい原因があるのではないでしょうか。

 

B日本での実際のデータによると、たばこを1日に20本吸う人は、1本も吸わない人に比べて10倍肺がんで死亡しやすい。

 

@ここでいう3%というのは、商品全体の数のうち、量目不足があった商品の数であって、量目不足があった商品が「いくら不足だったか」については何も述べていません。ですから、消費者がいくら損しているかわかりません。

 

A1時間あたりで考えれば、朝と夕方は走っている自動車の数が多いわけですから、事故が多いのは当たり前です。事故を起こしやすい原因があるのか、を考えるには、走っている自動車の台数あたりで考える必要があります。

 

B肺がんは非常に珍しい病気で、1年間に肺がんにかかる人が10人くらいしかいないのなら、たばこを吸っても吸わなくても肺がんにかかる人はほとんどいないわけで、10倍といってもたいした意味はありません。

 

これが、たばこを吸って肺がんにかかる人が100万人、吸わなくてかかる人が10万人だとしたら、たばこを吸うことはたいへん危険です。

 

10倍というだけでは、たばこが危険かどうかはわかりません。

 

なお、設問の記述は、愛知県がんセンター中央病院のウェブサイト「がんの知識」に出ていたもので、そこでは平成19年の日本人の肺がん死亡者が65,576人であることも書かれています。

 

したがって、たばこを吸うことはかなり危険であるとはいえます。

セミナー詳細こちら                    解析ご相談こちら


 

数字から受ける印象の統計学【統計解析講義基礎】

数字から受ける印象の統計学【統計解析講義基礎】

数字から受ける印象の統計学【統計解析講義基礎】