Python・R・エクセルによるデータサイエンス | 統計解析講義

図や表の見方の統計学【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

図や表の見方の統計学【統計解析講義基礎】

図や表の見方の統計学【統計解析講義基礎】


図や表の見方の統計学【統計解析講義基礎】

 

図や表の中に何を読み、何を推論するか、図や表をどう考えるかはとても大切です。

 

また、これは一見やさしいようで難しいです。統計分析は確かにデータ(原データ)に基づきますが、実際にはデータだけを見ても傾向や法則はわからないことが多いです。

 

データが大量にあるとなおさらです。

 

したがって、その中の情報のエッセンスを図や表に要約することが大切です。

 

図や表は「データのまとめ方」の一つです。

 

図や表は、原データにかわるものとして実際に示されます。

 

図や表が適切に作られていれば、これを正しく見ることで、元のデータの情報が伝わります。図や表が誤用されたり内容が歪曲されたりしたものであるならば、それに影響されてはならず、見破らなければなりません。

 

図は単なるアクセサリーにように決して軽視してはならず、またこれを信じすぎてもいけません。

 

見る人は冷静に注意しながら「グラフを読み」「数字を読み」しなければなりません。

 

目的

 

図や表にすることにどのような目的があるのでしょうか。

 

いろいろのケースがあります。

 

@変化 例:大気汚染濃度の変化、ドル為替相場のグラフ

 

A比較・対比 例:日米区画、与野党の比較、使用前・使用後の比較、製造法の比較などの図示

 

B度数分布 例:世帯貯蓄額の分布(額で分類)

 

C関係 例:薬の投与対反応(用量対反応曲線)、入学前・後の成績関係(追跡調査)

 

D意思決定 例:統計的品質管理、作業の戦略的決定

 

E内訳表示 例:賛否理由、売上内訳

 

Fデータ分布 例:都道府県別経済成長率の表示、地域統計一般

 

G総合 上記@〜Fから結論を導く

 

Hその他

 

主体

 

誰(どのような主体)が作ったのか。見方の重要な要素です。

 

企業、官庁およびその外郭団体、マスコミ(新聞・雑誌、テレビ)、諸団体(NPO、NGOなど)、研究機関(大学・研究所)、個人グループ(同行グループ、インターネット上のグループ)、個人、海外からの翻訳データ等々です。

 

@企業をはじめとする利益団体のデータには、消費者には有用な情報が多いですが、広告・宣伝の動機が含まれていることが少なくありません(例:他社との性能比較)。

 

A官庁データにあっては、管轄(いわゆる官庁の縦割り行政)によって基礎となる定義が異なります(例:失業者と有効求人倍率の考え方の違い、また失業者には「求職しない者」を含めない、など)

 

Bマスコミのケースでは、社論、編集方針がデータ収集段階から入っていることもあります(例:選挙を「二大政党制」での選択と見なす、など)。

 

C研究者のデータは、利益の動機はありませんが、功名心の要素はあります。

 

D諸団体、個人グループ、個人にあっては、データ収集能力が十分でないケースも多々あり、客観性を評価する必要があります。

 

方法

 

どのように作成されたのでしょうか。

 

日常業務で集計されたデータか、自ら調査して得られたか(社会調査)、自ら測定・観察・観測して得られたか(自然科学、工学、医学)、資料収集の集計か、統計資料を利用したか(統計年鑑、官庁統計、データバンク)、マスコミ資料を利用したか、インターネット検索で収集したか、研究者の研究の引用か、自己の体験の計数化か、いろいろあります。

 

目的にふさわしい信頼できる方法を用いているかが最大の焦点です。

 

多くの場合、統計的信頼性よりは結論に重きが置かれ、結論も割り引いて「批判的に」受け入れる注意深さが求められます。

 

見方の重要ポイント

 

目的、主体、方法が「図表の見方」の3要素ですが、これはさらに一般的に「統計数字の読み方」に通じることがらです。

 

しかし、図にする、特にグラフ化されることには特有の注意点があります。

 

@特記事項(注意を引きたいことがら)がグラフ化されることが圧倒的です。グラフ化されていないことがらが何であるかについては十分注意しましょう。

 

Aグラフ化のテクニックには十分に注意しましょう。よくあるのは、縦軸の基準として描かれると2倍(20%)の増加のように錯覚されることです。

 

B同じく石油備蓄量(バレル)を、ドラム缶の絵文字で表現するように、計数の大小が忠実にグラフに反映するか否かが疑わしいケースがあります。「ビジュアル化」されたCG(カラーグラフィック)などはこの傾向が強くなります。

 

C量の差が小さい(A-Bが小さい)場合、視覚から「小さいが差はある」と判断しがちですが、A,B間に「有意な差はない」、「実質的にはA,Bは同じである」と判断されるケースも少なくありません。「有意」とは統計理論の用語です。

セミナー詳細こちら                    解析ご相談こちら


 

図や表の見方の統計学【統計解析講義基礎】

図や表の見方の統計学【統計解析講義基礎】

図や表の見方の統計学【統計解析講義基礎】