グラフ解読の極意:データの真実を見抜く【ChatGPT統計解析】
グラフの見方には、情報を正しく解釈し、誤った情報に惑わされないようにすることが重要です。データの大量な情報は図や表にまとめることで理解しやすくなりますが、その適切さや誤用にも注意が必要です。グラフを使う目的は変化、比較、関係などさまざまです。また、データの出所によっては偏りや動機が含まれることがあるため、企業や官庁、マスコミ、研究者などの主体に注意し、信頼性を評価する必要があります。グラフ化のテクニックには、縦軸の基準点移動や視覚的表現の不正確さに注意することが求められます。データの解釈には、統計的な有意性も考慮する必要があります。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
グラフ(図)の見方(assessing the figures)
グラフ(図)の中に何を読み、何を推論するか、グラフをどう考えるかはたいへん大切であり、またやさしいようで難しい。
統計分析はたしかにデータ(原データ)に基づくが、実際にはデータだけを見ても傾向や法則はわからないことが多い。
データが大量だからである。
したがって、その中の情報のエッセンスを図、表に要約(縮約)する。図も「データのまとめ方」の一つである。
このことから「図」は(表も)、事実上原データにかわるものとして示される。
図が適切に作られていれば、これを正しく見ることで、元のデータの情報が伝わる。
図が誤用されたり内容が歪曲されたものあるならばそれに影響されてはならず、これを見破らなければならない。
図は単なるアクセサリーのように決して軽視してはならず、またこれを信じすぎてもいけない。
見る者は冷静に注意しながら「グラフ読み」、「数字読み」しなければならない、
目的
図にすることにどのような目的があるのだろうか。
いろいろのケースがある。
@変化 例:大気汚染濃度の変化、ドル為替相場のグラフ
A比較・対比 例:日米比較、与野党の比較、使用前・使用後の比較、製造法の比較などの図示
B度数分布 例:世帯貯蓄額の分布(額で分類)
C関係 例:薬の投与対反応(用量対反応曲線)、入学前・後の成績関係(追跡調査)
D意思決定 例:統計的品質管理、作業の戦略的決定
E内訳表示 例:賛否理由、売上内訳
Fデータ分布 例:都道府県別経済成長率の表示、地域統計一般
G総合
Hその他
@-Eから結論を導く。
主体:誰(どのような主体)が作ったのか
見方の重要な要素である。
企業、官庁およびその外郭団体、マスコミ(新聞・雑誌、テレビ)、諸団休(NPO、NGOなど)、研究機関(大学・研究所)、個人グループ(同好グループ、インターネット上のグループ)、個人、海外からの翻訳データ等々である。
@企業をはじめとする利益団体のデータには、広告・宣伝の動機が含まれていることが少なくない(例:他社との性能比較)。
A官庁データにあっては、管轄(いわゆる官庁の縦割り行政)によって基礎となる定義が異なる。(例:失業率と有効求人倍率の考え方の違い、また失業者には「求職しない者」を含めない、など)
Bマスコミのケースでは、社論、編集方針がデータ収集段階から入っていることもある(例:選挙を「二大政党制」での選択と見なす、など)。
C研究者のデータは、利益の動機はないが、巧名心の要素はある。
D諸団体、個人グループ、個人にあっては、データ収集能力が十分でないケースも多々あり、客観性を評価する必要がある。
どのように作成されたのか、日常業務で集計されたデータか、自ら調査して得られたか(社会調査)、自ら測定・観察・観測して得られたか(自然科学、工学、医学)、資料収集の集計か、統計資料を利用したか(統計年鑑、官庁統計、データバンク)、マスコミ資料を利用したか、インターネット検索で収集したか、研究者の研究の引用か、自己の体験の計数化か、いろいろある。
目的にふさわしい信頼できる方法を用いているかが最大の焦点である。
多くの場合、統計的信頼性よりは結論に重きが置かれ、結論も割引いて「批判的」に受け入れる注意深さが求められる。
見方の重要ポイント
目的、主体、方法が「グラフの見方」の3要素であるが、これらはさらに一般的に「統計数字の読み方」(別項)に通じることがらである。
しかし、グラフ化されることに特有の注意点がある。
いくつかあげておこう。
@特記事項(注意を引きたいことがら)がグラフ化されることが圧倒的である。
グラフ化されていないことがらが何であるかについては十分に注意する。
Aグラフ化のテクニックには十分に注意する。よくあるのは、たて軸の基準点移動で、たとえば110→120の変化は9%アップだが、100を原点(基準点)として描かれると2倍(20%)の増加のように錯覚される。
B同じく石油備蓄量(バレル)を、ドラム缶の絵文字で表現するように、計数の大小が忠実にグラフに反映するか否かが疑わしいケースがある。
「ビジュアル化」されたCG(カラー・グラフィック)などはこの傾向が強い。
C量の差が小さい(A−Bが小さい)場合、視覚から「小さいが差はある」と判断しがちだが、A、B間に「有意な差はない」。
「実質的にはA、Bは同じである」と判断されるケースも少なくない。
「有意」とは統計理論の用語である。
関連リンク