データ読解の芸術:図表と批判的思考【ChatGPT統計解析】
統計分析の際、図や表の解釈と批判的な考察は重要である。データの目的には変化の観察、比較、度数分布の理解、関係の検証、意思決定支援、内訳の提示など多岐にわたる。しかし、図表作成の主体や方法、さらには誇大表現やバイアスの可能性にも注意が必要。データの出典、集め方、そして表示方法は解釈に大きく影響する。グラフ化に際しては、視覚的な錯覚や不正確な印象を与える恐れがあるため、情報を批判的に評価することが求められる。結局のところ、図や表はデータを理解しやすくするツールであるが、それらをどう読み解くかが分析の質を左右する。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
目次 データ読解の芸術:図表と批判的思考【ChatGPT統計解析】
データを図や表にし推論する
図や表の中に何を読み、何を推論するか、図や表をどう考えるかはとても大切です。
また、これは一見やさしいようで難しいです。
統計分析は確かにデータ(原データ)に基づきますが、実際にはデータだけを見ても傾向や法則はわからないことが多いです。
データが大量にあるとなおさらです。
したがって、その中の情報のエッセンスを図や表に要約することが大切です。
図や表は「データのまとめ方」の一つです。
図や表は、原データにかわるものとして実際に示されます。
図や表が適切に作られていれば、これを正しく見ることで、元のデータの情報が伝わります。
図や表が誤用されたり内容が歪曲されたりしたものであるならば、それに影響されてはならず、見破らなければなりません。
図は単なるアクセサリーにように決して軽視してはならず、またこれを信じすぎてもいけません。
見る人は冷静に注意しながら「グラフを読み」「数字を読み」しなければなりません。
データを図や表にする目的
図や表にすることにどのような目的があるのでしょうか。
いろいろのケースがあります。
@変化 例:大気汚染濃度の変化、ドル為替相場のグラフ
A比較・対比 例:日米区画、与野党の比較、使用前・使用後の比較、製造法の比較などの図示
B度数分布 例:世帯貯蓄額の分布(額で分類)
C関係 例:薬の投与対反応(用量対反応曲線)、入学前・後の成績関係(追跡調査)
D意思決定 例:統計的品質管理、作業の戦略的決定
E内訳表示 例:賛否理由、売上内訳
Fデータ分布 例:都道府県別経済成長率の表示、地域統計一般
G総合 上記@〜Fから結論を導く
Hその他
データを図や表にする主体
誰(どのような主体)が作ったのか。見方の重要な要素です。
企業、官庁およびその外郭団体、マスコミ(新聞・雑誌、テレビ)、諸団体(NPO、NGOなど)、研究機関(大学・研究所)、個人グループ(同行グループ、インターネット上のグループ)、個人、海外からの翻訳データ等々です。
@企業をはじめとする利益団体のデータには、消費者には有用な情報が多いですが、広告・宣伝の動機が含まれていることが少なくありません(例:他社との性能比較)。
A官庁データにあっては、管轄(いわゆる官庁の縦割り行政)によって基礎となる定義が異なります(例:失業者と有効求人倍率の考え方の違い、また失業者には「求職しない者」を含めない、など)
Bマスコミのケースでは、社論、編集方針がデータ収集段階から入っていることもあります(例:選挙を「二大政党制」での選択と見なす、など)。
C研究者のデータは、利益の動機はありませんが、功名心の要素はあります。
D諸団体、個人グループ、個人にあっては、データ収集能力が十分でないケースも多々あり、客観性を評価する必要があります。
データを図や表にする方法
どのように作成されたのでしょうか。
日常業務で集計されたデータか、自ら調査して得られたか(社会調査)、自ら測定・観察・観測して得られたか(自然科学、工学、医学)、資料収集の集計か、統計資料を利用したか(統計年鑑、官庁統計、データバンク)、マスコミ資料を利用したか、インターネット検索で収集したか、研究者の研究の引用か、自己の体験の計数化か、いろいろあります。
目的にふさわしい信頼できる方法を用いているかが最大の焦点です。
多くの場合、統計的信頼性よりは結論に重きが置かれ、結論も割り引いて「批判的に」受け入れる注意深さが求められます。
誇大表現やバイアスに注意
目的、主体、方法が「図表の見方」の3要素ですが、これはさらに一般的に「統計数字の読み方」に通じることがらです。
しかし、図にする、特にグラフ化されることには特有の注意点があります。
特に誇大表現、バイアスには注意が必要です。
@特記事項(注意を引きたいことがら)がグラフ化されることが圧倒的です。グラフ化されていないことがらが何であるかについては十分注意しましょう。
Aグラフ化のテクニックには十分に注意しましょう。よくあるのは、縦軸の基準として描かれると2倍(20%)の増加のように錯覚されることです。
B同じく石油備蓄量(バレル)を、ドラム缶の絵文字で表現するように、計数の大小が忠実にグラフに反映するか否かが疑わしいケースがあります。「ビジュアル化」されたCG(カラーグラフィック)などはこの傾向が強くなります。
C量の差が小さい(A-Bが小さい)場合、視覚から「小さいが差はある」と判断しがちですが、A,B間に「有意な差はない」、「実質的にはA,Bは同じである」と判断されるケースも少なくありません。「有意」とは統計理論の用語です。
ChatGPTに聞いてみた
プロンプト
あなたは最高のデータサイエンティストです。
統計分析の際の図や表の解釈について解説してください。
#制約条件:
サルでもわかる平易な日本語で
文字数は300字程度
ChatGPTの回答
統計分析で図や表を見るとき、まるで宝探しの地図を見るようなものです。図や表にはデータの秘密が隠されていて、それを読み解くことで、データが教えてくれる話を理解できます。図でよく見るのは、棒グラフや折れ線グラフです。棒グラフは、ものごとの大きさを比ぼるのに便利です。例えば、「バナナが一番好き、次にリンゴ、キウイはそれより少し少ない」といったことがパッと見でわかります。折れ線グラフは、時間とともにどう変わるかを見せてくれます。「朝はバナナを少し食べ、昼過ぎにたくさん食べ、夜はまた少なくなる」という流れが一目瞭然です。表は、数字を並べて、より詳細な情報を伝えます。表を見るときは、まずはタイトルと列の見出しをチェック。これが何についてのデータなのかを把握します。次に、数字が大きい順や小さい順に並んでいないか、特定のパターンがないかを探します。これで、データの大まかな流れがつかめます。図や表からは、数字の背後にあるストーリーを読み解くことが大切です。これらをうまく読むことができれば、データが隠している秘密やトレンドを発見できるのです。まるで宝探しで宝箱を見つけるように、データから新しい発見をするのが、図や表の解釈の醍醐味です。