データ収集から信頼性へ：バイアスの闘い【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

データ収集から信頼性へ：バイアスの闘い【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】
データ収集は統計解析の出発点であり、正確性が不可欠ですが、悪質な例も存在します。質問のバイアスや心理的効果には警戒が必要です。例えば、ダブルバレル質問や意図的な選択肢の設定はバイアスを生み出す可能性があります。これらの調査では正確な情報が得られず、信頼性が損なわれる恐れがあります。

▼▼▼▼▼▼▼▼
チャンネル登録はこちら

目次データ収集から信頼性へ：バイアスの闘い【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

アンケート調査の違反

調査における質問のバイアス

心理的効果のバイアス

アンケート調査の違反

調査によるデータの収集は、統計的処理によるデータ解析の出発点です。

ここが正確でないと後の処理はまったく無意味になってしまいます。

しかし、不注意な調査は案外いろいろなところにあります。

また、わざと不当な調査を行い、都合のよい結論を導く「我田引水」的な調査例も、残念ながらよくあります。

世の中に「アンケート」があふれているように、統計調査というのは簡単にできるように思われているふしがあります。

しかし、たとえば「質問数が多すぎて、だんだんいい加減に回答するようになってしまう」アンケートには、日常よく出会うものです。

統計調査は、その方法についてだけでひとつの本が書かれるほど、慎重に扱わなければなりません。

そこで、「悪い調査」の例をいくつか見ていくことで、調査のありかたについて考えてみましょう。

なお、国が行う国勢調査などの統計調査については、調査が「ズル」によって歪められることのないように、統計法という法律によって、きびしい規制・罰則があります。

2013年には、ある町で「市への移行条件を満たすために、2010年の国勢調査の結果を改ざんして人口を水増しした」という疑いで、当時の副町長が、「統計法違反」で逮捕され、有罪となるという事件がありました。

調査における質問のバイアス

良い質問とは何かを考えるため、次の悪い質問の例を見て、何が悪いのか、何がバイアスなのか考えてみてください。

１．もし、あなたが車を運転していて、がまんできないくらい眠くなったら、あなたはどうしますか。

２．あなたは、世の中で一番大切なのはお金であると思いますか。

３．あなたは、学歴よりも実力が大切だと思いますか。

４．あなたは、宇宙開発は安全保障上重要なので、進めるべきだという意見に賛成ですか。

５．当店のお客様に対する反応はいかがでしたでしょうか。次のなかからお選びください。①不満　②おおむね満足

＜解説＞

１．車を運転しない人にとっては、答えようのない質問です。もし・・・だとすれば、という仮定の質問をするには、その仮定に十分な必然性が必要です。

２．あなた自身がお金が一番大切だと思っていますか、なのか、世の中の人はお金が一番大切だと思っているとあなたは思っていますか、なのか、意味があいまいです。

３．学歴よりも実力が大切かどうかを判断するためには、まず「学歴と実力は別物である」「学歴と実力は比較できる」という前提が必要ですが、それは必ずしも正しいと認識されているとはいえません。

４．「宇宙開発は安全保障上重要だが、進めるべきではない」「宇宙開発は安全保障上重要ではないが、それでも進めるべきだ」という意見の持ち主は、この質問に答えることができません。これは、「宇宙開発を進めるべきだ」とする理由が、「宇宙開発は安全保障上重要だから」以外にない、と質問者が勝手に思いこんでいることが原因です。このように、質問に２つ以上の論点があり、どれを聞かれているのかが不明確な質問をダブルバレル質問といいます。「ダブルバレル（double-barreled）」とは、もともとは２本の銃身をひとまとめにした銃のことをさします。こういう場合には、まず「宇宙開発を進めるべきだ」という意見に賛成ですか、という質問をした後で、さらにその理由を問うようにします。

５．あきらかに「満足である」という回答に誘導しようとしています。このような選択肢を作りたいのなら、たとえば、①不満　②やや不満　③どちらでもない　④おおむね満足　⑤満足　の５つの選択肢にしなければなりません。

心理的効果のバイアス

人間の判断は、直感や印象といった心理的効果に大きく左右されます。

心理的効果のバイアスの例をみてみましょう。

宴会コースのメニューをいくつか設定するとします。

店主は、7000円のコースに人気が出てほしいとひそかに考えています。

下のどちらにすれば、その意図が実現されやすいでしょうか。

A:　宴会メニューは6000円、7000円、8000円、9000円の４通りです。

B:　宴会メニューは4000円、5000円、6000円、7000円の４通りです。

最高額や最低額は、選択されにくい傾向があります。

予算を7000円にしたいと考えているなら、上の4通りの設定のほうがよいことになります。

もちろん、統計調査でこのような細工をすることは好ましくありません。

では次の問題はどうでしょう。

大学で、学生が講義を評価するアンケートを行います。下の２つの尋ね方で、回答に違いが出るでしょうか。

A：あなたはこの講義に満足しましたか、次に○をつけてください。

①非常に不満　②不満　③どちらでもない　④満足　⑤非常に満足

B：あなたはこの講義に満足しましたか、次に○をつけてください。

①非常に不満　②不満　③満足　④非常に満足

とくに言いたいことがない場合、「どちらでもない」に○をつけたくなるものです。

５段階評価の場合は③に○をつけることになります。

しかし、４段階評価の場合はそれを許さず、満足か不満かどちらかを選べ、と強制していることになり、バイアスが生じています。

関連リンク

統計学における回帰の定式化

フェーズ５（第５相）：普及の相

散布図とヒストグラム

複数の治療へのランダム化【統計解析講義応用】

記述的質的研究

カサンドラの出現

統計学における度数分布のクラス幅

女性や少数民族を組み入れる際のポリシー

統計学における価格指数と品質変化

臨床試験データの収集

1

2

3

4

5

6

データ収集から信頼性へ：バイアスの闘い【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【トップページへ戻る】
【YouTubeChannel】
【統計解析講義基礎】
【統計解析講義応用】
【ChatGPT・Python・Excel】
【多変量解析】
データ収集から信頼性へ：バイアスの闘い【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【医療統計解析】

データ収集から信頼性へ：バイアスの闘い【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【社会経済統計】
【ビジネス統計】
【AI・デジタル】
【統計解析コラム】
【統計解析用語集】
【統計解析セミナー】
データ収集から信頼性へ：バイアスの闘い【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【お問い合わせ】

セミナー詳細解析ご相談 LINEでお友達

データ収集から信頼性へ：バイアスの闘い【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

データ収集から信頼性へ：バイアスの闘い【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

アンケート調査の違反

調査における質問のバイアス

心理的効果のバイアス

メニュー

サブメニュー

最新記事