バイアス|【統計学・統計解析講義応用】
バイアスとは
バイアスを考慮することは、ほぼすべての分野で重要です。
特に人文科学では、一層の注意が必要です。
バイアスの多くは、既に特定され、それぞれ定義されています。
すべてを列挙はしませんが、いくつか一般的なものについて考えてみます。
バイアスは主に2つの面で研究に関わってきます。
1つは、研究対象者の選択や保持に際して、もう一つは対象者に対する情報収集をする際です。
いずれの場合でも、バイアスの特徴として、それは偶然誤差ではなく系統誤差の源となります。
バイアスの結果は、データそのものは統計学上正しい手法と技術によって導き出されたにも関わらず、系統的に誤った結論を導き出します。
バイアスとは、研究の結果に影響する要因のことです。
バイアスは研究の様々な過程で生じます。
ある母集団から研究の対象となる標本を抽出する際に生じるバイアスをサンプリングバイアスといいます。
サンプリングバイアスには、研究者側の要因と対象者側の要因が考えられます。
研究者側の要因としては、臨床研究を計画・実施する研究者が自身の仮説を証明したいがために、仮説に合う標本を意図的に抽出してしまう可能性があります。
対象者側の要因としては、研究の対象者は臨床研究の標本となることに対して同意する必要がありますが、同意した対象者と同意しなかった対象者で違いが生じる可能性があります。
たとえば、健康状態に関する研究であれば、健康に配慮した生活を送っており、健康状態に自信がある対象者が同意しやすく、逆に、健康に不安を抱えている対象者は同意しにくい可能性があります。
その他にも、ある治療法を推奨している医師が診断すると、治療法の効果が高く偏ってしまう診断バイアスなどに代表される選択バイアス、調査項目が過去の症状などで対象者本人の記憶をもとに聞き取るような思い出しバイアスに代表される情報バイアスなどがあります。
標本の選択と保持におけるバイアス
対象が白血病の患者であっても、工場で作られる製品であっても、研究調査においてその対象すべてに対して調査をすることは、不可能とは言わなくても、単純に費用がかかりすぎます。
そのためほとんどの場合、標本(サンプル)を抽出して調査をします。
標本は、調査母集団(結果を適用するつもりの母集団)をよく代表して、研究者が標本の結果を使って母集団を記述するのに満足できる必要があります。
標本にバイアスがあることは、調査母集団を代表していないことを意味しますので、標本調査から導かれた結論が調査母集団には適用できないことになります。
選択バイアス
標本対象者が、他の対象より何らかの理由で潜在的に選ばれやすい状態にあるときに起こります。
この用語は通常、標本選択の手順で起こるバイアスに使われます。
例えば、電話調査を電話帳に基づいて行った場合、電話帳に番号を載せていない人や、電話番号を変更してしまった人は調査対象から除外されてしまいます。
これは、RDD(ランダムデジットダイアリング、ランダムに番号を打ち込む方法)によって解決できますが、固定電話に加入していない人や、携帯電話のみの使用者は標本に入れることができません。
これは研究調査自体の問題で、除外された人が(よくあることですが)結果的に調査特性において異なり、調査結果がバイアスされます。
例えば、自宅に固定電話を引いていない人は、固定回線を引いている人よりも若い傾向にあります。
この場合、貧困や若さが研究そのものに関連している場合、標本としてこれらを除外することは研究にバイアスを導入してしまいます。
志願者バイアス
研究に対して志願して参加する標本は、多くの場合対象全体の代表として不適格なことを指します。
このため、テレビ番組での電話投票の結果は、そういった電話投票に自ら進んで参加する人々を対象にした調査目的以外では、科学的な調査結果として有効ではありません。
この場合、いくつもの階層に及びランダムでない標本選択が行われている可能性があるからです。
例えば、この投票に参加するためにはテレビを見ている必要があります。
これは家にいる必要があり、この投票が平日行われる場合には、視聴者の大半は仕事を引退した人や、主婦、無職の人となります。
また、電話を自主的にかけることが可能であり、テレビ画面に映る番号に対して何らかの理由でそれをダイアルする特性をもった人となります。
こと電話投票に関しては、参加者の個別の性格特性が大きく影響し、無視できないほどの影響があることが、既に知られています。
未回答者バイアス
志願者バイアスの別の側面です。研究に自主的に参加する志願者標本が、そうでない標本と体系的に異なる結果をもたらすのと同様に、参加を拒否する標本は、参加した人とは異なる結果を出すことがよくあります。
電話調査が嫌いな人は多いです。そういう人が、全体を象徴するランダムな選択として適当でしょうか。
例えば、カナダ/米国の健康に関する共同調査では、カナダ対米国での結果の違いだけでなく、ほぼすべての健康状態と医療アクセス状態では、未回答者バイアスを探すことができます。
情報打ち切り
長期的な研究(一定期間にわたって追跡調査が必要な研究)でバイアスをもたらすことがあります。
長期的な調査中に、対象者を失うこともありますが、本当の問題点は、対象者がランダムにドロップアウトしないときに、研究目的に関連する理由によって生じます。
仮に、2つの治療方針に振り分けられた慢性疾患の患者の5年間にわたる治療結果の追跡調査を行ったとします。
無作為振り分け方法が確立しているために、調査開始時にはバランスのとれた2つの対象グループに分けることができます。
しかし、時間が経過するにつれて、効果的ではない治療方針のグループに振り分けられた調査対象者は、他の治療法を求めるために、調査対象からドロップアウトしていき、バイアスを引き起こします。
最終的に残った対象者が、効果的な治療方針のグループのみから構成されており、途中でドロップアウトした対象者がランダムな理由でない場合、結果として最後まで残った対象者は、開始時の無作為な選択によってえらばれた対象者のグループではなくなってしまいます。
ドロップアウトした理由が治療の効果がないことの場合、残った対象者の集団は治療が効果的であった人に偏っています。
情報バイアス
たとえ完璧な標本が選択され保持されている場合でも、情報を収集し、記録する際の方法によってバイアスは引き起こされます。
この種のバイアスは、収集した情報の有効性に影響し、研究結果を無効にすることもあるので、情報バイアスと呼ばれています。
データが直接対面式の面談や、電話によって収集された場合、そこには質問者と対象者の間に社会的な関係が生まれます。
この社会的関係が、収集されたデータの質に悪影響を及ぼすことがあります。
こういったデータ収集時の心構えや態度によってもたらされるバイアスは、質問者バイアスとして知られています。
この種のバイアスは、質問者が意図せずとも、研究の目的を知っていたり、対象者の個人情報を知っていたりするときに起こり得ます。
例えば、仮に質問者が化学物質によって引き起こされた稀な癌に苦しんでいる人だということを知っていた場合、質問内容がその化学物質の影響に対して、より厳密な質問に偏っていくことがあります。
また、質問者が、例えば乱交や薬物の乱用などの場合のように、研究内容に対して否定的な意見や態度である場合にも、対象者が答えづらいような態度になるkとおによって、質問者バイアスが引き起こされる場合があります。
想起バイアス
深刻な病気や怪我などの経験者が、それと関連した事象に対してバイアスを示します。
例えば、流産を経験している女性は、その流産の原因となった思い出や事象を、多くの時間を費やして思い起こしています。
通常、出産経験者は、そういったことを考えていないわけではありませんが、多くの時間を費やしてはいないので、調査の際に尋ねられても思い出せないことが多いのです。
検出バイアス
特定の特性が一部の人々から検出されやすい傾向にあることを示します。
例えば、スポーツ選手ではドーピング薬の使用検査は、定期的に行われ、結果が公表されます。
世界選手権クラスの選手は、定期的にアナボリックステロイドの検査が行われ、記録され、メディアへ発表されることもあります。
無名の選手や、他の競技の選手が同様なドラッグを使用している可能性もありますが、定期的に検査したり検査結果を発表したりしないので、記録として残りません。
したがって、アナボリックステロイドの使用率が野球よりも水泳の方が多いという報告のために、実際に水泳選手の方が野球選手よりそのドラッグの使用率が高いと推定することは誤りとなります。
これは、水泳関係者がより積極的に検査を行い、公表しているから引き起こされる差によるものです。
社会的欲求バイアス
人が自分をよりよく見せようとする傾向から引き起こされるものです。
これは、対象者が研究者を喜ぶだろうと信じて引き起こされるものです。
直接面談によって調査された場合のみではなく、例えば筆記アンケートによって行われた調査でもその傾向を見ることはできます。
社会的欲求バイアスは、特に犯罪行為や失禁など社会的に恥ずかしいとされている行為などに対して行われる調査に見られます。
また、社会的欲求バイアスは、質問が何か社会的に正しいとされているかが問われていると感じる場合には、回答に影響を及ぼします。
関連記事