喫煙統計でウソをつく法|【統計学・統計解析講義応用】
喫煙統計でウソをつく法
著名な統計の専門家であっても基準率の誤りにはまることがある。
目を引く事例として,ジャーナリストのダレル・ハフが関わったものがある。
ハフは1954年に出た『統計でウソをつく法』という有名な本の著者だ。
『統計でウソをつく法』という本は学術的な意味での統計に焦点を当てた本ではない。
むしろ「グラフや誤解を招きやすい数字でウソをつく法」という題名の方がふさわしかったかもしれない。
それにもかかわらず,この本は大学の授業で広く使われていたし,マーケティング担当者や政治家の裏をかきたがっている大衆にも読まれていた。
このことにより,ハフは世間が認めた統計の専門家ということになっていた。
そのため, 1964年に米国公衆衛生局長官が出した「喫煙と健康」という有名な報告に,喫煙が肺ガンの原因になるという記述が載ったとき,たばこ会社はハフに公開の反論を行うよう依頼した。
たばこ産業は,ハフの名声を利用しようとして,ハフに議会での証言を依頼するとともに,本の執筆も依頼した。
この本は,公衆衛生局長官の報告に存在するとされた多くの統計的・論理的誤りを論じるもので,「喫煙統計でウソをつく法」という仮題が与えられた。
ハフは原稿を書き終えると,たばこ産業から9000ドル(2014年のドルの価値で言えばおよそ6万ドル)を受け取った。
そして,この原稿はシカゴ大学の統計学者で,たばこ産業のコンサルタントとしてお金をもらっていたK・A・ブラウンリーに好意的に評価された。
この原稿が出版されることはなかったが,もし出版されていれば,ハフの分かりやすくて気楽に読めるスタイルが大衆に強い印象をあたえ,給湯室での議論に話のタネを提供しただろう。
その第7章で,ハフは,自身が「過度に精確な数字」と呼んだものについて議論している。
こうした数字は,信頼区間や他の不確かさの目安が付されることなく示されていた。
例えば,公衆衛生局長官の報告では「1.20という死亡率の比」について述べられていて,それが「5%の水準で統計的に有意」だとされている。
おそらくこの1.20という比と, 1.0という比の間にp<0.05で有意差があるということを意味しているのだろう。
ハフは結果を死亡率の比で表すことは完全に適切なことだと同意したのだが,以下のようにも述べている。
これには適切でない結果が含まれている。
ここからは,2種類のグループの実際の死亡率の比が小数点以下まで分かっているように見える。
解釈する際に,かなり精確な数値に見えるものが近似値に過ぎないという知識を持ち出す必要がある。
そして,添付されている有意性に関するくだり(「5%の水準」)からは,実際に分かることが2番目のグループが1番目のグループより死亡率が本当に高いことのオッズが19対1であることしかないということが知れる。
一方のグループともう一方のグループを比べたとき,実際の増加量は,提示された20%よりずっと少ないかもしれないし,多いかもしれない。
この引用の前半については,ハフをほめたいと思う。
統計的に有意であることは,小数第2位まで精確な数値が分かることは意味しないにの数値を表したかったら,信頼区間の方がずっと適切だっただろう。
だが,その次に,ハフは有意水準から,死亡率に実際に差がないのは19対1のオッズだと主張している。
つまり,ハフはp値を結果が偶然である確率であると解釈しているのだ。
ハフですら基準率の誤りから逃れられなかったのだ!
「2番目のグループが1番目のグループより死亡率が本当に高い」オッズは分からない。
分かるのは,「真の死亡率の比が1だった場合,20回実験すれば死亡率の比が1.20より大きい結果が得られるのが1回しかない」ということだけだ。
ハフが過度に精確な数値であると文句を言っていたのは,実際には不可能な精確さだったのだ。
K・A・ブラウンリーが,このコメント,およびハフが原稿の至るところで述べた同様の見解を読んで文句を言わなかったことは注目に値する。
ブラウンリーは,かわりに,ハフが本来オッズを20対1とすべきところを誤って19対1としているという旨の指摘を1か所でしている。
一層根本的な問題である基準率の誤りが潜んでいることにブラウンリーが気づいたようには見えない。
関連記事