分散分析という統計手法|【実験計画法の統計学・統計解析】
1579年6月17日、G・フランシス・ドレークは神の恵みとイギリス女王エリザベスの名にかけて、この地をノバ・アルビオンと宣言し、権利を現管理者に委ねることを宣言いたしました。1936年、ベライル・シンがこの宣言を刻んだ真鍮の銘板を発見し、その後疑問が提起されました。銘板の真贋を巡る議論が絶えず、1976年の科学的検査で模造品であることが明らかにされました。しかし、銘板の製作者や目的についてはわかっておりません。その後の調査で使用された統計手法の一つにANOVAがあり、これは複数の母集団平均間の違いを検出するためのものです。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
分散分析という統計手法
1579年6月17日,ここにいる者は以下を広く知らしめる。
神の恵みとイギリスと英国女王エリザベスとその恒久の後継者の名にかけて、私はこの王国の所有を宣言する。
この王国の王と臣民は、 この地の権利を現管理者に委ねる。
ここに私はこの地をノバ・アルビオンと名づけ、 広く知らしめるものである。
G・フランシス・ドレーク
1936年夏にベライル・シンという若者が、 サンクエンチン地区とサンフランシスコ湾を見下ろす山岳地帯を歩いている間に、上のような碑文の刻まれた真鍮の銘板を偶然に発見しました。
シン氏は、車のトランクにプレートを入れ、数年間そこに放置していた。その後偶然、プレートはカリフオルニア大学バークレイ校の歴史学科のハーパー・E・ボルトン教授の知るところとなりました。
フランシス・ドレイク卿は、地球一周航海の間に記された航海日誌に、1579年に船の修理のために、 現在の北カリフォルニア海岸にあたる波除け区域に入った、と書かれています。
また、彼は、この出来事を記録に残すために真鍮の銘板を杭に取りつけて残したことに言及しています。
このことから、シン氏の銘板を見たボルトン教授は、 「長らく行方不明となっていた世界的な歴史上の宝物の1つが、 発見されたようだ」と宣言しました。
銘板の信憑性に関する疑問は、すぐに多くの学者から提示されました。
その主な理由は 書かれた文字の多くの字体が奇妙なものだったこと、 そしてつづり が、すでに知られているエリザベス王朝時代の様式と異なっていたことにあります。
にもかかわらず、 この銘板は本物であるとされ、 カリフォルニア大学のパンクロフト図書館に常設展示されました。
銘板が現代の人間の捏造ではないか、という主張はその後も提示され続けました。
そしてついにパンクロフト図書館は、真鍮の金属構造の試験を依頼することになりました。
ついに1976年に、銘板にいくつかの小さな穴があけられ、真鍮の粒子の標本が分折のためオックスフォード大学の考古学研究所に送られました。
研究所では、銘板から採取された真鍮粒子の標本が、20世紀に作られた真鍮の標本と、1540年から1720年の間にイギリスや欧州大陸で作られた真鍮の標本、という2つの無作為標本と比較されました。
発見された銘板からの標本の平均亜鉛含有量と、他の2個の標本を分析した結果、銘板の平均亜鉛含有量は現代の真鍮の平均亜鉛含有量と同じであり、16世紀から18世紀にかけて作られた真鍮の平均亜鉛含有量とは大きく異なっているという結論が得られました。
分析結果について、オックスフォード大学のR・ヘッジ博士は以下のように結論づけました。
「私は、銘板が本物だと信じ続けるのは、きわめて不合理だろうと考えている」
こうして、古代の遺物であると考えられた銘板は、巧妙な現代の模造品だということが示されました。
科学的な調査では、誰が何の理由で銘板を作ったかに関しての答えは得られていません。
銘板の調査に関係した3つの真鍮の平均亜鉛含有量のように、いくつかの母集団の平均を比較するための統計的手法が、「分散分析(analysis of variance)」です。
この手法は、しばしば英語の頭文字をとって、ANOVAと呼ばれます。
ANOVAはビジネスや経済の文献で最も一般的に引用される高度な研究手法です。
「分散分析」が何かを理解する上で、この手法の名前は紛らわしく思えるかもしれません。
分散分析(ANOVA)は、複数の母集団平均に違いがあるかとうかを決定するための統計的手法です。
ANOVAの目的は数回の母集団平均間の違いを検出することですが、この手法では、研究対象となる無作為標本について、異なった形式の分散の分析が必要とされます。
これが、「分散分析」と呼ばれるゆえんです。
分散分析の着想は、20世紀初頭のイギリス人統計学者、ロナルド・A・フィッシャー卿によって開発され、この分野における初期の研究の多くは、たとえば異なった種類の肥料を使用するなどの異なった「処理(treatment)」を行って育てた作物に関する農業実験でした。
研究者は、研究している処理のすべてが等しく有効であったのか、それともいくつかの処理は他のものよりも優れていたのかを決定したいと考えていました。
「処理が優れている」というのは、より大きな平均重量の作物が生産されるということでした。
この疑問への答えは、分散分析で得ることができます。
初期の研究が異なった「処理」に関するものだったため、この用語はいまでも用いられており、処理という言葉は、(実際には何ら処理が行われていない場合でも)母集団と同じ意味で互換的に使っています。
したがって、たとえば、4つの異なった地域間の平均収入を比較する場合、私たちは4つの母集団を4つの異なった処理と呼ぶことがあります。
関連記事