実験計画における確率分布|【統計学・統計解析コラム】
ウィリアム・ゴセットは、計画された実験に対して事象空間を表現しようとしました。
彼は、事象空間はその実験で起こり得る結果のすべてからなる集合であると言いました。
これは知的には満足できても、使い物にはなりません。統計解析を行うのに必要な確率を計算できるように、かなり厳密に実験結果の確率分布を表現する必要があります。
起こり得る結果すべてからなるという集合というあいまいな考え方から、どのようにして特定の確率分布を導くのでしょうか。
フィッシャーは当初ゴセットの定義に同意していましたが、その後、よりふさわしい定義を生み出しました。
彼の実験計画では、処置はランダムに実験ユニットに割り当てられます。
動脈硬化のある肥満のラットの施す二つの治療を比較したいと思えば、何匹かのラットに治療Aをランダムに割り当て、残りのラットに治療Bを割り当てます。
その研究は実行され、その結果を観察します。
どちらの治療も基本的には同じ効果があるとしましょう。治験動物はランダムに治療を割り当てられているので、割り当てが変わっても同じ結果が得られるでしょう。
治療のラベルがランダムに変わることは、動物に間違ったタグがつけれらると同じです。
治療が同じこうかを持つ限りにおいては、ゆえに、フィッシャーにとって事象空間は、考えられるすべてのランダム割り当てからなる集合なのです。
これは有限の事象集合であり、すべての事象が等しく起こり得るのです。
二つの治療が同じ効果を持つという帰無仮説のもとで、得られる結果の確率分布を計算することができるようになります。
これは、並べ換え検定(permutation test)と呼ばれています。
フィッシャーがこの検定を提案したとき、考えられるすべてのランダムな割り当てを数えることはできませんでした。
フィッシャーは自ら発明した分散分析の式が正しい並び換え検定のよい近似になっていることを証明したのです。
それは高速コンピュータが登場する前のことでした、今や並び換え検定を実行することが可能になり(簡単な算数をすることになっても、コンピュータは疲れを知らない)、フィッシャーの分散分析の公式は必要ありません。
長年にわたって証明されてきた数理統計学の巧みな定理の多くもまた必要ではありません。
データがランダム化された制御実験から得られたものである限り、すべての有意差検定はコンピュータを使った並べ換え検定で行うことができます。
有意差検定が観測データに対して行われるときには、こういったことはできません。
これは、フィッシャーが喫煙と健康に関する研究に反対した主な理由です。研究者たちは自分たちの症例を証明するために統計的有意差検定を用いました。
フィッシャーにとって、ランダム化実験とともに行われない限り、統計的有意性検定は不適切なものとなってしまいます。
アメリカの法廷での差別訴訟は、統計的有意性に基づいて判定されることが日常的になっています。
アメリカの連邦政府裁判所は、これが性的ないし人種的差別による隔離の影響が存在するかどうかを判定する一つの容認できる方法であると規定してきました。
生きていればフィッシャーは大声をあげて反対したでしょう。
関連記事