実験計画における確率分布|【統計学・統計解析コラム】
ウィリアム・ゴセットは、計画された実験に対して事象空間を考えました。彼は、事象空間を実験で起こり得るすべての結果からなる集合と定義しましたが、統計解析に必要な確率分布を計算するには、より厳密な定義が必要でした。フィッシャーは、ランダムな処置による実験計画を提案し、結果の確率分布を推定する方法を示しました。この方法は並べ換え検定として知られ、フィッシャーの分散分析の式が近似として使用されました。コンピュータの登場により、並べ換え検定が実行可能になり、統計的有意性の検定においても重要な役割を果たしました。フィッシャーは、統計的有意性検定がランダム化実験とともに行われない限り、不適切であると主張しました。彼は特に、差別訴訟における統計的有意性の使用に反対しました。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
ウィリアム・ゴセットの業績は、統計学における基礎的な概念を築き上げる上で重要な役割を果たしました。
彼は計画された実験に対して事象空間を考え、その重要性を強調しました。事象空間とは、実験で起こり得るすべての結果の集合であり、統計解析において確率を計算する際の基盤となります。
ゴセットの定義は、理論的な観点からは妥当であると考えられます。
しかし、そのままでは実用的ではありません。
なぜなら、事象空間が起こり得るすべての結果の集合として定義されているため、具体的な確率分布を導くことが難しいからです。
この問題に対処するために、ロナルド・フィッシャーはより洗練された定義を提案しました。
フィッシャーのアプローチでは、実験の計画にランダム性を導入しました。
彼の実験計画では、処置がランダムに実験ユニットに割り当てられます。
例えば、動脈硬化のある肥満のラットに対する二つの治療法を比較する場合、いくつかのラットには治療法Aをランダムに割り当て、残りのラットには治療法Bを割り当てます。
このようにして実験を行い、結果を観察します。
このランダム化のアプローチにより、事象空間は実際には考えられるすべてのランダムな割り当てからなる集合として定義されます。
そして、それぞれの結果が等しい確率で起こり得ると考えられます。このようなアプローチに基づいて、帰無仮説の下で得られる結果の確率分布を計算することが可能になります。
これが、並べ換え検定として知られる手法です。
フィッシャーが提案した当初、すべてのランダムな割り当てを考慮することは困難でした。
しかし、後に高速コンピュータの登場により、並べ換え検定を実行することが可能になりました。フィッシャーの分散分析の公式も、その優れた近似として機能します。これにより、数理統計学の複雑な定理を理解する必要性が減少しました。
しかしながら、統計的有意性検定が観測データに対して行われる場合には、コンピュータを使用した並べ換え検定が適用できない場合があります。
特に、フィッシャーは喫煙と健康に関する研究において、統計的有意性検定の限界を指摘しました。
彼にとって、ランダム化された実験が行われない限り、統計的有意性検定は妥当ではないというのがその理由です。
アメリカの法廷においては、統計的有意性に基づいて判断が下されることが一般的です。
特に、性的ないし人種的差別に関する訴訟では、統計的な証拠が重要な役割を果たします。
これにより、フィッシャーの考え方が再び注目されることもあります。
関連記事