Python・R・エクセルによるデータサイエンス | 統計解析講義

実験計画法の統計学【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

実験計画法の統計学【統計解析講義基礎】

実験計画法の統計学【統計解析講義基礎】


実験計画法の統計学【統計解析講義基礎】

 

問題群 次の問題が与えられています。

 

@蚊に刺されない虫よけの薬AとBがある。どちらがよく効くだろうか。

 

Aある育毛剤が新発売された。この効果を見たい。

 

B3種のビールがある。運動で汗をかいた後、どれが一番うまいか。

 

これらの場面で有効となるのが実験計画法です。

 

解決の戦略

 

@に対し、aさんの腕に薬A、bさんの腕に薬Bを塗り、同じ場所を散歩してもらった後、虫刺されの個数はaさんは3個、bさんは5個であったとします。これにより、薬Aの方がBより優るという結論を出してもよいでしょうか。体質が、bさんはもともと蚊に刺されやすく、aさんは刺されにくいとしたら、体質の問題かもしれません。これに対処するには、同一の人の右腕に薬A、左腕に薬Bを塗ればよいでしょう。これにより、人による違いが避けられます。このように比較する条件をなるべく均一にしたもとで実験を行うことを「局所管理」といいます。

 

A育毛剤の検証においても、@と同様に、頭の左側に育毛剤を塗り、右側は塗らない、という実験デザインにすればよいことになります。

 

Bやはりうまいのは初めの一杯でしょう。3人が各種類のビールをすべて同じ順番に飲むのではなく、順序をまったくランダムに与えた「無作為化」をすることにより、工夫することが必要です。

 

フィッシャーの3原則

 

問題解決のための特性要因図を作ったものの、多くの要因が浮かび上がり、真の原因が特定できないことがあります。

 

ある要因(因子とよびます)が特性値に影響があるかどうかは、その要因を何通りか設定し(因子の水準をふるといいます)、特性値のデータの変化を観察します。

 

しかし、誤差によりデータには何らかの違いが存在するので、それが偶然のばらつきによる見た目上のものなのか、要因の効果による本質的な違いなのかを明らかにする必要があります。

 

例として、ある化学反応で収率を高めたいとき、触媒の量を10mg(A1)、15mg(A2)、20mg(A3)の3通りの設定(3水準)で実験を行い、図1が作られたとします。

 

このときA3の20mgがよりよいという結論を下してもよいでしょうか。

 

今、仮にこの実験を1回ずつではなく、図2-1、図2-2のように回数を増やしたとします。図2-1の場合は差はあるが、図2-2では差がないことが明らかです。

 

すなわち、「反復」が必要であり、これにより初めて偶然のばらつき(図2-1)によるものか、本質的に差があるばらつき(図2-2)によるものかを区別できます。

 

以上の、反復、無作為化、局所管理を実験計画におけるフィッシャーの3原則といいます。

 

配置法

 

ひとつの因子Aをとり上げ、Aにa水準あたり、各水準ごとにr回の実験を行って、因子の効果があるかどうか分散分析表を作成して検定する方法を「一元配置法」と呼びます。

 

ただし、N=a×r回の実験はランダムな順序で行います。

 

これを進めて2つの因子A(a水準)とB(b水準)があるとき、これらを同時に取り上げ、AとBの各水準組み合わせでr回の実験を行い、解析する方法を繰り返しのある二元配置法と呼びます。

 

各因子の水準をふることによる効果(主効果と呼びます)のほかに、交互作用の効果A×Bを検定することができます。N=abr回の実験はランダムな順序で行います。

 

ここで交互作用とは、複数の因子の効果の大きさに加法性がない場合をいいます。

 

例えば、ウイスキーか日本酒のいずれかを飲むと疲れが癒されますが、両者を同時に飲むと逆に悪酔いし、体調を壊すような場合です。

 

因子を3つ以上同時に取り上げ、すべての水準組み合わせで実験を行う方法を多元配置法といいます。やはり、すべての実験はランダムな順序で行います。

 

なお、2つの因子AとBの各水準組み合わせにおいて、1回しか行わない方法を繰り返しのない二元配置法と呼びます。この場合には交互作用を検定できません。

 

より進んだ戦略

 

以上のように、反復、無作為化、局所管理が重要ですが、現実にはその適用が難しいことが多いです。

 

このために以下の実験法が開発されています。

 

@直交表実験:反復を減らし、少ない実験回数で多くの因子の主効果や交互作用を検出するための方法。1回の実験に莫大なコストがかかり、たくさんの実験を行えない場合に有用な方法です。誤差自由度が小さくなり、検出力が低いという弱点はありますが、初期段階において「大網を張る」実験として有効です。

 

A乱塊法:局所管理を行うために、同じ実験状況(ブロックと呼びます)を作成します。各ブロック内では各水準の組み合わせをランダムな順序で実験し、複数のブロックで反復する方法を「乱塊法」といいます。温度や湿度など実験日の差による影響が考えられるときに用いられます。

 

B分割実験:無作為化を実施しにくいときの解決策として分割実験があります。すなわち、すべての実験順序をランダムに行うことを緩和する方法です。

セミナー詳細こちら                    解析ご相談こちら


 

実験計画法の統計学【統計解析講義基礎】

実験計画法の統計学【統計解析講義基礎】

実験計画法の統計学【統計解析講義基礎】