従来の実験における問題点と統計学|【実験計画法の統計学・統計解析】
従来の実験には多くの問題があります。その反省から、正しい実験方法を検討しましょう。例えば、合成樹脂の強度を改善するために触媒量や条件を変えた実験を考えます。しかし、従来の方法では交互作用や実験誤差を考慮していませんでした。さらに、実験の計画や順序も適切ではありませんでした。実験計画法や統計的手法を使って、より客観的な結果を得ることが必要です。実験を行う際は、目的を明確にし、実験後の行動を考えることが重要です。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
従来の実験
従来、私たちが行ってきた実験には、問題とすべき点が多くあります。従来の実験を反省し、正しい実験はいかにあるべきかを検討してみましょう。
従来我々が研究室、パイロット・プラント、工場などにおいて行っていた実験について、そのやり方や結果の解釈をどのようにしていたかを反省してみましょう。
そこにはいろいろな問題があります。
いま、ある合成樹脂の強度が従来法では思わしくないので、触媒量、重合時間、重合温度、原料の種類を変えて、よりよい実験条件をつかもうとする場合を考えましょう。
以下、最も良くない実験のやり方を例に説明します。
従来の触媒量A1、重合時間B1、重合温度C1、原料の種類D1では、強度が平均値で8.5kg/mm2だったとします。
そこで、まず触媒量をA1, A2, A3とかえて、この順に従って実験を行いました。
他の条件は、B1, C1, D1に固定しておき、あまり長時間にわたると実験誤差が大きくなるというので、すばやく実験を行い、一定回数のくり返し実験の平均値として以下のようなデータを得たとしましょう。
この実験では、触媒の量だけを変えています。
同様に、この一組の実験から原料はD3を選ぶことにしました。
以上、一連の実験結果から、触媒量はA2、重合時間はB2、重合温度はC3、原料の種類はD3を最適条件として選び、その条件で作業することにしました。
従来の方法A1B1C1D1のときは平均値8.5kg/m2でしたが、条件をA3B2C3D3に変えれば、それぞれの効果が加わるので、
A3B2C3D3の推定強度=8.5+2.0+1.2+0.4+0.7=12.8kg/mm2
になり、したがって従来の方法より4.3kg/m2も改善されると予想していました。
しかし、実際にA3B2C3D3で作業を始め、実績のデータをとってみたところ、
A3B2C3D3の実績強度=7.5kg/m2
(従来の方法との差 −1.0kg/m2)
となり、かえって悪い結果となってしまいました。
この結論と実際の差は、なぜ起こったのでしょうか。
このような実験のやり方で、はたしてよいのでしょうか。
以上のような問題を、いろいろな面から合理的に解決するのが実験計画法であり、それを解析してより客観的な結論を得ようとするのが分散分析法や、それにともなういろいろの推定法、検定法なのです。
従来の実験で犯しやすい誤り
では、実験にどのような問題があったのでしょうか。
各段階ごとに反省してみましょう。
@実験を計画する段階(この実験は、因子の組み合わせによる影響を考えていない)
この実験では、触媒量Aの条件を変えたときに、他の条件はB1C1D1に固定しました。
したがって、この実験から触媒量について、A3が最適だという結果が得られても、これは他の条件がB1C1D1であるという前提条件つきでの結論です。
ところが、最終的な最適条件としては、他の条件がB2C3D3と決められたので、この場合には触媒量AについてA3が良いという保証はどこにもないのです。
一般に、触媒反応などでは、技術常識からいっても重合温度がC1のときは触媒量はA3が良く、温度がC3のときはむしろA2の方がよいというのが普通です。
このことは、触媒量Aと重合温度Cの条件の組み合わせによっては、特性値が特に大きくなったり小さくなったりする効果があるということで、この実験ではこの点を考慮していないことがわかります。
つまり、2つ以上の因子の組み合わせの影響(これを交互作用、interactionといいます)を考えていないことが反省すべき点なのです。
いま、各因子の組み合わせの影響をすべて見逃さないようにするには、各因子のすべての条件を組み合わせて実験するほかありません。
そのためには、この実験の場合、
Aの条件4種類×Bの条件3種類×Cの条件5種類×Dの条件3種類
=180種類
の実験を必要とすることになります。
もし、本当に全ての組み合わせの影響を見るのであれば、これだけの実験回数は不可欠ですが、ある種の因子の組み合わせの影響は無視できるといった技術情報があれば、これを利用して実験回数を減らす計画を組むことができます。
A実験を実施する段階(この実験は、条件を順に変化させています)
この例で、重合温度を変えるときに、C1,C2,C3,C4,C5の順に変えました。
先ず、C1で5枚、次にC2で5枚、続いてC3,C4,C5という順の各5枚の試片を作って、25回の強度試験もこの順で実施したとします。
このように、実験を条件の順にやった場合、たとえば朝のうちは実験に慣れず、昼頃は上手になり、さらに夕方は疲れてくるといった状況を予想すると、この熟練度の影響で平均強度が8.3, 8.5, 8.7, 8.5, 8.4のようになったかもしれません。
あるいは加工に使用する上記の調子が、昼頃に最も良くなるといった工程要因の影響で、特性値が変化したのかもしれません。
こう考えると、C3のときに+0.4よくなったというのは、実はC3のためではなく、実験順序とともにかかわってくるほかの原因のためかもしれません。
実験を一定の順に行うと、とり上げた因子による影響と、時間順に作用するいろいろなほかの要因による影響とが混ざり合い、その区別が困難になってしまいます。
このように、いくつかの原因が混ざり合い区別が困難になることを、交絡する、confound といいます。
言い換えれば、実験を順に行うことは、純粋のその因子の効果を見出すことを不可能にしてしまうのです。
このような欠陥を防ぐには、たとえばこの25回の実験をランダムな順序に行えばよいことになります。
つまり、すべての実験はランダムな順序に実施するのを一般に原則とすべきなのです。
しかし、技術的にほかの原因の影響がないとすれば、条件の順に実施しても結果は因子の効果を正しく表すはずです。
また、一部の情報を犠牲にして、部分的なランダム化を行う計画法(分割法)もあります。
Bデータを解析する段階(この実験は、実験誤差を考えていない)
実験を行うとき、同じ方法でくり返し実験を行っても、日が変わり、人が変われば異なったデータが得られます。
従来は、いろいろな原因により実験の再現性が得られない心配があると、手早く実験をやってしまい、自分の考えていることと違ったデータが出ると、実験誤差だと言ってこれを捨て、自分の都合のよい結果だけを採用することが多かったです。
一般に、同じ条件で実験を繰り返しても、必ずしも同じデータが得られるものではありません。
実験にあたって規定した各種の条件が微小変動する影響もあるでしょうし、天候、気温のように制御できない環境条件の影響、実験順序に従って変化する熟練条件などの影響も含まれるでしょう。
このように、その実験でとり上げていない無限の原因の影響を受けてデータがばらつき、これが実験誤差となるわけです。
そこで、今、ある実験条件について優劣を論ずるのであれば、必ず同じ実験条件における実験誤差の大きさと比較して、それ以上のよい結果が得られなければ、決定的な判定はできないとします。
たとえば、新しい方法による実験結果がよい結果を示しても、従来の実験誤差の範囲内であれば、その方法が優れているという判定を下すことはできないでしょう。
データの解析にあたっては、実験誤差を正しく求め、この誤差に対してとり上げた因子効果が大きいかどうかを比較しなければなりません。
そのためには統計的な方法が必要であり、その最も普遍的な方法が分散分析法です。
なお、技術的に判断して実験誤差がはっきりわかっており、かつそれが小さいときは、単純な平均値の比較でも実用上は差支えございません。
C実験を企画する段階(一般に、目的のはっきりしない実験が多い)
一般に、従来の実験には目的の明確でないものが多い。
実験の目的は、実験の計画を始める前に十分考えなければならないことであるにもかかわらず、従来は行き当たりばったりに実験を始めている例が少なくない。
特に会社、工場における実験では、その結果により、何らかの行動をとる(例えば作業標準を変える)ために実験を行っているはずです。
しかし、これが案外考えられていないために、実験が全く見当違いの方法で行われたり、単なるデータをとるための実験になったりしているのです。
つまり、実験の企画の段階で、とのような結果が出たらどのような行動をとるかを検討しておくことが必要であり、このような検討が十分であれば、目的に合った特性値や因子とその条件を選ぶことが容易になる。
すなわち、実験の目的を明確にする、実験後の行動の基準を明確にするということが、実験への着手の第一歩であると同時に、統計的な考え方の第一歩でもあります。
このことは、いくら強調しても強調しすぎることはないほど大切な点です。
関連記事