Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における第1種の誤りと第2種の誤り【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における第1種の誤りと第2種の誤り【統計解析講義基礎】

統計学における第1種の誤りと第2種の誤り【統計解析講義基礎】


統計学における第1種の誤りと第2種の誤り【統計解析講義基礎】

 

誤報を避けようとしたばかりに

 

2004年3月、六本木ヒルズの回転扉で6歳の男児が頭をはさまれて死亡しました。

 

回転扉上部に設置された赤外線センサーの感知範囲が、誤作動防止のため当初の設定値「80cm以上天井まで」から「120cm以上天井まで」と変更されて狭くなり、男児を感知できなかったのです。

 

これは当初の設定値では、センサーが風による安全柵のベルトの揺れに過敏に反応して急停止が頻発したためとのことでした。

 

火災報知器が誤報をしばしば繰り返すと、警報が鳴っても「また誤報だよ」と思って、警報を信じなくなります。

 

これがさらに進むと、報知器の電源を切ってしまいます。このときオオカミ少年の話と同じことが生じるのです。今回の痛ましい事件も同じです。

 

しきい値が判定の境目

 

図1は、センサーによる誤報発信の有無をモデル化したものです。

 

左側は何も異常が生じていない正常のときにセンサーが受けとる被対象物の最大高さの測定値の分布、右側は人が危険域に入るなど、何らかの異常が生じた時の測定値の分布です。

 

測定値が警報を発する境界値であるしきい値を越えれば異常と判断して回転を止め、さもなければ回転し続けます。

 

すなわち、正常の時でもしきい値よりも大きな値が感受されれば誤報(この確率をα:アワテモノの誤り)、異常の時に、しきい値よりも小さな値であれば、欠報(この確率をβ:ボンヤリモノの誤り)となります。

 

αは統計学の分野では第1種の誤り(あるいは有意水準)、βは第2種の誤りとよばれています。

 

しきい値の変更のみに着目すると、図1(当初の80cm)のようにβを小さくすればαは大きくなり、逆に図2(事故当時の120cm)のようにαを小さくすればβは大きくなります。

 

どのようにすればαもβも小さくできるでしょうか。

 

両方の誤りとも小さくする

 

答えはセンサーの数を増やすことです。

 

原子力プラントでは通常2-out-of-3モニタリングシステムと呼ばれる方式が採用されています。

 

これは3つのセンサーのうち2つ以上がしきい値を超えたときに警報が出るというものです。

 

必要であればさらにセンサーの数を増やして、k-out-of-n方式を採用すればよいのです。

 

あるいは複数のセンサーが感知した最大の高さを用い、たとえば3つのセンサーの測定値の平均を使ってしきい値との比較を考えます。

 

これは図1において正常の時の測定値の分布を帰無仮説H0、異常の時の測定値の分布を対立仮説H1とする母平均に関する統計的仮説検定と同一となります。

 

心に留めておきたいことは、必ずシステムの診断(われわれの判断も)には、2つの誤りすなわちαとβが存在する、ということです。

 

この両者を少なくするためにはしきい値を変えるのではなく、サンプル数(上記の例ではセンサー数)を増加することが大切です。

 

これを図示すると図3のようになり、正常と異常の時の測定値の分布のバラツキが小さくなることにより、αとβが抑えられるわけです。

 

なお、統計的仮説検定では通常α=0.05とおかれます。

 

センサーなどの安全性に関連する製品ではβ(本当は危険なのに安全と判断される確率)を極力小さくする必要があります。

セミナー詳細こちら                    解析ご相談こちら


 

統計学における第1種の誤りと第2種の誤り【統計解析講義基礎】

統計学における第1種の誤りと第2種の誤り【統計解析講義基礎】

統計学における第1種の誤りと第2種の誤り【統計解析講義基礎】