センサー増で解決!誤認エラーを減らす科学【ChatGPT統計解析】
統計学では、実際には安全なのに危険だと誤認する第1種の過誤(αエラー)と、本当は危険なのに安全と誤認する第2種の過誤(βエラー)がある。センサーの数を増やすことで、これらのエラーを同時に減らすことが可能である。例えば、原子力プラントでは「2-out-of-3モニタリングシステム」が使われ、3つのセンサーのうち2つがしきい値を超えた場合に警報を発する。この方法により、誤報(αエラー)と欠報(βエラー)のリスクを共に低減することができる。センサーの数を増やすことにより、測定値の分布のバラツキを小さくし、正確な判断を促す。安全性に関わる製品では、特にβエラーを最小限に抑えることが重要である。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
目次 センサー増で解決!誤認エラーを減らす科学【ChatGPT統計解析】
αエラーとβエラー
本当は安全なのに危険と判断する誤りを第1種の過誤またはαエラーと呼びます。
逆に、本当は危険なのに安全と判断する誤りを第2種の過誤またはβエラーと呼びます。
センサーによる警報発信:誤報を避けようとしたばかりに
2004年3月、六本木ヒルズの回転扉で6歳の男児が頭をはさまれて死亡しました。
回転扉上部に設置された赤外線センサーの感知範囲が、誤作動防止のため当初の設定値「80cm以上天井まで」から「120cm以上天井まで」と変更されて狭くなり、男児を感知できなかったのです。
これは当初の設定値では、センサーが風による安全柵のベルトの揺れに過敏に反応して急停止が頻発したためとのことでした。
火災報知器が誤報をしばしば繰り返すと、警報が鳴っても「また誤報だよ」と思って、警報を信じなくなります。
これがさらに進むと、報知器の電源を切ってしまいます。このときオオカミ少年の話と同じことが生じるのです。今回の痛ましい事件も同じです。
しきい値が判定の境目
以下の図1は、センサーによる誤報発信の有無をモデル化したものです。
左側は何も異常が生じていない正常のときにセンサーが受けとる被対象物の最大高さの測定値の分布、右側は人が危険域に入るなど、何らかの異常が生じた時の測定値の分布です。
測定値が警報を発する境界値であるしきい値を越えれば異常と判断して回転を止め、さもなければ回転し続けます。
すなわち、正常の時でもしきい値よりも大きな値が感受されれば誤報(この確率をα:アワテモノの誤り)、異常の時に、しきい値よりも小さな値であれば、欠報(この確率をβ:ボンヤリモノの誤り)となります。
αは統計学の分野では第1種の誤り(あるいは有意水準)、βは第2種の誤りとよばれています。
しきい値の変更のみに着目すると、図1(当初の80cm)のようにβを小さくすればαは大きくなり、逆に図2(事故当時の120cm)のようにαを小さくすればβは大きくなります。
どのようにすればαもβも小さくできるでしょうか。
センサーの数を増やしαとβをともに小さくする
答えはセンサーの数を増やすことです。
原子力プラントでは通常2-out-of-3モニタリングシステムと呼ばれる方式が採用されています。
これは3つのセンサーのうち2つ以上がしきい値を超えたときに警報が出るというものです。
必要であればさらにセンサーの数を増やして、k-out-of-n方式を採用すればよいのです。
あるいは複数のセンサーが感知した最大の高さを用い、たとえば3つのセンサーの測定値の平均を使ってしきい値との比較を考えます。
これは図1において正常の時の測定値の分布を帰無仮説H0、異常の時の測定値の分布を対立仮説H1とする母平均に関する仮説検定と同一となります。
心に留めておきたいことは、必ずシステムの診断(われわれの判断も)には、2つの誤りすなわちαとβが存在する、ということです。
この両者を少なくするためにはしきい値を変えるのではなく、サンプル数(上記の例ではセンサー数)を増加することが大切です。
これを図示すると図3のようになり、正常と異常の時の測定値の分布のバラツキが小さくなることにより、αとβが抑えられるわけです。
なお、統計的仮説検定では通常α=0.05とおかれます。
センサーなどの安全性に関連する製品ではβ(本当は危険なのに安全と判断される確率)を極力小さくする必要があります。
ChatGPTに聞いてみた
プロンプト
あなたは最高のデータサイエンティストです。
第1種の過誤と第2種の過誤について解説してください。
#制約条件:
サルでもわかる平易な日本語で
文字数は300字程度
ChatGPTの回答
第1種の過誤は、「実は間違っているのに、正しいと判断してしまうミス」です。たとえば、幽霊はいないのに「幽霊がいる!」と信じ込むようなものですね。統計で言うと、本当は差がないのに「差がある」と結論づけてしまうことを言います。第2種の過誤はその逆で、「実は正しいのに、間違っていると判断してしまうミス」です。幽霊が実はいるのに「幽霊なんていない」と思い込むケースです。統計では、本当は差があるのに「差がない」と間違って結論づけてしまうことを指します。要は、第1種の過誤はないものをあると見間違え、第2種の過誤はあるものをないと見落とすことです。サルでもわかるように言えば、バナナがないのに「ある!」と言ってしまうのが第1種、バナナがあるのに「ない!」と言ってしまうのが第2種の過誤です。
関連リンク