Python・R・エクセルによるデータサイエンス | 統計解析講義

リスクを測って行動を決める統計学【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

リスクを測って行動を決める統計学【統計解析講義基礎】

リスクを測って行動を決める統計学【統計解析講義基礎】


リスクを測って行動を決める統計学【統計解析講義基礎】

統計的意思決定

 

朝、家を出るときに、傘を持っていくかどうかを考えることがあると思います。

 

今日雨が降るかどうかは、朝の天気予報をみればわかりますが、予報が「雨が降る確率」で表されているように、その情報は不確かです。

 

傘を持っていっても、結局雨が降らなければ、邪魔になるだけです。

 

また、傘を持っていかなくても雨が降ると、濡れてしまって風邪をひくかもしれません。

 

意思決定とは、この例のように、次にどういう行動をするかを決めることをいいます。

 

次の行動を決めるときに参考にする情報は、未来についての情報ですから、常に不確かです。

 

したがって、上の例のように、ある行動を起こしたが、その行動は結果的に間違っていたということが常に起こりえます。

 

そこで、間違った行動を起こしたときの損失を考えて行動を決定する必要があります。

 

さらに重要なのは、当然のことですが、

 

今から起こす行動が正しい行動なのか、それとも間違った行動なのかは、今の時点では不確かである。

 

ということです。それを承知の上で意思決定をするために、

 

今から起こす行動によって起きる損失の期待値を考えて、損失の期待値が少ない行動を選ぶ

 

という原理を採用します。

 

損失の考え方

 

先の雨傘の例のように、現実の状況に適切でない間違った行動をとると、何らかの損失が生じます。

 

そこで、かつて問題になったインフルエンザ発生の疑いのある国からの旅行者の入国許可問題を考えてみましょう。

 

インフルエンザ発生の疑いのある国への渡航した人が帰ってくると、

 

@ほんとうにウイルスをもっている

 

A実際にはウイルスをもっていない

 

という2通りの状況が考えられます。

 

もちろん、この人がどちらであるかはわかりません。一方、日本側の行動は、

 

@入国を許可しない(空港ホテルに停留させる)

 

A入国を許可する

 

の2通りが考えられます。

 

このとき、その状況と行動の組み合わせによって、以下のような結果が生じます。

 

@ウイルスあり ⇒ 入国不許可により被害を未然に防ぐことができる。入国許可によりウイルスが蔓延する可能性がある。

 

Aウイルスなし ⇒ 入国不許可により観光や仕事ができなくなる。入国許可により特に問題はおこらない。

 

さて、問題なのは、状況は確実にはわからないので、いま行動を決めたとしても、それが正しい行動か間違った行動かはわからないことです。

 

ウイルスをもっているかどうかは検査しなければわかりませんし、検査してもほんとうに正確な結果がわかるかどうかはわかりません。

 

ウイルスをもっているかどうかについての推測にすぎません。

 

また、検査するのにはお金と時間がかかりますから、そもそもすべての入国者を検査することはできないかもしれません。

 

そこで、とりあえず検査(推測)を行ったとして、それぞれの推測結果に対して、それぞれよかれと思う行動を決めることにします。

 

この、推測結果ー行動の組を、ここでは「行動の決め方」jとよぶことにします。

 

たとえば、

 

@検査の結果、ウイルスがあると推測 ⇒ 入国不許可

 

A検査の結果、ウイルスがないと推測 ⇒ 入国許可

 

というのは、ごく常識的な、ひとつの行動の決め方です。あるいは、

 

@検査の結果、ウイルスがあると推測 ⇒ 入国不許可

 

A検査の結果、ウイルスがないと推測 ⇒ やっぱり入国不許可

 

というやりかた、すなわち、検査にお金がかかるので、検査などをせず、とにかく鎖国してしまえば安全というのも、ひとつの行動の決め方です。また、

 

@検査の結果、ウイルスがあると推測 ⇒ それでも入国許可

 

A検査の結果、ウイルスがないと推測 ⇒ 当然入国許可

 

というやり方もあります。

 

これは結局、検査などをせず、たいしたことではないから入国させてしまおうという考えです。

 

どの行動の決め方が一番いいかを選ぶのが、意思決定です。意思決定の考え方の指針として、

 

もっともよい行動の決め方とは、損失を最小にする決め方である

 

とします。そこで、損失をお金で表すという考えにしたがって、状況と行動の組み合わせに対して、発生する損失の額を見積もって割り振ります。

 

これを損失関数といいます。

 

行動のもっともよい決め方とは

 

では、ひとつの行動の決め方について、ある状況が生じたときの損失はいくらになるでしょうか。

 

それは、何ともいえません。

 

なぜならば、行動の決め方では、ひとつの推測に対してひとつの行動が決まっているのであって、ひとつの状況に対してひとつの行動が決まっているわけではないからです。

 

推測は不確実ですから、あるひとつの状況においても、推測の結果にはいくつかの可能性があります。

 

たとえば、ほんとうはウイルスがあるというひとつの状況においても、推測の結果は

 

@ウイルスがあると推測(検査が正解)

 

Aウイルスがないと推測(検査が見逃し)

 

の2通りの状況が考えられます。

 

そこで、ほんとうはウイルスがあるというひとつの状況において、ウイルスがあると推測する確率と、ウイルスがないと推測する確率を見積もります。

 

こうすると、ほんとうはウイルスがあるという状況での平均損失、すなわち損失の期待値を計算することができます。

 

これを危険関数といいます。

セミナー詳細こちら                    解析ご相談こちら


 

リスクを測って行動を決める統計学【統計解析講義基礎】

リスクを測って行動を決める統計学【統計解析講義基礎】

リスクを測って行動を決める統計学【統計解析講義基礎】