Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における相対度数【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における相対度数【統計解析講義基礎】

統計学における相対度数【統計解析講義基礎】


統計学における相対度数【統計解析講義基礎】

 

現在打率3割を維持している好打者のイチロー。解説者が「1打席目、2打席目が凡退だったので、この3打席目はヒットの確率が高まりましたよ」と発言しました。

 

本当にヒットの確率が高まるのでしょうか。

 

@平均して3割だから、3打席目にヒットが出る確率は確かに高まったといえる

 

A3割打者というのはトータルで見た場合の話。各打席については何もわからないので、確率が高くなったとは言えない

 

B1打席目、2打席目を凡退したということは、体調が良くないということ。さから、3打席目にヒットする確率はさらに低くなるだろう

 

打率とは、安打×打数のこと

 

例えばイチローが今シーズン、100打数30安打だったとします。30÷100=0.3なので、3割打者と評価されます。

 

ほぼ3回に1回の割合でヒットを打つ打者と考えてもいいでしょう。

 

これを相対度数と呼んでいます。

 

相対度数は、単に起きた度数を全度数で割った平均値にすぎません。

 

したがって、「各回の事情には触れていない」ことが重要です。

 

3割打者が2回凡打が続いたからといって、3打席目にヒットを打つ可能性が高まるかというと、「なんとも言えない」というのが答えです。

 

野球の場合、各打席の結果が次の打席に影響しません(これを試行の独立といいます)ものだと考えれば、どの打席でもヒットを打つ可能性は3/10です。

 

イカサマか偶然か

 

ある村の路上で賭けをしています。辺りに警察官はいないようです。

 

コインを投げ、表が出ればお客の勝ち、裏が出れば胴元の勝ちです。

 

確率は0.5ですが、1回100円の参加料で勝てば200円が戻ってきます。

 

期待金額は、200×0.5―100×0.5=50円

 

これは確実にお客に有利な賭けです。

 

しかし、さっきから見ていると、すでに3回連続で裏が出現し、お客が損しています。

 

見かねたお客の1人が、「イカサマだ」と文句をつけると、「3回くらい、裏が出続けることだってあるよ、偶然だ、偶然」と即答しました。

 

確かに3回くらいの偶然なら、あり得そうです。そうこうしているうちに、5回連続で裏が出ました。

 

「おいおい、3回はわかるが、5回連続の裏はおかしいだろ!」という客に対し、「コイントスの確率は、3回裏が出たから次は表の出る確率が高まるというものではないんだ」と答えます。

 

3割打者の例と同じように、確かに表が出るか裏が出るかは、毎回独立しています。

 

さて、今回の場合、どのように言えば胴元に「イカサマです」と認めさせることができるでしょうか。

 

偶然、裏が出続けることは確かにあります。しかし、100回も出続ければ誰だって「イカサマ」と思うし、胴元も認めざるをえません。

 

50回でも、20回でも同じです。では、何回連続して裏が出続ければ「イカサマ」と言えるのでしょうか。

 

「たくさん出たらイカサマ」では曖昧です。人によって感じ方も違います。

 

そこで、統計学では「偶然か否か」、つまり「たまたま起きたことなのか、何か原因がある(イカサマ)のか」を考える際、ある数値で「線引き」をします。

 

それが5%ラインです。厳密性を要する場合は1%を使うこともあります。

 

ただし、これは5%以内になったから必ずイカサマということではありません。

 

便宜的に、そのラインで判断しようということです。

 

賭け事やゲームをする前に、数値で線引きをすることを提案し、「統計学で認められている5%を基準とする」と相手に認めさせます。

 

よって、5%以下の確率で起きることならイカサマとします。

 

コイン投げの場合、5回連続して裏の出る確率は約3%、これは5%を割っていますから、イカサマだと説得します。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学における相対度数【統計解析講義基礎】

統計学における相対度数【統計解析講義基礎】

統計学における相対度数【統計解析講義基礎】