偶然の確率を超えた時、相対度数が語る真実【ChatGPT統計解析】
相対度数は、ある出来事が全体の中で占める割合を示し、統計学ではこの指標を用いて偶然の範囲を定量的に評価します。例えば、イチローの打率3割は各打席でヒットを打つ確率を表し、この確率は過去の結果に依存しません。また、コイン投げで連続して裏が出る確率は、回数が増えると指数関数的に低くなり、5回連続で裏が出る確率は約3%です。統計学では、偶然を超える出来事の基準として5%の確率を設定し、これを下回る場合には何らかの特別な原因を疑います。この基準は、特定の現象が偶然かそれとも意図的な操作によるものかを判断する際に役立ちます。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
相対度数とは
かつて打率3割の好打者イチロー。解説者が「1打席目、2打席目が凡退だったので、この3打席目はヒットの確率が高まりましたよ」と発言しました。
本当にヒットの確率が高まるのでしょうか。
@平均して3割だから、3打席目にヒットが出る確率は確かに高まったといえる
A3割打者というのはトータルで見た場合の話。各打席については何もわからないので、確率が高くなったとは言えない
B1打席目、2打席目を凡退したということは、体調が良くないということ。さから、3打席目にヒットする確率はさらに低くなるだろう
打率とは、安打×打数のこと
例えばイチローが今シーズン、100打数30安打だったとします。30÷100=0.3なので、3割打者と評価されます。
ほぼ3回に1回の割合でヒットを打つ打者と考えてもいいでしょう。
これを相対度数と呼んでいます。
相対度数は、単に起きた度数を全度数で割った平均値にすぎません。
したがって、「各回の事情には触れていない」ことが重要です。
3割打者が2回凡打が続いたからといって、3打席目にヒットを打つ可能性が高まるかというと、「なんとも言えない」というのが答えです。
野球の場合、各打席の結果が次の打席に影響しません(これを試行の独立といいます)ものだと考えれば、どの打席でもヒットを打つ可能性は3/10です。
偶然か否かの判断基準
ある村の路上で賭けをしています。辺りに警察官はいないようです。
コインを投げ、表が出ればお客の勝ち、裏が出れば胴元の勝ちです。
確率は0.5ですが、1回100円の参加料で勝てば200円が戻ってきます。
期待金額は、200×0.5―100×0.5=50円
これは確実にお客に有利な賭けです。
しかし、さっきから見ていると、すでに3回連続で裏が出現し、お客が損しています。
見かねたお客の1人が、「イカサマだ」と文句をつけると、「3回くらい、裏が出続けることだってあるよ、偶然だ、偶然」と即答しました。
確かに3回くらいの偶然なら、あり得そうです。そうこうしているうちに、5回連続で裏が出ました。
「おいおい、3回はわかるが、5回連続の裏はおかしいだろ!」という客に対し、「コイントスの確率は、3回裏が出たから次は表の出る確率が高まるというものではないんだ」と答えます。
3割打者の例と同じように、確かに表が出るか裏が出るかは、毎回独立しています。
さて、今回の場合、どのように言えば胴元に「イカサマです」と認めさせることができるでしょうか。
偶然、裏が出続けることは確かにあります。しかし、100回も出続ければ誰だって「イカサマ」と思うし、胴元も認めざるをえません。
50回でも、20回でも同じです。では、何回連続して裏が出続ければ「イカサマ」と言えるのでしょうか。
「たくさん出たらイカサマ」では曖昧です。人によって感じ方も違います。
そこで、統計学では「偶然か否か」、つまり「たまたま起きたことなのか、何か原因がある(イカサマ)のか」を考える際、ある数値で「線引き」をします。
それが5%ラインです。
厳密性を要する場合は1%を使うこともあります。
ただし、これは5%以内になったから必ずイカサマということではありません。
便宜的に、そのラインで判断しようということです。
賭け事やゲームをする前に、数値で線引きをすることを提案し、「統計学で認められている5%を基準とする」と相手に認めさせます。
よって、5%以下の確率で起きることならイカサマとします。
コイン投げの場合、5回連続して裏の出る確率は約3%、これは5%を割っていますから、イカサマだと説得します。
まとめ
相対度数とその統計的意味、および偶然と意図的な操作(イカサマ)の区別をどのようにして行うかがポイントです。
相対度数は、特定の結果が全試行回数の中でどれだけの割合で起こったかを示す指標です。
これを通じて、例えばスポーツやゲームにおける成績や結果を定量的に評価します。
イチローの打率の例では、彼が長期間にわたり3割の打率を保っている場合、各打席でヒットを打つ確率は独立していて、前の打席の結果には影響されません。
したがって、2回連続でアウトになった後でも、次の打席でヒットを打つ確率は変わりません。
コイン投げのケースでは、確率的に表裏が出るチャンスは各々50%ですが、連続して裏が出る確率は、その回数が増えるほど指数関数的に低くなります。
5回連続で裏が出る確率は約3%であり、これが統計学で一般的に用いられる5%の有意水準を下回るため、イカサマの疑いが高まります。
統計学では、偶然の範囲を超えた出来事が発生する確率を5%未満(場合によっては1%未満)として、それを超えた場合には何らかの特別な原因やメカニズムが働いていると考えることがあります。
この基準は、科学的研究や意思決定の際に重要な役割を果たしますが、必ずしもイカサマなど悪意のある行為を直接証明するものではありません。
しかし、異常な結果が続く場合、より詳細な調査や検証が必要であるという警告信号として機能します。
ChatGPTに聞いてみた
プロンプト
あなたは最高のデータサイエンティストです。
相対度数について解説してください。
#制約条件:
サルでもわかる平易な日本語で
文字数は300字程度
ChatGPTの回答
相対度数っていうのはね、いろんなことがどれくらい起こるかをパーセント(%)で表す方法のことだよ。たとえば、あるクラスでアンケートをとって、「好きな食べ物は何ですか?」って聞いたとき、10人中3人が「ピザ」と答えたら、ピザが好きな人の割合を出すのに相対度数を使うんだ。「ピザって答えた人が全体の何%かな?」って計算するわけ。3人がピザ好きで、聞いたのが10人だから、30%がピザ好きってことになるね。このやり方で、いろんなことがどれくらいの割合で起きてるかを見ることができるんだ。統計学では、この相対度数を使って、物事がたまたまなのか、それとも何か理由があるのかを考えたりするんだよ。とっても便利で大事なツールなんだ。