統計で解明!東西日本の成長率差の真相【ChatGPT統計解析】
統計学では、異なる集団の平均を比較する際に、データの散らばり(標準偏差)も考慮します。昭和60年度の47都道府県の経済成長率を東日本と西日本に分けて比較した結果、東日本の平均成長率が西日本より高く、標準偏差も異なることがわかりました。t検定を用いて差の有意性を確認したところ、t値が3.10で有意確率が0.05未満であり、東西の経済成長率に有意な差があると判断されました。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
統計学における比較(comparison)
比較を平均で見るときは散らばりも考える
平均の値を計算するとき、ほかの集団と比較する動機で計算することも多い。
2集団の比較は統計的データ分析の中でも最もよく行われている。
表2に示された県別の60年度の経済成長率を1(北海道)から47(沖縄)へずっと目で追っていくと、後半で成長率が下がってゆく傾向を否定することができない。
そこで、47都逆府県を、東(北)日本24ケース(1 -24)と西(南)23ケース(25-47)に分け、経済成長率を比較することにする。
成長率をXで、東、西日本を1、2で表しておこう。
データをエクセルに入れて計算すると
X1の平均=6.5917% (東日本)、 X2の平均= 4.8696% (西日本)
で、やはりかなりの差がありそうである。
標準偏差は、
S1 =1.709 (東日本)、 S2=2.083 (西日本)
で、西日本では散らばりが大きい。
散らばりは分散(標準偏差の2乗)で見てもよい。
そこで、平均値の差=1.72ついて調べよう。
前段階として2つの集団の分散が等しいか否かをまず調べる。
散らばりが著しく異なる2集団を比較すること自体が統計的には無意味だからである。
2つの物体の重量の比較は、同一あるいは同種の秤で行うことが適切であることと同じ考えである。
分散の比をとって比較すると
となって、この程度では1.0から大きく離れておらず、分散の違いは無視できる(有意でない)。
両側有意確率= 0.352で、通常の有意性の基準0.05までいまだ達していない。
スチューデントのt
そこで差を調べる。差は、
A=6.5917−4 869=1.7221
であるが、この差はほんとうに違いがあることを示しているのだろうか。
これを判断する基準は、それぞれのサンプルの標準偏差1,709、2,083 (あるいは分散)から次のように計算されることがわかっている。
じつは、このBは平均値の差の標準偏差で、差AがこのBの何倍になるかを見ればよいが、ここでは、
T=A/B=3.10 (2標本t)
となる。この差1.7221はかなり大きく、0から基準値の3倍以上ずれており、結論としていえば、東日本と西日本の経済成長率は昭和60年度では有意に異なっている。
この比A/Bを最初に考えた学者の名をとって「スチューデントのt」という。
エクセルによるスチューデントのtの計算
エクセルの「分析ツール」で「t検定」を用いると、平均、標準偏差、Fの値(1.486)、Xの値(3.10)まで一挙に計算できる。
左側の欄が分散が等しいとの判断の場合である。
専門的になるがtの値が大きく(小さく)なると、有意な確率(「両側確率」と表示されている)は小さく(大きく)なる。
有意確率が0.05より小さいかぎり「差がある」(差は有意)と判断してよい。
関連リンク