統計学における比較【統計解析講義基礎】

統計学における比較【統計解析講義基礎】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

統計学における比較|【統計学・統計解析講義基礎】

統計学における比較【統計解析講義基礎】


目次  統計学における比較【統計解析講義基礎】

 

 

統計学における比較(comparison)

 

比較を平均で見るときは散らばりも考える

 

平均の値を計算するとき、ほかの集団と比較する動機で計算することも多い。

 

2集団の比較は統計的データ分析の中でも最もよく行われている。

 

統計学における比較【統計解析講義基礎】

 

表2に示された県別の60年度の経済成長率を1(北海道)から47(沖縄)へずっと目で追っていくと、後半で成長率が下がってゆく傾向を否定することができない。

 

そこで、47都逆府県を、東(北)日本24ケース(1 -24)と西(南)23ケース(25-47)に分け、経済成長率を比較することにする。

 

成長率をXで、東、西日本を1、2で表しておこう。

 

データをエクセルに入れて計算すると

 

X1の平均=6.5917% (東日本)、 X2の平均= 4.8696% (西日本)

 

で、やはりかなりの差がありそうである。

 

標準偏差は、

 

S1 =1.709 (東日本)、  S2=2.083 (西日本)

 

で、西日本では散らばりが大きい。

 

散らばりは分散(標準偏差の2乗)で見てもよい。

 

そこで、平均値の差=1.72ついて調べよう。

 

前段階として2つの集団の分散が等しいか否かをまず調べる。

 

散らばりが著しく異なる2集団を比較すること自体が統計的には無意味だからである。

 

2つの物体の重量の比較は、同一あるいは同種の秤で行うことが適切であることと同じ考えである。

 

分散の比をとって比較すると

 

統計学における比較【統計解析講義基礎】

 

となって、この程度では1.0から大きく離れておらず、分散の違いは無視できる(有意でない)。

 

両側有意確率= 0.352で、通常の有意性の基準0.05までいまだ達していない。

 

 

スチューデントのt

 

そこで差を調べる。差は、

 

A=6.5917−4 869=1.7221

 

であるが、この差はほんとうに違いがあることを示しているのだろうか。

 

これを判断する基準は、それぞれのサンプルの標準偏差1,709、2,083 (あるいは分散)から次のように計算されることがわかっている。

 

統計学における比較【統計解析講義基礎】

 

じつは、このBは平均値の差の標準偏差で、差AがこのBの何倍になるかを見ればよいが、ここでは、

 

 T=A/B=3.10 (2標本t)

 

となる。この差1.7221はかなり大きく、0から基準値の3倍以上ずれており、結論としていえば、東日本と西日本の経済成長率は昭和60年度では有意に異なっている。

 

この比A/Bを最初に考えた学者の名をとって「スチューデントのt」という。

 

エクセルによるスチューデントのtの計算

 

エクセルの「分析ツール」で「t検定」を用いると、平均、標準偏差、Fの値(1.486)、Xの値(3.10)まで一挙に計算できる。

 

左側の欄が分散が等しいとの判断の場合である。

 

専門的になるがtの値が大きく(小さく)なると、有意な確率(「両側確率」と表示されている)は小さく(大きく)なる。

 

有意確率が0.05より小さいかぎり「差がある」(差は有意)と判断してよい。

 

 

統計学における比較【統計解析講義基礎】


セミナー詳細                    解析ご相談                    LINEでお友達

統計学における比較【統計解析講義基礎】

統計学における比較【統計解析講義基礎】