独立標本t検定で比較!2つの平均を正確に分析【ChatGPT統計解析】
独立標本t検定は、2つの独立した標本の平均を比較し、それらが取られた母集団の平均が同じかどうかを判断する統計手法です。被験者に関連性がないことが前提であり、標本は独立に選ばれなければなりません。中心極限定理を適用するためには、標本数が十分であることが重要です。検定では通常、母分散が等しいという仮定が用いられますが、仮定が満たされない場合は代替の統計手法を使用します。自由度は標本サイズに基づき計算され、信頼区間を通じて結果を評価します。例えば、サッカー選手とバレエダンサーの健康指数を比較する研究では、t検定を使用して差が有意でないことが示されました。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
独立標本t検定とは
二標本t検定とも言う独立標本t検定は、2つの標本の平均を比較するものであり、標本が取られた母集団同士の平均が同じであるか否かを決定することが目的である。
2つの標本の被験者に関連性はないものとし(被験者の中に2回テストされたものや兄弟がいないように)、2つの標本は母集団から独立に選出されなければならない。
加えて、中心極限定理を適用できるだけの標本の数がある場合を除いて、標本が取られた母集団がほぼ正規分布であり、ほぼ等分散であるものとする。
独立標本t検定は多くの専門分野において一般的に使われており、大概は母分散が等しいことを仮定している検定(リーベン検定(Levens test)、ブラウン・フォーサイス検定(Brown-Forsythe test)、バートレット検定(Bartletts test)など)と、この仮定が満たされなかった場合の統計的な解決策を用意したソフトウェアを使って計算される。
独立標本t検定の計算
独立標本t検定の式
独立標本t検定の帰無仮説ではしばしば母平均同士の差が0になる。
その場合、(μ1−μ2)の項が式から消えるということに注意する。
二標本t検定の自由度(n1+n2−2)は単に両方の標本を合わせたときよりも2少なくなる。
独立標本t検定の式は一標本t検定の式(分子が平均同士の差、分母が標本中で見られる変動と標本数の両者を組み込む変動の測度)に似ている。
「対応のあるt検定(Paired t-test)」の検定統計量もまた、多少の違いはあるがこの基本的な形に従う。
例えば、男性サッカー選手は男性のバレエダンサーよりもより引き締まっているかという長年の身体能力に関する問題がある。
そこでスポーツ生理学者はこの問題の答えを出すために地元病院の研究班と共同で研究をする。
サッカー選手であり、バレエダンサーでもある被験者はいないので、2つのグループは独立した母集団になる。
それぞれのプロ協会に所属している全国のバレエダンサーとサッカー選手の2つのリストがあるとし、被験者はそれぞれのグルーブから無作為に選出されるとする。
バレエダンサーとサッカー選手はとても忙しいので、それぞれのグループから10人しか選出できない。
すべての被験者が歩くこと、走ること、ステップを踏むこと、それ相応の健康状態に関連する心拍変動や脈波伝播速度などをはじめとした生理学的な測定など、身体機能に関するさまざまなテストを受ける。
こうした測定は1つに集約され0点から100点の健康指数が決まる。
この手法を使っての評価実績から、この研究で使われたアルゴリズムで計算された健康指数は母集団の中でほぼ正規分布になることが証明されている。
被験者たちは同じ日に同じ研究所でテストされ、彼らのテスト結果は同じ研究者が評価し集約した。
2つのグループの結果を以下表に示す。
バレエダンサーとサッカー選手の健康指数
この研究ではα= 0.05を使用する。
標準偏差を求める式を使って、t統計を手計算で求めることもできる(分散は標準偏差の2乗であることも忘れてはいけない)。
バレエダンサーが標本1でサッカー選手が標本2とする。
統計ソフトを使って計算するなら、等分散の仮定をリーベン検定(2つの母分散が等しいとする帰無仮説を検証する検定)を使って確かめる。
もしくはその他の代替検定を使ってもよい。
合併標本分散値は以下式のように計算される。
合併標本分散値の計算
自由度はdf=n1+n2−1=18である。
帰無仮説は2つのグループの健康指数の平均は等しいことを表しており、μ1−μ2=0となる。
この帰無仮説を検証するためには、以下式で示すようにt統計量を求める。
t統計量の計算
有意水準α= 0.05、自由度df=18の両側t検定の上方棄却値が2.101である。
t値の絶対値は上方棄却値の値よりも低い(すなわち、0により近い)。
したがって、帰無仮説を棄却できず、この研究ではサッカー選手とバレエダンサーの引き締まり具合の差を証明できる証拠は見つからないということになる。
独立標本t検定における信頼区間
独立標本t検定における両側信頼区間の計算のためには以下式を使う。
独立標本t検定における両側信頼区間の式
この式にはいくつかの注目すべき点がある。
@これは「2つの母集団の平均の差」の信頼区間である。
Aこれが片側信頼区間だった場合は、上棄却t値には、α/2ではなくαに対応するものを使う。そして、信頼区間の方向に応じて±ではなく正か負かのいずれかを使う。
Bこの式は、独立標本t検定の分母を含む。
このデータでは有意水準α= 0.05を使い、95%両側信頼区間を計算した。
計算結果は以下のようになる。
独立標本t検定における95%両側信頼区間の計算
この信頼区間には空値0(帰無仮説において平均の差として仮定した値)が入ることに注意すること。
そしてこの結果は帰無仮説を棄却できないので(データ集合において、有意な結果が得られないことから)予想されるものである。
関連リンク