ゴセットとt分布|【統計学・統計解析コラム】
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
ゴセット
1876年イングランド・カンタベリー生まれのゴセット(William Sealev Gosset;1876- 1937)は,イングランド南東部にあって600年の歴史を誇るパブリックスクールの名門中の名門,ウィンチェスターカレッジを卒業し,オックスフォード大学のニューカレッジに進学した.
1897年に数学の学位を,その2年後に化学の修士号を得た.
卒業後ただちにアイルランドの首都ダブリンのギネスビールに入社.
ギネスは技術部門を強化するためにオックスブリッジ(オックスフォード大学とケンブリッジ大学の両方をあわせた略称)の新卒の採用を数年前から開始したところだった.
彼はビールの品質を左右する大麦,ホップなどの原材料および製造工程を調査し,それらの影響の程度を考究した.
大麦の生産からイーストの発酵までの製造工程に関する統計的な研究のために,彼は遺伝学の権威ゴールトンの立てたロンドン大学生物研究所に1906年に派遣され,カールピアソン(1857-1936)の下で学ぶ.
この年にサティーズ家のマージョリと結婚する.
彼女の姉デーム(Dame Surtees Phillpotts)はスカンジナビア文学・言語で名をはせた,ケンブリッジ大学カートンカレッジの女性研究者となる.
ビールの醸造は温度や湿度,口照そして風などの微妙な条件の下の作業工程であって,一度に大量の標本が取れるものではない.
t分布の考案
ゴセットは,ビールの品質管理に従事するなかで,実験データの数が大きくない場合には,標準正規分布に従わないことに気づき,スチューデントのt分布を考案した.
本名でなくペンネーム,スチューデントなる名前で次々と統計学の論文を発表したのは,会社から匿名およびデータの隠匿を条件に許可されていたからである.
したがって,彼の論文のデータにはギネスビールの製造工程に関するものは一切なく,他の研究データの引用に終始している.
彼の当時の小標本の発想をうかがわせる実験データは提示されていない.
その後ダブリンに戻った彼は,アイルランド農務省と大麦の品質改良に主導的に取り組む.
彼の死の2年前にロンドンに新設したギネスビールエ場の責任者としてダブリンを離れ, 1937年に技術本部長の現職で死去した.
仕事を愛し家族を愛する人だった.
46歳まで助手もなしに1人で統計の仕事をこなしていた.
計算が得意でテキパキと仕事をこなす.
たまに計算ミスもするが,仕事のメモも研究のメモもそこいらにある手紙の後ろや紙切れを使ってやっていた.
数値表を使うのでなく,最初の定義からやらねば気が済まない性分であったらしい.
最初からやると精神の柔軟性を維持できると答えたという.
それに,怠け者なので数値表を探す面倒をするくらいなら自分で計算した方が早いと答えたという.
多趣味の人でなんでもこなした.
スキーにヨット,そのヨットも自ら製作した.
穴を開けるのにナイフを巧みに使ったという.
24時間をフルに使って凡人ではしかねるほどの仕事と趣味とつきあいをこなした.
ゴセットの口から忙しいという言葉を聞いたことがないと親しい友人は証言している.
とくに, 1908年の「The Probable Error ofaMean」は,標本数が小さい場合の標本平均の統計的性質を理論的に考究した先駆的な論文である.
この論文で,彼は小標本の下での分布を考えた.
母標準偏差が未知なので,代わりに標本標準偏差を使わざるを得ない状況を考えている.
この論文の骨格は,「実験計画法」の創始者R. A.フィッシャー(1890-1962)によれば,まず,この確率分布を正しく推測したことにある.
次に標本標準偏差と標本平均が無相関であることを示した上でそれらが統計的に独立であることを正しく推測した.
1907年5月12日の友人への手紙で「疑問点を明解に説明しようとすると問題がますます難しくなることを恐れています.…しかし,会社は統計的な研究から多くの利益を享受するであろうから私の労苦は必要なものです」と告白している.
ある一定の平均と標準偏差に従う正規分布において,ランダムに標本を取って,変量を計算する.
この煩雑な数値実験を何回も繰り返すことで,今日t分布として知られる新しい分布を数値実験的に導出した.
これに理論的な解答を明示的に与えたのは,フィッシャーである.
関連記事