ビールと統計をつなぐ天才・ゴセットのt分布物語【ChatGPT統計解析】
ゴセット(1876-1937)はオックスフォード大学で数学と化学を学び、ギネスビールに入社後、品質管理のための統計的研究に取り組んだ。小標本データが正規分布に従わないことを発見し、t分布を考案。匿名「スチューデント」で論文を発表し、1908年の論文「The Probable Error of a Mean」は小標本の統計的性質を理論的に探究した画期的なものとされる。彼の手法はフィッシャーにより理論的に発展。趣味や仕事に多才で、効率的かつ独創的な姿勢を持ち続け、統計学や実験計画法の発展に多大な貢献をした。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
ゴセット
1876年イングランド・カンタベリー生まれのゴセット(William Sealev Gosset;1876- 1937)は,イングランド南東部にあって600年の歴史を誇るパブリックスクールの名門中の名門,ウィンチェスターカレッジを卒業し,オックスフォード大学のニューカレッジに進学した.
1897年に数学の学位を,その2年後に化学の修士号を得た.
卒業後ただちにアイルランドの首都ダブリンのギネスビールに入社.
ギネスは技術部門を強化するためにオックスブリッジ(オックスフォード大学とケンブリッジ大学の両方をあわせた略称)の新卒の採用を数年前から開始したところだった.
彼はビールの品質を左右する大麦,ホップなどの原材料および製造工程を調査し,それらの影響の程度を考究した.
大麦の生産からイーストの発酵までの製造工程に関する統計的な研究のために,彼は遺伝学の権威ゴールトンの立てたロンドン大学生物研究所に1906年に派遣され,カールピアソン(1857-1936)の下で学ぶ.
この年にサティーズ家のマージョリと結婚する.
彼女の姉デーム(Dame Surtees Phillpotts)はスカンジナビア文学・言語で名をはせた,ケンブリッジ大学カートンカレッジの女性研究者となる.
ビールの醸造は温度や湿度,口照そして風などの微妙な条件の下の作業工程であって,一度に大量の標本が取れるものではない.
t分布の考案
ゴセットは,ビールの品質管理に従事するなかで,実験データの数が大きくない場合には,標準正規分布に従わないことに気づき,スチューデントのt分布を考案した.
本名でなくペンネーム,スチューデントなる名前で次々と統計学の論文を発表したのは,会社から匿名およびデータの隠匿を条件に許可されていたからである.
したがって,彼の論文のデータにはギネスビールの製造工程に関するものは一切なく,他の研究データの引用に終始している.
彼の当時の小標本の発想をうかがわせる実験データは提示されていない.
その後ダブリンに戻った彼は,アイルランド農務省と大麦の品質改良に主導的に取り組む.
彼の死の2年前にロンドンに新設したギネスビールエ場の責任者としてダブリンを離れ, 1937年に技術本部長の現職で死去した.
仕事を愛し家族を愛する人だった.
46歳まで助手もなしに1人で統計の仕事をこなしていた.
計算が得意でテキパキと仕事をこなす.
たまに計算ミスもするが,仕事のメモも研究のメモもそこいらにある手紙の後ろや紙切れを使ってやっていた.
数値表を使うのでなく,最初の定義からやらねば気が済まない性分であったらしい.
最初からやると精神の柔軟性を維持できると答えたという.
それに,怠け者なので数値表を探す面倒をするくらいなら自分で計算した方が早いと答えたという.
多趣味の人でなんでもこなした.
スキーにヨット,そのヨットも自ら製作した.
穴を開けるのにナイフを巧みに使ったという.
24時間をフルに使って凡人ではしかねるほどの仕事と趣味とつきあいをこなした.
ゴセットの口から忙しいという言葉を聞いたことがないと親しい友人は証言している.
とくに, 1908年の「The Probable Error ofaMean」は,標本数が小さい場合の標本平均の統計的性質を理論的に考究した先駆的な論文である.
この論文で,彼は小標本の下での分布を考えた.
母標準偏差が未知なので,代わりに標本標準偏差を使わざるを得ない状況を考えている.
この論文の骨格は,「実験計画法」の創始者R. A.フィッシャー(1890-1962)によれば,まず,この確率分布を正しく推測したことにある.
次に標本標準偏差と標本平均が無相関であることを示した上でそれらが統計的に独立であることを正しく推測した.
1907年5月12日の友人への手紙で「疑問点を明解に説明しようとすると問題がますます難しくなることを恐れています.…しかし,会社は統計的な研究から多くの利益を享受するであろうから私の労苦は必要なものです」と告白している.
ある一定の平均と標準偏差に従う正規分布において,ランダムに標本を取って,変量を計算する.
この煩雑な数値実験を何回も繰り返すことで,今日t分布として知られる新しい分布を数値実験的に導出した.
これに理論的な解答を明示的に与えたのは,フィッシャーである.
ゴセット(William Sealy Gosset, 1876-1937)は、統計学の発展において重要な役割を果たした人物であり、「スチューデント」という筆名で発表した業績で知られています。彼はイングランドのケンターベリーで生まれ、オックスフォード大学で数学と化学を学びました。大学卒業後、世界的に有名なギネスビールを製造するアーサー・ギネス社に入社し、品質管理と製造工程の改善に従事しました。当時、ビールの醸造は高度な職人技術に依存しており、科学的な品質管理手法が未発達でした。その中でゴセットは、製造プロセスの科学的な最適化を目指し、化学分析と統計学的手法を導入する試みを行いました。彼の最も顕著な業績は、小標本から得られるデータの分析手法の開発です。当時、統計学は主に大標本のデータを対象として発展しており、小標本の場合には正確な推定や検定が難しいという課題がありました。ゴセットは、ビールの醸造過程において小規模な実験から信頼性の高い結論を導く必要性に直面し、この問題に取り組みました。彼は正規分布が小標本の場合に適用できないことを見抜き、小標本データの特性を考慮した新たな分布「t分布」を考案しました。この業績は1908年に「The Probable Error of a Mean」という論文として発表され、統計学における重要な転換点となりました。この論文では、母集団の標準偏差が未知である場合に小標本から得られる標本平均の推定方法を提案し、t検定として知られる手法の基礎を築きました。しかし、ゴセットがこの画期的な研究を発表する際、所属するギネス社は競合他社に秘密が漏れることを懸念し、論文を会社名義で出すことを禁じました。そこで、彼は「スチューデント」という筆名を用い、個人名を伏せて論文を発表することにしました。このため、彼の成果は長らく「スチューデントのt分布」として知られることになります。ゴセットの業績はその後、統計学者ロナルド・A・フィッシャー(Ronald A. Fisher)によって理論的にさらに発展させられ、統計学の主要な概念として確立されました。フィッシャーはゴセットのt分布をより広範に適用できるように拡張し、実験計画法や回帰分析の分野でその応用を広げました。ゴセットの研究は単なる理論的な進歩にとどまらず、産業界における実践的な問題解決に直接結びついていたことが特筆されます。彼は統計学が抽象的な学問ではなく、現実の課題に対処するための有用なツールであることを証明しました。ゴセットの仕事ぶりは、効率性と実用性を重視しながらも、新しいアプローチに対して柔軟で創造的でした。また、彼の個性も興味深い点として挙げられます。仕事以外では釣りや音楽を趣味とし、多才な面を持っていました。一方で、非常に謙虚で控えめな性格であったことから、自らの業績を過度に主張することはありませんでした。ゴセットは1937年に亡くなりましたが、彼の残した業績は統計学の基礎を形作る重要な要素として現在も広く利用されています。t分布やt検定は、医療、農業、工業、社会科学など、さまざまな分野でデータ解析の基本的なツールとして活用されており、彼の貢献が現代においても大きな影響を与えていることを物語っています。このように、ゴセットの生涯と業績は、科学と実践の融合、そして謙虚な姿勢での偉大な発見という点で、多くの人々にとって模範となるものです。
関連記事