母統計的推定:母集団解析のカギとなる手法【ChatGPT統計解析】
統計的推定の枠組みでは、まず分析対象の母集団を特定し、それを確率分布と見なします。統計的推定で用いる関数や式を推定量(estimator)といい、標本値を代入して得られる値を推定値(estimate)と呼びます。推定には、少数のランダム標本から母集団の特性値を推し量る点推定と、特性値がある区間内に含まれることを示す区間推定があります。母集団を特定化する例として、日本の大都会に住む未婚男性や65歳以上の有権者、ある大学の男子学生などが挙げられます。その後、母集団の特性を確率変数と見なして確率分布を定義します。例えば、身長の平均と分散を決めることで正規分布の型が決まります。推定量は標本値を使って母集団のパラメータを推定するための計算方式です。点推定は少数の標本から母集団のパラメータを具体的に推定し、区間推定はパラメータが含まれる範囲を推定します。ニュース報道においても、犯人像の特徴を区間推定のように示すことがあります。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
目次 母統計的推定:母集団解析のカギとなる手法【ChatGPT統計解析】
母集団確率分布の特性値(母数:parameter)を推論
統計的推定の枠組みは次のようにまとめられます。
まず第1に分析したい母集団を特定化することです。
例えば,日本の大都会に住む未婚男性全員とか65歳以上の有権者全員(公職選挙法第11条によれば,成年被後見人(事理を弁識する能力を欠く常況の人),刑執行中の人,公職にあって刑執行後5年たっていない人には,投票権はない),あるいはある大学の男子学生全員など。
第2に,当該の母集団を確率分布と見ることです。
そして,当該の集団に関して問題としたい属性の有無や数値自体を母集団の確率変数と見なすことです。
未婚女性のヨーロッパ渡航の有無,有権者のある政党支持率,あるいは学生の身長の大きさを確率変数と見なします。
確率分布は,いくつかの母数(パラメータ:θで表す)で規定されるから,これらのパラメータを推定すれば,母集団の確率分布は決まってきます。
身長はおよそ正規分布に従うから,身長の平均と分散という2つのパラメータを決めると,正規分布の型は自ずと決まります。
第3(最後)に,確率分布のパラメータθの値(あるいはθが含まれる範囲)を大きさNの標本から推定する方式を提示することです。
推定量(estimator)と推定値(estimate)
統計的推定のために用いる関数や式を推定量(estimator)といいます。
推定量に標本値を代入すれば,推定値(estimate) が求まります。
誤解のないように一言すれば,統計的推定の目的は何も推定値を出すことでなく,その算出のための計算方式つまり推定量を提示することです。
点推定と区間推定
少数のランダム標本から母集団の特性値をピンポイントで推し量る点推定およびある区間幅の中に含まれることを示す区間推定があります。
@点推定
少数の標本から,母集団のパラメータθをズバリ言い当てます。
A区間推定
ごく少数の標本から,パラメータθを正確に言い当てることは実際には非常に難しいです。
点推定値に当たりはずれがあるなら,つまり標本誤差を伴うのであれば,最初から一発勝負はあきらめて,パラメータが含まれる区間を推定します。
現実のニュース報道でも区間推定の考えは見られます。
例えば,銀行強盗の犯人像について,「年齢30歳ぐらいの中肉中背の男で,黒の野球帽に黒色サングラス姿」や,「2人組はいずれも50歳ぐらい.グレーの作業服上下に登山帽のようなものをかぶっていた」などと報道されます。
関連リンク