母集団確率分布の特性値を推論|推定量と推定値・点推定と区間推定【統計学・統計解析講義基礎】
統計的推定の枠組みでは、まず分析したい母集団を特定化し、次いで当該の母集団を確率分布と見る。統計的推定のために用いる関数や式を推定量(estimator)といい、推定量に標本値を代入すれば,推定値(estimate) が求まる。少数のランダム標本から母集団の特性値をピンポイントで推し量る点推定およびある区間幅の中に含まれることを示す区間推定がある
目次 母集団確率分布の特性値を推論|推定量と推定値・点推定と区間推定【統計学・統計解析講義基礎】
母集団確率分布の特性値(母数:parameter)を推論
統計的推定の枠組みは次のようにまとめられます。
まず第1に分析したい母集団を特定化することです。
例えば,日本の大都会に住む未婚男性全員とか65歳以上の有権者全員(公職選挙法第11条によれば,成年被後見人(事理を弁識する能力を欠く常況の人),刑執行中の人,公職にあって刑執行後5年たっていない人には,投票権はない),あるいはある大学の男子学生全員など。
第2に,当該の母集団を確率分布と見ることです。
そして,当該の集団に関して問題としたい属性の有無や数値自体を母集団の確率変数と見なすことです。
未婚女性のヨーロッパ渡航の有無,有権者のある政党支持率,あるいは学生の身長の大きさを確率変数と見なします。
確率分布は,いくつかの母数(パラメータ:θで表す)で規定されるから,これらのパラメータを推定すれば,母集団の確率分布は決まってきます。
身長はおよそ正規分布に従うから,身長の平均と分散という2つのパラメータを決めると,正規分布の型は自ずと決まります。
第3(最後)に,確率分布のパラメータθの値(あるいはθが含まれる範囲)を大きさNの標本から推定する方式を提示することです。
推定量(estimator)と推定値(estimate)
統計的推定のために用いる関数や式を推定量(estimator)といいます。
推定量に標本値を代入すれば,推定値(estimate) が求まります。
誤解のないように一言すれば,統計的推定の目的は何も推定値を出すことでなく,その算出のための計算方式つまり推定量を提示することです。
点推定と区間推定
少数のランダム標本から母集団の特性値をピンポイントで推し量る点推定およびある区間幅の中に含まれることを示す区間推定があります。
@点推定
少数の標本から,母集団のパラメータθをズバリ言い当てます。
A区間推定
ごく少数の標本から,パラメータθを正確に言い当てることは実際には非常に難しいです。
点推定値に当たりはずれがあるなら,つまり標本誤差を伴うのであれば,最初から一発勝負はあきらめて,パラメータが含まれる区間を推定します。
現実のニュース報道でも区間推定の考えは見られます。
例えば,銀行強盗の犯人像について,「年齢30歳ぐらいの中肉中背の男で,黒の野球帽に黒色サングラス姿」や,「2人組はいずれも50歳ぐらい.グレーの作業服上下に登山帽のようなものをかぶっていた」などと報道されます。
関連リンク