平均値で探る、全国市場規模のリアル【ChatGPT統計解析】
平均値を利用することで、全国の世帯を考慮に入れ、商品の購入総量を算出することが可能です。この推計は購入量の度数分布とは無関係であり、非対称分布や特定の分布形状に影響されることなく使用できる重要な特性があります。また、平均値の計算においては、全世帯か購入世帯かで分母が異なる点に注意が必要です。この推計法は、例えば「ある商品の1世帯あたりの平均購入金額が360円である場合、全国5000万世帯にこれを適用すると市場規模は180億円になる」といった形で説明されています。最後に、平均値の使用は単にデータを集計する手法に留まらず、具体的な市場動向の把握や予測に役立てることができるため、統計学において非常に価値のある手法とされています。これにより、統計学は単なる数字の操作以上のものとして、実世界の現象を理解し解析するための強力なツールとして機能しています。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
平均値から市場規模がわかる
非対称分布にしばられている平均値には、最頻値や中央値のように具体的な意味がないことを私たちは知っていました。
重心というのは比喩的な意味での話であって、平均値の利用面を指しているわけではありません。
ところが、実は平均値には具体的な意味が隠されているのです。
たとえば、ある商品の1世帯平均購入金額が360円であることが示されたものとします。
買った世帯も買わない世帯も含めての計算です。
この平均値に全国5000世帯として、それを掛け算して、この商品の購入総量、すなわち市場規模は360円×5000万=180億円であると、拡大推計することができます。
なんともすばらしい平均値の役割ではありませんか。
推計は度数分布に無関係
これは購入量の度数分布とは何の関係もありません。
非対称型であろうと、逆J字型であろうと一向にかまいません。
無理に度数分布と関係づけをしなくてよいのです。
このような使い方ができるのは平均値の大切な性質のひとつです。
「多くの世帯が月に3個使用しているようだから、それに全国世帯数を掛け算して」という推測の仕方は、もし3個が最頻値を意識しているとすれば、これは誤りです。
ここはぜひ平均値に出馬していだだかなければ困るのです。
さきに、月別の平均購入量を比較するとき、分布型が不変のままシフトするものと想定しました。
しかし、母集団の全購入量の変化を求めているものとみるならば、分布型は変化しようとしまいとかまいません。
この場合、上例では全国世帯数にほとんど変化がないとすれば、増減率は平均値でも拡大推計値でも同じです。
平均が10%増えれば全体も10%増えます。
したがって、拡大推計値の増減率を見たいときには、平均値をいちいち拡大しなくてもそのまま使うことができます。
平均値の分母の問題
平均値を求めるときに、その分母の問題が起きます。
購入量の平均値を、全世帯平均とすべきか、購入世帯平均とすべきかです。
度数分布では、購入量ゼロクラス世帯が異質の層と考えられるときは(例えば、その商品の購入習慣がない世帯)、それを度数分布から除くべきであると説明しました。
平均値の分母についても同様のことがいえます。
ただし、全体の拡大推計をおこなう場合にはノーです。
平均値の分母は全世帯とすべきであることはいうまでもありません。
はじめに総量がある
生まれたばかりの赤ちゃんも含めての平均です、というとき、その値には具体的な意味がなくてもかまいません。
この場合、次の2つのどちらかを念頭においています。
@その平均値に人口を掛け算すると総量がわかります。
A総量がわかっていて人口で割り算したらそうなりました。
前者については既に述べた通りですが、後者については、たとえば国税局でビールの出荷総量が課税高として把握されていますし、もちろん人口もわかっているので、あとは割り算するだけで、赤ちゃんも含めての1人当たり平均値が出てきます。
もしビール飲用者だけの平均値がほしいと要求されたら、飲用者割合が必要となって、ことはそう簡単にはいきません。
個々のデータを足し上げなくてもいいという、この種の平均値はわりと多いです。
個別データは不明だが総量はわかるという場合の平均値の例をあげると、以下のようなものがあります。
@面積1平方キロ当たりの人口(人口密度): 1平方キロの区切りごとの居住人数がわからなくてもかまいません。
Aデパートの売り場面積1平方メートル当たり売上高: 1平方メートルごとに仕切って、そこで売り上げが発生するわけではありません。
Bメーカーの従業員1人当たり生産高: 手仕事なら別として、機械を使っている以上、1人ごとに分けられるはずがありません。
ある2つの異なる種類の総量データが既知であって、ただ一方を他方で割り算します。
したがって、その値は平均値とも比率ともみることができます。
区別はあいまいですが、普通の人にはどうでもいいことでしょう。
しかし統計学では、個別データがないと度数分布が描けないこともあって、結局は比率とみなして考察しています。
関連リンク