調査データにおける平均値の計算法|データの取り方が重要【統計学・統計解析講義基礎】
調査データでは、特定の日に来た人を調べると、週に何回も来所する人がカウントされる確率は高く、たまにしか来所しない人は補捉されにくくなる。調査データは取り方が重要
調査データにおける平均値の計算法
次のような調査データに関する問題が大学の授業で出たことがあります。
デイケアセンターAおよびデイケアセンターBはともに毎週土日を除く5日間オープンしていて、各センターに登録されている週に1回以上利用する高齢者は100人であり、各高齢者がセンターを利用する回数は週に1回以上5回以下で、個人ごとに決まっています。
そして4回以下の利用回数の高齢者は特定の曜日でなく気ままにセンターにやってきます。
今般、それぞれのセンターでは、登録高齢者1人あたり週に何回センターを利用するかを調査報告することになりました。
センターAの調査データ:種々の記録がしっかりとってあり、それを調べたところ、週にk回利用する登録高齢者の比率pkが得られました。
センターBの調査データ:センターAのような記録がなかったため、平均来所回数を調査しようと、ある日センターに来ている高齢者に対し「あなたは週に何回センターに来ますか」とたずねました。
その結果、週にk回来ると答えた人の比率qkが得られました。
問題は両センターにおける1人あたりの平均来所回数はいくらであろうかというものです。
この調査データではセンターAの平均値は1×0.4+2×0.3+3×0.15+4×0.1+5×0.05=2.1 であることがすぐに計算できます。
調査データは取り方が重要
問題はセンターBで、同じように計算すると2.72となります。
まずこの計算は誤りであることに気がつかなくてはなりません。
ある特定の日に来た人を調べると、週に何回も来所する人がカウントされる確率は高く、たまにしか来所しない人は補捉されにくくなります。
実はこの問題ではセンターBの平均値もセンターAの平均値と同じく2.1なのですが、どのように計算すればいいのでしょうか。
平均値の計算は統計的データ解析の初歩の初歩だと思われるかもしれません。
しかし、この例が示すようになかなか一筋縄ではいかないもので、データの取り方が重要であるという教訓でもあります。
統計学も、当然ながら奥が深いものです。
関連リンク