「人・年」で見る! 率の新たな視点で解明する人口統計学【ChatGPT統計解析】
人口統計学では、「率」という用語は特定の期間内に観察される事象の割合を指すが、実際には時間あたりの変化量ではなく、年ごとの割合で示されることが一般的である。例えば、死産率や有病率は通常、一定期間内の事象数を特定の人口で割ったものであり、割合として表される。しかし、これらは時間経過による変化を直接反映しない。一方で、死亡率などの指標を時間あたりの変化率として捉える際には、「人・年」という単位を用いることで、全対象の合計観察期間に対する事象の頻度を示すことができる。これにより、個々の観察対象が経験した時間の総和を基にしたより精密な分析が可能となり、長期的な変化の観察に役立つ。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
率(rate)とは何か
物理学や化学では、「率」は注目した量(y)の時間(t)あたりの変化(微分を知っている人ならdy/dt)、すなわち「速度」を表すために使われます。
もっとも温度1度あたりとか、費用1円あたりとか、時間以外の他の量を基準にした変化量について使われることもあります。
医学や疫学の領域でも、一定の期間中に見られた観察対象の変化量を期間の長さで除した商に対して使われる場合は「速度」という概念に対応させて考えやすいといえます。
一昔前に結核の検査で頻用されていた「赤血球沈降速度(erythrocyte sedimentation rate)、略して「赤沈」と呼ばれる検査があります。
これは、血液を所定の細いガラス管に入れて柱状に立てておき、血液中の血球成分が1時間、あるいは2時間の間にどのくらい沈殿するかを沈殿層の厚さで評価する検査で、結果は40mm/hr(毎時)のように表されます。
となると、「速度」や「率」は時間あたり(1/時間)の次元を持つ量に対して使い、「比」や「割合」は単位が無次元である量に対して使うことに約束できればすっきりするかもしれません。
しかし、歴史的に慣用されている名前が多く、このような立場からの分類は不可能な状況です。
死産率・有病率も実は割合
死産率(fetal death rate)は、ある一定期間の「死産数/(出産数(出生+死産))」×1000と定義されています。
単位は無次元で、割合に相当します。
有病率(prevalence, prevalence rate)は、ある集団である決められた日に調査の対象としている病気にかかっている人が何人いるかを示す指標です。
死産率と同様に通常1,000人あたりの人数で表されます。
これも割合に相当しますが、国外でもrateをつけて慣用されています。
人口動態の重要指標である死亡率や出生率の定義も、
死亡率=ある人口集団の死亡数÷人口×1,000
出生率=ある人口集団の出生数÷人口×1,000
で与えられており、1年という集団単位内の対人口比、すなわち割合と考えられます。
わが国では分母に10月1日の人口をあてています。
国勢調査が行われた2000年10月1日の人口は、125,612,633人、この年の死亡数は、961,653人、出生数は、1,190,547人ですので、死亡率は7.66、出生率は9.48です。
さらに国の人口統計で使われる簡易生命表では、x歳の「年齢別死亡率」を、
Qx=(x歳になった人がその後1年間に死亡する数)/(x歳になった人の数)と、死亡者数と特定の時点における観察対象者数との割合で定義しています。
平成14年の簡易生命表をみると、50歳になった女性の年齢別死亡率q50は、50歳の女性が51歳までの1年間に死亡する数(179)を50歳になった女性の数(97,533)で割った0.00183で示されています。
ちなみに50歳になった男性の年齢別死亡率は0.00373であり、これは60歳女性の年齢別死亡率0.00372とほぼ等しい値です。
これらの例のように、人口統計の諸指標は「率」とよばれているにもかかわらず、時間あたりの変化では示されず、1年ごとに区切って割合で示されることが多いです。
このように、情報を提示することによって、読者は加齢と暦年の両方の時間軸上で諸指標の長期的変化をながめることが容易になります。
一方、死亡数や出生数の全対象人口に対する相対的な変化を1年ごとに追っているとみなし、同じ数値に「1/年」の単位を付けて7.66/年、9.48/年と読むことも可能です。
「人・年」という考え方
死亡率を単位時間当たりの変化率としてみるときには、分母をある特定の時点の人数と1年という期間を使って表すかわりに、全対象の延べ観察期間を後述する「人・年」という単位を使って表し、それに対して分子の人数(人)を評価する方式が使われます。
1年間の観察期間中の死亡者数を全員の観察期間の和で除した商の単位の次元は、
人÷(人・年)=1/年 で、1/年 です。
観察の対象として取り上げた1人を観察の開始時点から1年間、事象が起こるかどうか追跡したことを疫学では「1人・年(person-years)」という単位で表します。
A人からなる対象集団についてB年間にわたって死亡状況を観察した場合を考えてみましょう。
観察期間中、死亡者や消息不明者がゼロで、全員がB年間観察されたときには、和はA×B人・年となります。
しかし実際には、観察期間中に死亡する人は、途中で消息がわからなくなった人など、いろいろな経過が考えられます。
そのような場合、死亡や消息を絶った後の期間を観察の対象から除外して集計します。
ChatGPTに聞いてみた
プロンプト
あなたは最高のデータサイエンティストです。
「率」と「人・年」について解説してください。
#制約条件:
サルでもわかる平易な日本語で
文字数は300字程度
ChatGPTの回答
「率」と「人・年」は、データを表すときによく使われる単位ですが、使い方がちょっと違います。率は、割合や比率を表すときに使います。たとえば、「合格率が50%」って言ったら、試験を受けた人の半分が合格したことを意味します。この「%」は、100人中何人かを表していて、全体に対する一部の大きさを教えてくれます。人・年は、特定の期間における人の数を示すときに使います。たとえば、「年間来場者数が100万人・年」と言うと、1年間に100万人の人が来場したことになります。ここでの「人・年」は、1年間という時間の中でどれくらいの人が関わったかを示しています。簡単に言うと、率は「全体に対する一部の割合」を、人・年は「時間とともに関わる人の数」を教えてくれます。これらを上手く使い分けることで、データの意味をもっとはっきりと伝えることができるようになります。