Python・R・エクセルによるデータサイエンス | 統計解析講義

割合と率の統計学【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

割合と率の統計学【統計解析講義基礎】

割合と率の統計学【統計解析講義基礎】


割合と率の統計学【統計解析講義基礎】

 

率(rate)とはもともと何か

 

物理学や化学では、「率」は注目した量(y)の時間(t)あたりの変化(微分を知っている人ならdy/dt)、すなわち「速度」を表すために使われます。

 

もっとも温度1度あたりとか、費用1円あたりとか、時間以外の他の量を基準にした変化量について使われることもあります。

 

医学や疫学の領域でも、一定の期間中に見られた観察対象の変化量を期間の長さで除した商に対して使われる場合は「速度」という概念に対応させて考えやすいといえます。

 

一昔前に結核の検査で頻用されていた「赤血球沈降速度(erythrocyte sedimentation rate)、略して「赤沈」と呼ばれる検査があります。

 

これは、血液を所定の細いガラス管に入れて柱状に立てておき、血液中の血球成分が1時間、あるいは2時間の間にどのくらい沈殿するかを沈殿層の厚さで評価する検査で、結果は40mm/hr(毎時)のように表されます。

 

となると、「速度」や「率」は時間あたり(1/時間)の次元を持つ量に対して使い、「比」や「割合」は単位が無次元である量に対して使うことに約束できればすっきりするかもしれません。

 

しかし、歴史的に慣用されている名前が多く、このような立場からの分類は不可能な状況です。

 

死産率・有病率も実は割合

 

死産率(fetal death rate)は、ある一定期間の「死産数/(出産数(出生+死産))」×1000と定義されています。単位は無次元で、割合に相当します。

 

有病率(prevalence, prevalence rate)は、ある集団である決められた日に調査の対象としている病気にかかっている人が何人いるかを示す指標です。

 

死産率と同様に通常1,000人あたりの人数で表されます。これも割合に相当しますが、国外でもrateをつけて慣用されています。

 

人口動態の重要指標である死亡率や出生率の定義も、

 

死亡率=ある人口集団の死亡数÷人口×1,000

 

出生率=ある人口集団の出生数÷人口×1,000

 

で与えられており、1年という集団単位内の対人口比、すなわち割合と考えられます。

 

わが国では分母に10月1日の人口をあてています。

 

国勢調査が行われた2000年10月1日の人口は、125,612,633人、この年の死亡数は、961,653人、出生数は、1,190,547人ですので、死亡率は7.66、出生率は9.48です。

 

さらに国の人口統計で使われる簡易生命表では、x歳の「年齢別死亡率」を、

 

Qx=(x歳になった人がその後1年間に死亡する数)/(x歳になった人の数)と、死亡者数と特定の時点における観察対象者数との割合で定義しています。

 

平成14年の簡易生命表をみると、50歳になった女性の年齢別死亡率q50は、50歳の女性が51歳までの1年間に死亡する数(179)を50歳になった女性の数(97,533)で割った0.00183で示されています。

 

ちなみに50歳になった男性の年齢別死亡率は0.00373であり、これは60歳女性の年齢別死亡率0.00372とほぼ等しい値です。

 

これらの例のように、人口統計の諸指標は「率」とよばれているにもかかわらず、時間あたりの変化では示されず、1年ごとに区切って割合で示されることが多いです。

 

このように、情報を提示することによって、読者は加齢と暦年の両方の時間軸上で諸指標の長期的変化をながめることが容易になります。

 

一方、死亡数や出生数の全対象人口に対する相対的な変化を1年ごとに追っているとみなし、同じ数値に「1/年」の単位を付けて7.66/年、9.48/年と読むことも可能です。

 

「人・年」という考え方

 

死亡率を単位時間当たりの変化率としてみるときには、分母をある特定の時点の人数と1年という期間を使って表すかわりに、全対象の延べ観察期間を後述する「人・年」という単位を使って表し、それに対して分子の人数(人)を評価する方式が使われます。

 

1年間の観察期間中の死亡者数を全員の観察期間の和で除した商の単位の次元は、

 

人÷(人・年)=1/年 で、1/年 です。

 

観察の対象として取り上げた1人を観察の開始時点から1年間、事象が起こるかどうか追跡したことを疫学では「1人・年(person-years)」という単位で表します。

 

A人からなる対象集団についてB年間にわたって死亡状況を観察した場合を考えてみましょう。

 

観察期間中、死亡者や消息不明者がゼロで、全員がb年間観察されたときには、和はA×B人・年となります。

 

しかし実際には、観察期間中に死亡する人は、途中で消息がわからなくなった人など、いろいろな経過が考えられます。

 

そのような場合、死亡や消息を絶った後の期間を観察の対象から除外して集計します。

セミナー詳細こちら                    解析ご相談こちら


 

割合と率の統計学【統計解析講義基礎】

割合と率の統計学【統計解析講義基礎】

割合と率の統計学【統計解析講義基礎】