Python・R・エクセルによるデータサイエンス | 統計解析講義

率とハザードの統計学【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

率とハザードの統計学【統計解析講義基礎】

率とハザードの統計学【統計解析講義基礎】


率とハザードの統計学【統計解析講義基礎】

 

死にやすさの傾向・年齢別死亡率

 

人は高齢になると死にやすくなります。年齢別(毎)の死亡率は高齢になるにしたがい高くなるはずです。

 

ところで、生存している人の数(生存数)自体が高齢では次第に少なくなるのですから、その中から死ぬ人数(死亡数)も少なくなります。

 

このままではおかしいので、生存数で割ることとし、年齢をt(歳)、t歳の生存数をS(t)として、

 

(t歳からt+1歳になるまでの死亡数)/(t歳の生存数)

 

を年齢別死亡率 といいます。

 

分子は生存数Sの差、すなわちS(t+1)−S(t) に等しくなります。

 

ただし、S(t+1)はS(t)より当然小さくなりますから、差は負となります。

 

便宜上、−をつけて正とします。

 

次に、基準となる分母の生存数は、S(t)あるいはS(t+1)とするより、2つの平均、すなわち直線的に一様に減ったとしたときに中間点の人口

 

(S(t+1)+S(t))/2

 

を用います。したがって年齢別死亡率は、

 

−(S(t+1)−S(t))/((S(t+1)+S(t))/2)

 

から計算されます。

 

あるいは1年の中央の7月1日の生存人口(年央人口)、国勢調査の日である10月1日の人口を分母に用いることもできます。

 

さらに、専門的方法としては、各対象(個人)の生存の観察期間mi(半年なら0.5、9ヶ月なら0.75など)の総和を求めて、延べの生存数(人・年)を計算してもよいですが、データが年齢ごとの表(生命表)の形にまとめられている場合にはこのような個人別の追跡はできません。

 

10〜14歳がもっとも死ににくい

 

表は年央人口を用い、かつ年齢を5歳ごとにとった年齢別死亡率(1978年)です。

 

単位は10万倍して「10万人当たり」です。

 

低年齢では死亡率はきわめて高いですが、年齢が加わるにつれて低下し、10〜14歳で最低になります。

 

それ以後はだんだん上昇して、高年齢では上昇は急速です。

 

この傾向は男女で変わりはないですが、全年齢で、女性の死亡率は男性より低くなります。

 

瞬間の死亡率(死力)

 

生存人口の減少の時間的速さという意味の「死亡率」もあります。

 

人口10万人当たり500人の死亡でも1年間の場合と1ヶ月の場合とでは当然死亡率は異なります。

 

速さ=移動距離÷時間(幅)であったように、生存数だけでなく時間でも割って、

 

(t歳からt+Δ歳になるまでの死亡数)/(Δt×生存数)

 

を考えます。ここで、Δtとは、1ヶ月、1日、1時間、1分、1秒などのようにきわめて小さい時間幅を表す数学記号です。

 

速さとは瞬間のものですから、瞬間を表すようにΔtを小さくします。

 

実際、人の死も、ある「瞬間」に起こります。

 

Δtを限りなく0に近づけたこの死亡率を、瞬間死亡率とか、死力(死の作用の強さ)とか「ハザード」(hazard)などと呼んでいます。

 

英語のhazardは、生命・健康に対する「危険」を意味します。

 

数学で微分を知っている人には

 

微分を用いると瞬間死亡率は、

 

(−dS(t)/dt)÷S(t)

 

で表されます。専門用語ではこれをλ(t)で表します。

 

λ(t)がtによらず一定である簡単な場合を考えると、S(t)は漸減して0に近づく指数関数Ce−αtで表されることがわかります。

 

ハザードは予後因子の解析、治療効果の判定に適した多変量解析の1つ「比例ハザードモデル」の基本的な構成要素です。

 

似た言葉ですがハザード比(hazard ratio)は、2つのハザードλ1とλ2の比λ1/λ2で、ハザードとは別の概念です。

セミナー詳細こちら                    解析ご相談こちら


 

率とハザードの統計学【統計解析講義基礎】

率とハザードの統計学【統計解析講義基礎】

率とハザードの統計学【統計解析講義基礎】