発症率の謎を解く:肺がんと喫煙の関係【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

セミナー案内             AIデータサイエンス動画           インスタグラム

発症率の謎を解く:肺がんと喫煙の関係【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

発症率の謎を解く:肺がんと喫煙の関係【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】
発症率とは、疾患の発症の頻度を示す指標であり、長期間にわたる追跡調査が必要です。例えば、京都市の糖尿病の有病割合は特定の時点での調査で得られますが、発症率は調査開始時に疾患を持たない人々を追跡して得られます。喫煙と肺がんの関係を調べた調査では、観察人年という単位を用いて発症率を算出しました。結果、喫煙者の肺がん発症率は非喫煙者の約4倍であることがわかりました。発症率は性別や年齢により異なるため、比較には標準化が必要です。

発症率の謎を解く:肺がんと喫煙の関係【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】▼▼▼▼▼▼▼▼
チャンネル登録はこちら


目次  発症率の謎を解く:肺がんと喫煙の関係【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】



統計学における発症率(incidence rate)


発症率とは、文字通り疾患を発症する確率を示す指標であるが、その計算方法と解釈はそれほど簡単ではない。


関連する用語として、有病割合(prevalence)という用語がある。


たとえば、京都市の住民のうち、2004年1月1日に糖尿病に罹っている人の割合が、京都市におけるその時点での糖尿病の有病割合である。


実際には、それを調べることは容易ではないが、理論的には1時点の調査で有病割合を知ることができる。


一方、発症率は1時点の調査からは知ることができない。


発症率を計算するためには、たとえば、ある時点で糖尿病に罹っていない人を、ある一定期問観察しなければならない。


しかもその観察期問は、糖尿病に一定数の人が罹るだけ十分長くなければならない。


したがって、発症率を計算するためには大規模かつ長期の追跡調査が必要である。


以下では、発症率の算出方法と解釈について喫煙と肺がんの例を用いて説明しよう。


喫煙状況ごとの肺がんの発症率


喫煙と肺がんの関係を調べるために行われた調査の結果を表に示す。


これは、日本のある複数の地域に住む40-69歳の男性約45,000人、女性約48,000人の集団に対して1990-1994年に喫煙状況などの調査を行い、1999年まで追跡してがんの発症の調査を行った結果である。


発症率の謎を解く:肺がんと喫煙の関係【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


平均約8年の追跡調査の間に422人(男性324人、女性98人)が肺がんを発症した。


表には、男女別および喫煙状況別に調査人数と肺がんを発症した人数が示されている。


この表には、観察人年(person-year)という聞きなれない用語がでてくる。


発症率の計算には、この観察人年の情報が必須となる。


これは、どれだけの人をどれだけの時問(年数)にわたって観察したかという1つの単位を表している。


1人を1年間にわたり観察することを1観察人年(1人×1年)という。


この例では、男性の非喫煙者10,839人に関する観察人年は84,670人年となっている。


調査の始まる時点で肺がんに罹っていなかった人のうち、ある人は1年後に肺がんを発症し(1観察人年で発症)、ある人は10年たっても肺がんにならず(10観察人年で発症せず)、またある人は5年後に転居してその後消息不明となった(5観察人年で発症せず)かもしれない。


10,839人の集団について、各人の観察人年をすべて足し合わせたのが84,670人年という観察人年である。


肺がんを発症したのは26人なので、この集団の肺がん発症率は、発症人数を観察人年で割って、


26/84,670÷30.7/100,000


と計算される。一方,男性の喫煙者の肺がん発症率は,同様にして


231/179,994=128.3/100,000


と計算できる。10万観察人年あたりという共迦の単位で、これら2つの数、30.7と128.3は比較することができる。


この結果から、喫煙者の肺がんの発症率は非喫煙者の発症率より4倍程度高く、喫煙が肺がんの発症と強く関係しているという結論が導かれる。


また、女性の肺がんの発症率は男性より全体的に低いが、非喫煙者の発症率が21.9、喫煙者のそれが74.5と喫煙と肺がんの関係は男性と同様に強いことがわかる。



発症率は性や年齢で異なる


この例からもわかるように、疾患の発症率は少なくとも性によって異なる。


また、多くの疾患で30歳の人の発症率と60歳の人の発症率は明らかに違う。


これは有病割合も同じである。


したがって、訓査を行った集団の性と年齢が一致していないと発症率や有病割合は比較できない。


また、性や年齢の分布は時期によっても変化するために、発症率を10年前と現在などのように異なった時期で比較する際には、性や年齢の分布をほぼ一致させて比較できるようにする標準化(standardization)という統計学的な手法を用いなければならない。                      



発症率の謎を解く:肺がんと喫煙の関係【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


セミナー詳細                    解析ご相談                    LINEでお友達

発症率の謎を解く:肺がんと喫煙の関係【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

発症率の謎を解く:肺がんと喫煙の関係【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】