目覚めの一服が肺がんリスクを1.59倍に増加【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

目覚めの一服が肺がんリスクを1.59倍に増加【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】
「目覚めの一服は肺がん・口腔がんの発症リスクを高める」という研究結果が米大学の報告で示され、起床後30分以内の喫煙者は31分以上後に喫煙する人よりも発がん物質濃度が高いことが確認されました。統計解析で年間喫煙本数の影響を交絡要因として調整した結果、30分以内の喫煙者は発症リスクが1.59倍、31-60分以内では1.42倍とされました。回帰モデルを用いた解析方法では、線形モデルによるリスク差や対数線形モデルによるリスク比、ロジスティック回帰モデルによるオッズ比が解説され、eのβ乗でそれらが求められることが示されました。ケースコントロール研究においてもオッズ比は一致し、統計解析によって喫煙と肺がんの関連性が明確化されると説明されています。

▼▼▼▼▼▼▼▼
チャンネル登録はこちら

目次目覚めの一服が肺がんリスクを1.59倍に増加【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

回帰分析による交絡の調整

ますは次の新聞記事を読んでみてください。

目覚めの一服はリスクが大。最低でも３１分は我慢すること

先日、米〇〇大学の生物行動学講座の研究グループから、「目覚め直後の一服は、肺がんや口腔がんの発症リスクを高める」という研究結果が、専門誌に報告された。
調査は全米健康栄養調査に参加した成人喫煙者、約2000人から採取した血液サンプルと喫煙習慣を分析、その結果、その日最初のタバコを起床後３０分以内に吸う人は、３１分以上たってから最初の１本に手を伸ばす人よりも、タバコ特有の発がん物質の血中濃度が高かったのである。
研究者は「起床後にすぐタバコを吸うと、より深く吸入するため肺がんや口腔がんの発症リスクを田赤める可能性がある」としている。
実は、２年前にも同大学公衆衛生学の研究グループが「目覚めの一服」と、口腔がんを含む頭頚部がんとの関連をアメリカがん協会の機関誌で報告している。
同調査は1850人の成人男女（平均年齢58歳）を対象に実施された。
年間喫煙本数の影響を調整した上で、「最初の１本」の時間で解析したところ、31-60分以内に最初の１本を吸う喫煙者は、１時間以上たってから吸う人よりも1.42倍、３０分以内に吸う喫煙者は1.59倍も発症リスクが高かった。

目覚め直後の一服は、肺がんや口腔がんの発症リスクを高めるという研究結果の記事です。

最低でも３１分は我慢すること、とありますが、なんで３１分なんでしょうか。

３０分ではいけないのでしょうか。そこは１分たりともまからないのでしょうか。

それから、「年間喫煙本数の影響を調整したうえで・・・」と記載されています。

これは、年間喫煙本数を交絡要因とみなして、その影響を除去する統計解析をしたことを意味しています。このような解析はどのように行うのでしょうか。

リスクのための回帰モデル

直線的な関係の式

Y＝α＋βX

を用いて、αとβの値が推定できれば、例えばXの値が１のとき、Yの値がα＋βと予想されることになります。

また、Xの値が１増えるとYの値が平均的にβ増える、ということを意味しています。

このように、回帰分析で用いる式のことを回帰モデルと呼びます。

回帰モデルを使って交絡を調整する方法について解説する前に、まずこれを、リスク差、リスク比、オッズ比を計算するための回帰モデルに応用します。

喫煙と肺がんの間の関係を調べた以下の仮想的コホート研究の結果をみていきましょう。

喫煙あり、肺がんあり：８００人
喫煙あり、肺がんなし：９２００人
喫煙なし、肺がんあり：４００人
喫煙なし、肺がんなし：９６００人

リスク差の回帰モデル

P=α＋βX

このようなモデルを、特に線形モデルと呼ぶことがあります。

喫煙と肺がんの関係の例で言うと、Xが喫煙の有無を表し、Pが肺がん発生割合を表すことになります。

喫煙ありの人をX=1、喫煙なしの人をX=0で表すことにすると、喫煙ありグループの肺がん発生割合は、

P1＝α＋β

と表すことができます。同様に、喫煙なしグループの肺がん発生割合は、

P0＝α

と表すことができます。

したがって、喫煙ありグループの肺がん発生割合と喫煙なしグループの肺がん発生割合の差、つまりリスク差は、

P1―P0＝（α＋β）－α＝β

となります。

線形モデルを用いると、リスク差は傾きβに等しくなるのです。

統計解析ソフトを使って回帰分析してみると、

P＝0.0400＋0.0400X

となります。リスク差は0.04です。

確かに、800/10000－400/10000＝0.04

と一致します。

リスク比の回帰モデル

今度は、logP＝α＋βX

という回帰モデルを考えてみましょう。

このようなモデルを、Pの対数が線形モデルになっているので、対数線形モデルと呼ぶことがあります。

喫煙と肺がんの関係の例では、喫煙ありグループの肺がん発生割合Pについては、

logP1＝α＋β

と表せます。

同様に、喫煙なしグループの肺がん発生割合については、

logP0＝α

と表せます。したがって、

logP1－logP0＝log（P1/P0）＝β

です。

自然対数の底eを用いると、

elog(P1/P0)=P1/P0＝eのβ乗

となります。

つまり、対数線形モデルを用いると、リスク比はeのβ乗で表されるのです。

喫煙と肺がんの関係の例で回帰分析してみると、

LogP＝－3.2189＋0.6931X

となります。

リスク比はeの0.6931乗で2.00となります。

確かに、800/10000／400/10000＝2.00

と一致します。

オッズ比の回帰モデル

オッズ比については、少し複雑に見えるかもしれませんが、

Log（P/1-P）＝α＋βX

という回帰モデルを使います。

Logの中のP/1-Pは、イベントが起きるリスクPとイベントが起きないリスク1-Pとの比、つまりオッズです。

オッズの対数が線形モデルになっています。

このようなモデルを、特にロジスティック回帰モデルと呼びます。

喫煙と肺がんの関係の例では、喫煙ありグループのオッズP1/1-P1は、

Log（P1/1-P1）＝α＋β

となり、喫煙なしグループのオッズP0/1-P0は、

Log（P0/1-P0）＝α

と表せます。したがって、

Log（P1/1-P1）－Log（P0/1-P0）＝Log（P1/1-P1／P0/1-P0）＝β

です。Logの中はオッズ比になっています。

したがって、自然対数の底eを用いると、

eLog(オッズ比)＝オッズ比＝eのβ乗

となります。ロジスティック回帰モデルを用いると、オッズ比もeのβ乗で表すことができます。

喫煙と肺がんの関係の例で回帰分析してみると、

Log（オッズ比）＝－3.1781＋0.7357X

となります。

オッズ比はeの0.7357乗で2.09となります。

800/9200／400/9600＝2.09

と一致します。

ケースコントロール研究でのロジスティック回帰モデル

ロジスティック回帰モデルは、ケースコントロール研究でもそのまま使うことができます。

肺がんなしの人を1/10の1880人だけランダムサンプリングしてケースコントロール研究を行った場合の以下の結果で試してみましょう。

喫煙あり、肺がんあり：８００人
喫煙あり、肺がんなし：９２０人
喫煙なし、肺がんあり：４００人
喫煙なし、肺がんなし：９６０人

Xが喫煙の有無、Pを肺がん発生割合として、

ロジスティック回帰モデル

Log（Px/1-Px）＝α＋βX

を使って回帰分析してみると、

Log（オッズ比）＝－0.8753＋0.7356X

という結果が得られました。

微妙にβの推定値が異なっていますが、四捨五入すると、オッズ比は同じく2.09です。

コホート研究で定義されるオッズ比の値とケースコントロール研究で定義されるオッズ比の値は必ず等しくなります。

「目覚めの一服は肺がんや口腔がんの発症リスクを高める」という報告は、米国の〇〇大学の生物行動学講座の研究グループが発表したもので、特に目覚め後30分以内に最初の一服を吸う人がリスクを高めるとされています。この研究は全米健康栄養調査に参加した約2000人の成人喫煙者を対象に、喫煙習慣と血液中のタバコ特有の発がん物質の濃度を分析したものです。分析の結果、起床後すぐにタバコを吸うグループでは、31分以上後に吸うグループよりも発がん物質の血中濃度が高いことがわかりました。研究者はこれを、起床直後の喫煙でタバコをより深く吸入する傾向があるためとし、肺がんや口腔がんの発症リスクが高まる可能性があるとしています。これに関連して、2年前にも同大学の公衆衛生学の研究グループが「目覚めの一服」と口腔がんを含む頭頚部がんの発症リスクについてアメリカがん協会の機関誌で報告しており、そこでは年間喫煙本数を調整した解析が行われました。この調整は、年間喫煙本数を交絡因子として認識し、その影響を除外するための統計的手法を用いています。具体的には、回帰分析を用いて交絡要因の影響を排除することで、喫煙習慣とがん発症の関係を明確にしました。回帰分析とは、ある変数（例えば喫煙習慣）が他の変数（肺がん発生）にどのように影響するかを数学的にモデル化する方法です。基本的な回帰モデルは、直線的な関係を表す次の式を用います。Y＝α＋βX。この式において、Yは従属変数、Xは独立変数、αは切片、βは傾きです。αとβが推定されると、Xの値が1のとき、Yの値はα＋βと予測できます。さらに、Xが1増加するとYは平均的にβ増加することを示しています。回帰モデルはこのような関係を数式化し、データを基に分析するために使用されます。このような回帰モデルを応用し、喫煙と肺がんの関係を調べるためにリスク差、リスク比、オッズ比を計算することが可能です。仮想的なコホート研究の例として、喫煙ありの肺がん患者が800人、喫煙ありの肺がんでない人が9200人、喫煙なしの肺がん患者が400人、喫煙なしの肺がんでない人が9600人いるケースを考えます。リスク差の回帰モデルは、P＝α＋βXという形になります。ここで、Xは喫煙の有無を示し、Pは肺がんの発生割合を示します。喫煙ありのグループをX=1、喫煙なしのグループをX=0とすると、喫煙ありグループの肺がん発生割合P1は、P1＝α＋βと表せます。一方で、喫煙なしグループの肺がん発生割合P0は、P0＝αと表せます。リスク差は、P1―P0＝（α＋β）－α＝βと計算され、βはリスク差を意味します。統計解析ソフトで回帰分析を行うと、例えばP＝0.0400＋0.0400Xといった結果が得られる場合があります。この結果からリスク差は0.04と計算され、実際に800/10000－400/10000＝0.04と一致します。次に、リスク比を求めるための回帰モデルを考えると、logP＝α＋βXという形になります。このモデルは、Pの対数が線形関係になっているため、対数線形モデルと呼ばれます。喫煙ありグループの発生割合P1については、logP1＝α＋βと表せ、喫煙なしグループについてはlogP0＝αと表せます。これにより、logP1－logP0＝log（P1/P0）＝βという式が成り立ち、自然対数の底eを用いて、elog(P1/P0)=P1/P0＝eのβ乗と表されます。これにより、リスク比はeのβ乗で求められます。実際に、喫煙と肺がんの関係で回帰分析を行うと、logP＝－3.2189＋0.6931Xといった結果が得られ、リスク比はeの0.6931乗で2.00と計算されます。これもまた800/10000／400/10000＝2.00と一致します。さらに、オッズ比を計算するための回帰モデルとして、Log（P/1-P）＝α＋βXという形が用いられます。ここでLogの中のP/1-Pはオッズと呼ばれ、イベントが起きる確率Pと起きない確率1-Pの比を示します。オッズの対数が線形モデルになっているため、このモデルはロジスティック回帰モデルと呼ばれます。喫煙ありグループのオッズP1/1-P1は、Log（P1/1-P1）＝α＋βとなり、喫煙なしグループのオッズP0/1-P0は、Log（P0/1-P0）＝αと表せます。これにより、Log（P1/1-P1）－Log（P0/1-P0）＝Log（P1/1-P1／P0/1-P0）＝βという式が成り立ちます。自然対数の底eを用いると、eLog(オッズ比)＝オッズ比＝eのβ乗と表され、オッズ比もeのβ乗で求められます。喫煙と肺がんの関係で回帰分析を行うと、Log（オッズ比）＝－3.1781＋0.7357Xといった結果が得られ、オッズ比はeの0.7357乗で2.09と計算されます。この結果は800/9200／400/9600＝2.09と一致しています。ロジスティック回帰モデルはケースコントロール研究でも使用できます。例えば、肺がんのない人を1/10でランダムサンプリングし、喫煙あり肺がんあり800人、喫煙あり肺がんなし920人、喫煙なし肺がんあり400人、喫煙なし肺がんなし960人のデータを使用して分析すると、Log（Px/1-Px）＝α＋βXのロジスティック回帰モデルで回帰分析を行い、Log（オッズ比）＝－0.8753＋0.7356Xといった結果が得られました。結果として、オッズ比は同様にeのβ乗で計算され、2.09となります。コホート研究で定義されたオッズ比とケースコントロール研究でのオッズ比は等しくなり、信頼性の高い統計解析手法であることが示されます。これにより、回帰モデルを用いた分析により、交絡要因を考慮しながら喫煙と肺がんの関係が数値的に明確化されることが証明され、研究において重要な手法であることが分かります。

関連記事

前向き研究と後ろ向き研究

質的研究における時間的側面の例

医療統計学で誤解されやすい有効率

統計学における分散と標準偏差

施設外部の独立ＩＲＢの役割

調査とエスノグラフィーの研究例

統計学における異なるデータ形式間の変換

何かを変更するという判断は，盲検化した治療をオープンにした後に行われたか

他の研究からの比較データを利用する例

データクレンジング

1

2

3

4

5

6

目覚めの一服が肺がんリスクを1.59倍に増加【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【トップページへ戻る】
【YouTubeChannel】
【統計解析講義基礎】
【統計解析講義応用】
【ChatGPT・Python・Excel】
【多変量解析】
目覚めの一服が肺がんリスクを1.59倍に増加【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【医療統計解析】

目覚めの一服が肺がんリスクを1.59倍に増加【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【社会経済統計】
【ビジネス統計】
【AI・デジタル】
【統計解析コラム】
【統計解析用語集】
【統計解析セミナー】
目覚めの一服が肺がんリスクを1.59倍に増加【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】【お問い合わせ】

セミナー詳細解析ご相談 LINEでお友達

目覚めの一服が肺がんリスクを1.59倍に増加【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

目覚めの一服が肺がんリスクを1.59倍に増加【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

回帰分析による交絡の調整

目覚めの一服はリスクが大。最低でも３１分は我慢すること

リスクのための回帰モデル

リスク比の回帰モデル

オッズ比の回帰モデル

ケースコントロール研究でのロジスティック回帰モデル

メニュー

サブメニュー

最新記事