横断研究の有病率推定とバイアス克服の鍵【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

データ収集は、対象者全員に同様の方法で行う必要があるが、実際には容易ではない。スクリプト練習や質のレビュー、再訓練が必要であり、高齢者の聴力や認知機能の影響も考慮すべきである。横断研究では有病率が推定され、信頼区間も併記するが、サンプリング計画の考慮が重要である。有病率調査は記述的で、仮説探索的であり、有病者と非有病者の特徴比較も行われる。横断研究は短期間であり、特定集団に焦点を当て、低コストで実施可能な場合もあるが、稀な疾患には不向きである。拒否率が高い場合、正確な推定が難しく、社会経済的な偏りも生じる可能性がある。横断研究は因果関係の検討が困難であり、コントロール研究に比べて費用や時間がかかる点もデメリットである。

▼▼▼▼▼▼▼▼
チャンネル登録はこちら

目次横断研究の有病率推定とバイアス克服の鍵【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

観察とデータ解析

データ収集は，対象者全員に対して同様の方法で行わなければならない．

これは簡単そうだが，実際にはそうではない．

スクリプト(script)練習の期間を設けること，頻繁に質のレビューを行うこと，研究に関わっている人たちに再訓練の期間を設けることによって，データ収集を向上させ，潜在的なバイアスを減らすことができる．

データ収集方法自体が問題を引き起こすことがある．

例えば．高齢者は聴力や認知機能が衰えていることがあり，インタビューの形式を変える必要があるかもしれない．

少なくとも，ある被験者のデータ収集に代替方法が用いられた場合は，その旨を記録し，統計解析では，変数として用いるべきである．

そのような違いがあることを予測し，その違いが研究結果に及ぼし得る影響を最小限に抑える努力が必要である．

横断研究の結果は，有病率の推定値（パーセント，10万人あたりの患者数など）として示されることが多く，推定値の標準誤差から算出した95％信頼区間も併記する．

もしサンプリング計画を用いたならば，解析を行う際にそのことを考慮に入れる必要がある．

重要な要因の頻度や平均値を，ある有病率が高い疾患や特性を有する集団と有しない集団で比較したり，重要なサブグループ（年齢，性別，合併症などで定義される集団）毎にデータを表示したりする．

有病率調査から導かれる結論は，大部分が記述的で仮説探索的である．記述的な調査結果に加え，有病者とそうでない者を様々な特徴について比較して関連性を見ることもある．

例えば，有病者の方がより高齢であったり．喫煙者が多かったり，糖尿病患者が多いといった傾向があるかもしれない．

単純な解析は要因間の複雑な関連性を考慮にいれていないことが多いので，様々なタイプの回帰分析やその他の手法が用いられるかもしれない．

メリット／デメリット

横断的調査と横断研究の重要なメリットは，真に人口ベース(population base)であれば，症例報告や症例集積研究に見られがちな潜在的なバイアスの多くを回避できることである．

症例集積研究は，必然的に，何らかの理由で治療を求めてきた患者，最も重篤な患者，医療を受ける機会がある患者，の集団に限られてしまう．

人口ベースの標本を用いれば，このようなバイアスは回避できる．適切に実施された人口ベースの研究では，一般集団をより反映した集団が得られる．

横断研究は，短期間であることが多い．

対象集団を特化することができ（特定業種の労働者など），多様な曝露要因とアウトカムを同時に調査することができる．

横断研究は費用がかかることが多いが，有病率の高い疾患は，稀な疾患に比べて少ない費用で実施できる．

有病率が高ければ，小規模の標本からでも十分に安定した有病率の推定値が得られるためである.

1,000人に１人, 10,000人に１人といった有病率の疾患では．非常に大規模な標本が必要となり，人口ベースの横断研究は実現しにくいであろう．

横断研究は，稀な疾病や短期間しか続かない疾病には一般的に不向きである．

有病率は，発生率と疾病期間の積に比例するため，インフルエンザのような短期間の疾病の場合，発生率は非常に高いが，どの一時点をとっても有病率は比較的低い．

拒否率が高いことは，正確な有病率の推定を困難にしている．

何種類かのバイアスが潜在している可能性がある．

通常，この種の研究に参加する被験者は，不参加者よりも，社会経済レベル，教育レベル，健康への意識や関心がより高い傾向がある．

喫煙者や，その他の高リスクな健康生活習慣をもつ人たちの参加率は低い傾向がある．

もし，有病率が，参加者よりも不参加者で大幅に高い場合は，疾患の真の有病率を過小評価することになる．

不参加に起因する潜在的なバイアスを洞察するためには，不参加者らの特性を可能な範囲で調べてみることを勧める．

これは，抽出枠から人口統計学的特性を入手できる場合のみ可能である．

これより重要なのは．コンタクトした総人数と不参加の総人数を追跡し，参加率の推定値を正確に把握することである．

疫学者や調査の統計家にとって，80％を下回る参加率は望ましくない．

そうはいっても人ロペースの標本抽出では, 80%を上回る参加率を達成することは難しいことではある.

縦断的な研究と比べた時の横断研究のデメリットは．心筋梗塞の直後に血圧が上がったり，下がったりする（より頻繁に起こる‘）ように，疾病の過程自体が曝露要因を変化させる可能性があることである．

横断研究は，潜在的な因果要因を特定するために，測定した因子と疾病発現との時間的前後関係を検討することはできない．

例えば，脳のＭＲＩを用いた横断研究において，認知機能低下と側頭葉の大きさの間に関連性が見られたとすると，小さな側頭葉が認知機能低下を導いたのか，認知機能低下が側頭葉の萎縮を招いたのか，あるいは別の第三の要因が両者を誘発したのか，このデータだけでは判断できない．

有病率の推定値は，横断研究から得られる最大の成果であるが．疾病や健康状態に関連する要因は，横断研究でもケースコントロール研究でも評価することができる．

もし，研究の主要な目的が，疾病や健康状態に関連する要因を評価することであれば，それは横断的なデザインによってもケースコントロールデザインによっても行うことができることを認識しておくことは重要である．

横断研究のデメリットとして．一般的に，ケースコントロール研究よりも費用や時問がかかる．

特に稀な疾患の場合には．なおさらである．

可能であれば，（病院やレジストリなどを通して）まず患者集団を特定してから彼らを募集対象にする方が，有病率が１万人に１人だと予測される疾患を有する患者をある集団から300人見つけようとする（300万人の被験者が必要になる）よりも実施しやすい．

データ収集は、信頼性の高い結果を得るために、対象者全員に対して同様の方法で行われなければならない。しかし、この一見単純な手続きは、実際の研究においては容易ではないことが多い。各対象者に対して均一な手法を確保するためには、スクリプト練習の期間を設け、データ収集における手法が適切かどうかを頻繁にレビューし、研究チームに再訓練の機会を設けることが有効である。これにより、データ収集の質を向上させ、潜在的なバイアスの発生を抑えることができる。特に、収集方法自体が研究結果に影響を与える可能性があるため、その方法を慎重に設計し、見直す必要がある。例えば、高齢者を対象とした場合、彼らの聴力や認知機能が若年者に比べて低下していることがあり、その影響でインタビューの形式や質問内容を工夫する必要が生じる。こうした変更は対象者ごとに異なる場合があり、特に注意が必要である。もし、特定の対象者に対して代替的な方法を用いた場合、その旨を明確に記録し、統計解析においてはこれを変数として扱うべきである。このような収集方法の違いが、研究結果に与える影響を最小限に抑えるためには、計画段階であらゆる可能性を考慮し、対応策を立てることが重要である。横断研究の結果として示される有病率は、一般的に推定値（パーセントや人口10万人あたりの患者数）として表され、95％信頼区間も算出される。信頼区間を併記することにより、データの精度がより明確になり、解釈の際に重要な指標となる。また、サンプリング計画がある場合は、その計画を考慮した解析が必要である。サンプリングの方法により、得られるデータの代表性が大きく変わるため、調査の精度と信頼性が確保される。さらに、重要な要因の頻度や平均値を、有病率が高い集団とそうでない集団で比較し、年齢、性別、合併症などのサブグループに分けてデータを表示することが有効である。このように、横断研究から導かれる結論は大部分が記述的で仮説探索的なものであり、既存の知見を補完したり、新たな仮説を立てたりする基礎資料として重要である。加えて、横断研究では有病者と非有病者を比較することで、疾患や健康状態に関連する要因を明らかにすることができる。例えば、有病者の特徴として、年齢が高い、喫煙者の割合が多い、糖尿病患者の割合が高いなどの傾向が観察されることがある。これにより、関連性を検証するためのデータとして活用できる。一方で、単純な解析では、要因間の複雑な関連性が考慮されないことが多く、複数の変数が影響しあう可能性があるため、回帰分析や他の高度な手法を用いることで、より正確な結論が得られる場合がある。横断的な調査や研究の最大のメリットは、真に人口ベースで実施することで、症例報告や症例集積研究に見られる潜在的なバイアスの多くを回避できる点である。症例集積研究では、治療を求めている患者や最も重篤な患者に偏りが生じやすく、医療機関にアクセスできる人々のみに限られることが多いため、一般集団にそのまま適用するには不十分である。しかし、人口ベースの標本を用いることにより、このようなバイアスを回避し、一般集団を反映したデータを得ることが可能である。また、横断研究は短期間で実施されることが多く、比較的早期に結果が得られるため、スクリーニングや検診に応用しやすい。対象集団を特化することができ、特定業種の労働者など、さまざまな曝露要因とアウトカムの関係を同時に調査することも可能である。このため、短期間で包括的なデータを得ることができるのが横断研究の特徴である。費用面においては、横断研究はコストがかかることが多いが、稀な疾患と比較して有病率が高い疾患であれば、比較的少ない費用で実施が可能である。例えば、有病率が高ければ小規模な標本でも安定した推定値が得られるため、大規模な集団を調査する必要がない。しかし、例えば1万人に1人というような低い有病率の疾患の場合、大規模な標本が必要となり、その実施は困難である。横断研究は、一般的に稀な疾病や短期間しか続かない疾病には適していない。このことは、例えばインフルエンザなどの短期間の疾病においても同様であり、発生率が高い場合でも、任意の一時点での有病率が低い可能性があるためである。さらに、調査への参加拒否率が高い場合、正確な有病率の推定が難しくなり、調査結果に潜在的なバイアスが含まれることがある。このような偏りを最小限に抑えるため、研究者は不参加者の特性を可能な範囲で調べ、偏りを理解するための手がかりとすることが推奨される。このような分析は、抽出したサンプルの人口統計学的データを活用することにより、精度を高めることができる。また、研究対象の総人数と不参加の人数を追跡し、参加率の推定を行うことで、結果の信頼性が向上する。疫学者や統計学者にとって、80％未満の参加率は理想的ではなく、通常80％を上回る参加率が望まれるが、実際には達成が困難な場合もある。さらに、横断研究のデメリットとして、縦断研究と比べて、ある出来事が要因であるのか結果であるのかを明確にすることが難しいという点が挙げられる。心筋梗塞の直後に血圧が変動するように、疾病が要因に影響を与えることがあるため、横断研究では因果関係を直接的に評価することはできない。例えば、認知機能低下と脳の側頭葉の大きさに関連性が見られた場合、小さな側頭葉が認知機能の低下を引き起こしたのか、認知機能の低下が側頭葉の萎縮を招いたのか、または第三の要因が関与しているのかは明確にできない。このような因果関係の検討には、縦断的なデザインや介入研究が必要とされることが多い。また、横断研究の最大の成果は有病率の推定であるが、これに加えて、疾患や健康状態に関連する要因を評価することも可能である。研究の主要な目的が、疾病に関連する要因の特定であれば、横断的デザインまたはケースコントロールデザインが有効な手法となる。しかし、横断研究にはケースコントロール研究と比べて費用や時間がかかる場合があり、特に稀な疾患ではコストが大きな問題となることがある。そのため、例えば病院やレジストリを活用し、あらかじめ対象集団を特定することで、実施が容易になる場合がある。

関連記事

エクセルを使うときの注意点

試験依頼者の要件

統計教育

信頼区間と権限強化

サンプルサイズに関する特記事項

横断研究，有病率調査，発生率研究

新しい世界

推測統計学で重要なt-検定

データのまとめ方の統計学

治験のフェーズ

前へ

1

2

3

4

5

6

次へ

【トップページへ戻る】
【YouTubeChannel】
【統計解析講義基礎】
【統計解析講義応用】
【ChatGPT・Python・Excel】
【多変量解析】
【医療統計解析】

【社会経済統計】
【ビジネス統計】
【AI・デジタル】
【統計解析コラム】
【統計解析用語集】
【統計解析セミナー】
【お問い合わせ】

セミナー詳細解析ご相談 LINEでお友達

Google Gemini・Python・エクセルを使った講義で最速マスター

横断研究の有病率推定とバイアス克服の鍵【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

横断研究の有病率推定とバイアス克服の鍵【東京情報大学・嵜山陽二郎博士のAIﾃﾞｰﾀｻｲｴﾝｽ講座】

観察とデータ解析

メリット／デメリット

サブメニュー

最新記事