観察とデータ解析【統計解析講義応用】

観察とデータ解析【統計解析講義応用】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

観察とデータ解析|【統計学・統計解析講義応用】

観察とデータ解析【統計解析講義応用】


目次  観察とデータ解析【統計解析講義応用】

 

 

観察とデータ解析

 

データ収集は,対象者全員に対して同様の方法で行わなければならない.

 

これは簡単そうだが,実際にはそうではない.

 

スクリプト(script)練習の期間を設けること,頻繁に質のレビューを行うこと,研究に関わっている人たちに再訓練の期間を設けることによって,データ収集を向上させ,潜在的なバイアスを減らすことができる.

 

データ収集方法自体が問題を引き起こすことがある.

 

例えば.高齢者は聴力や認知機能が衰えていることがあり,インタビューの形式を変える必要があるかもしれない.

 

少なくとも,ある被験者のデータ収集に代替方法が用いられた場合は,その旨を記録し,統計解析では,変数として用いるべきである.

 

そのような違いがあることを予測し,その違いが研究結果に及ぼし得る影響を最小限に抑える努力が必要である.

 

横断研究の結果は,有病率の推定値(パーセント,10万人あたりの患者数など)として示されることが多く,推定値の標準誤差から算出した95%信頼区間も併記する.

 

もしサンプリング計画を用いたならば,解析を行う際にそのことを考慮に入れる必要がある.

 

重要な要因の頻度や平均値を,ある有病率が高い疾患や特性を有する集団と有しない集団で比較したり,重要なサブグループ(年齢,性別,合併症などで定義される集団)毎にデータを表示したりする.

 

有病率調査から導かれる結論は,大部分が記述的で仮説探索的である.記述的な調査結果に加え,有病者とそうでない者を様々な特徴について比較して関連性を見ることもある.

 

例えば,有病者の方がより高齢であったり.喫煙者が多かったり,糖尿病患者が多いといった傾向があるかもしれない.

 

単純な解析は要因間の複雑な関連性を考慮にいれていないことが多いので,様々なタイプの回帰分析やその他の手法が用いられるかもしれない.

 

メリット/デメリット

 

横断的調査と横断研究の重要なメリットは,真に人口ベース(population base)であれば,症例報告や症例集積研究に見られがちな潜在的なバイアスの多くを回避できることである.

 

症例集積研究は,必然的に,何らかの理由で治療を求めてきた患者,最も重篤な患者,医療を受ける機会がある患者,の集団に限られてしまう.

 

人口ベースの標本を用いれば,このようなバイアスは回避できる.適切に実施された人口ベースの研究では,一般集団をより反映した集団が得られる.

 

横断研究は,短期間であることが多い.

 

対象集団を特化することができ(特定業種の労働者など),多様な曝露要因とアウトカムを同時に調査することができる.

 

横断研究は費用がかかることが多いが,有病率の高い疾患は,稀な疾患に比べて少ない費用で実施できる.

 

有病率が高ければ,小規模の標本からでも十分に安定した有病率の推定値が得られるためである.

 

1,000人に1人, 10,000人に1人といった有病率の疾患では.非常に大規模な標本が必要となり,人口ベースの横断研究は実現しにくいであろう.

 

横断研究は,稀な疾病や短期間しか続かない疾病には一般的に不向きである.

 

有病率は,発生率と疾病期間の積に比例するため,インフルエンザのような短期間の疾病の場合,発生率は非常に高いが,どの一時点をとっても有病率は比較的低い.

 

拒否率が高いことは,正確な有病率の推定を困難にしている.

 

何種類かのバイアスが潜在している可能性がある.

 

 

通常,この種の研究に参加する被験者は,不参加者よりも,社会経済レベル,教育レベル,健康への意識や関心がより高い傾向がある.

 

喫煙者や,その他の高リスクな健康生活習慣をもつ人たちの参加率は低い傾向がある.

 

もし,有病率が,参加者よりも不参加者で大幅に高い場合は,疾患の真の有病率を過小評価することになる.

 

不参加に起因する潜在的なバイアスを洞察するためには,不参加者らの特性を可能な範囲で調べてみることを勧める.

 

これは,抽出枠から人口統計学的特性を入手できる場合のみ可能である.

 

これより重要なのは.コンタクトした総人数と不参加の総人数を追跡し,参加率の推定値を正確に把握することである.

 

疫学者や調査の統計家にとって,80%を下回る参加率は望ましくない.

 

そうはいっても人ロペースの標本抽出では, 80%を上回る参加率を達成することは難しいことではある.

 

縦断的な研究と比べた時の横断研究のデメリットは.心筋梗塞の直後に血圧が上がったり,下がったりする(より頻繁に起こる‘)ように,疾病の過程自体が曝露要因を変化させる可能性があることである.

 

横断研究は,潜在的な因果要因を特定するために,測定した因子と疾病発現との時間的前後関係を検討することはできない.

 

例えば,脳のMRIを用いた横断研究において,認知機能低下と側頭葉の大きさの間に関連性が見られたとすると,小さな側頭葉が認知機能低下を導いたのか,認知機能低下が側頭葉の萎縮を招いたのか,あるいは別の第三の要因が両者を誘発したのか,このデータだけでは判断できない.

 

有病率の推定値は,横断研究から得られる最大の成果であるが.疾病や健康状態に関連する要因は,横断研究でもケースコントロール研究でも評価することができる.

 

もし,研究の主要な目的が,疾病や健康状態に関連する要因を評価することであれば,それは横断的なデザインによってもケースコントロールデザインによっても行うことができることを認識しておくことは重要である.

 

横断研究のデメリットとして.一般的に,ケースコントロール研究よりも費用や時問がかかる.

 

特に稀な疾患の場合には.なおさらである.

 

可能であれば,(病院やレジストリなどを通して)まず患者集団を特定してから彼らを募集対象にする方が,有病率が1万人に1人だと予測される疾患を有する患者をある集団から300人見つけようとする(300万人の被験者が必要になる)よりも実施しやすい.

 

 

観察とデータ解析【統計解析講義応用】


セミナー詳細                    解析ご相談                    LINEでお友達

観察とデータ解析【統計解析講義応用】

観察とデータ解析【統計解析講義応用】