連続性の誤り【統計解析講義応用】

連続性の誤り【統計解析講義応用】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

連続性の誤り|【統計学・統計解析講義応用】

連続性の誤り【統計解析講義応用】


目次  連続性の誤り【統計解析講義応用】

 

 

連続性の誤り

 

偽薬と薬はどちらが効果的か,赤信号での右折を許す交差点はそうでない交差点より多くの犠牲者を生むのか,といったグループ間の比較は統計解析では重要である。

 

各グループについて,交通事故の平均件数のような1つの統計量を取り出し,これらの統計量がグループ間で有意な違いがあるかを見たのだった。

 

だが,試験の対象を明確なグループに分けられない場合はどうなるのだろうか。

 

肥満が健康に与える影響を研究する場合,研究に参加する個々人の血圧・血糖値・安静時心拍数などを測定するとともに, BMIを測定する。

 

しかし,患者の中に,明確な2つのグループがあるわけではない。

 

あるのは,低体重から肥満までの連続した範囲だ。

 

 

例えば,この範囲の一方の端からもう一方の端まで見ていくとき,健康の傾向がどうなるかについて見いだしたいとしよう。

 

こうした筋書きを扱う統計手法の1つとして,回帰モデル(regression model)というものがある。

 

この手法は,各変数について限界効果(marginal effect)を推定するものだ。

 

つまり,体重が1ポンド(およそ0.54キログラム)増えるごとに健康に及ぼされる影響を推定するもので,恣意的な境界で分けたときの各グループの違いを推定するものではないのだ。

 

この手法によって,グループ間の単純な比較よりずっときめの細かい結果を得ることができる。

 

しかし,科学者はしばしばデータを単純化して,回帰分析が必要になることを避けようとする。

 

「過体重の人は心臓病になる可能性が50%高い」と述べることは,「メトロポリタン相対体重が1単位増加するごとに,心臓病の対数オッズが0.009増加する」とするよりも,臨床的な含みがぐんと分かりやすい。

 

たとえデータの詳細をすべて捉えられる統計モデルを組み立てることが可能だとしても,統計分析者は,純粋に実践上の理由から,技術的に優れた分析よりも単純な分析を選ぶかもしれない。

 

今まで見てきたように,単純なモデルだとしても,誤って用いられることがありえるし,データを単純化する過程でも多くの誤りが混入することがありえる。

 

単純化の過程と、完全な回帰をかわりに用いるときに犯しがちな過ちについては注意する必要がある。

 

 

連続性の誤り【統計解析講義応用】


セミナー詳細                    解析ご相談                    LINEでお友達

連続性の誤り【統計解析講義応用】

連続性の誤り【統計解析講義応用】