Python・R・エクセルによるデータサイエンス | 統計解析講義

擬似反復の統計学【統計解析講義応用】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

擬似反復の統計学【統計解析講義応用】

擬似反復の統計学【統計解析講義応用】


擬似反復の統計学【統計解析講義応用】

擬似反復の統計学

 

ランダム化比較試験において,被験者は系統的なものによらず,ランダムに実験群か統制群に割り当てられる。

 

ランダムという言葉は,こうした研究を少し非科学的な感じにさせるが,通常,医学試験はランダム化比較試験でないかぎり,信頼できるものとは考えられない。

 

なぜそうなるのだろうか。ランダム化の何がそんなに重要なのだろうか。

 

 ランダム化は,研究者が試験対象となるグループの間に系統的な偏りを招き入れることを防ぐはたらきがある。

 

もしランダム化をしなかったら,研究者はあまりリスクがなかったり,あまり手間がかからなかったりする治療法に虚弱な患者を割り当てるかもしれない。

 

あるいは,保険会社が新しい治療法に金を払ってくれるだろうから,裕福な患者を新しい治療法に割り当てるかもしれない。

 

しかし,ランダム化には隠れた偏りというものがなく,これを実行することによって各群が大体同じような人員構成になることが保証される。未知のものも含め,交絡因子が結果に影響することはない。

 

統計的に有意な結果を得れば,可能性のある唯一の原因が,薬ないし介入そのものであることが分かるのだ。

 

実際に行われている擬似反復

 

血圧に関する2種類の薬物治療について比較したいとする。

 

2000人の患者を集め,それをランダムに2グループに振り分ける。

 

そして,薬物治療を実施する。薬物治療の効果を得るまで1か月待ってから,個々の患者の血圧を測り,どちらのグループが血圧の平均が低いかを調べるために比較を行う。

 

ここでは,普通の仮説検定を実施して普通のP値を得ることができる。

 

標本の大きさが各グループに患者が1000人いるというものだから,2種類の薬物治療の違いを検出する検定力として優れたものが得られるだろう。

 

 さて,別の実験計画を思い描いてみよう。

 

各グループに患者を1000人ずつ集めるのではなく,10人しか集めないものとする。

 

ただし,患者の血圧を数か月にわたり100回測るものとする。こうすることで,日によって変化するかもしれない個人の血圧をより正確なものに修正することができる。

 

あるいは,血圧計が完璧に較正されていないということを心配して,日ごとに違う血圧計で測るかもしれない。データ点の数はグループごとに1000個あるが,患者の数は重複して数えなければ10人しかいない。

 

標本の大きさが同じようだから,同じ検定力の同じ仮説検定を実施できる。

 

 だが,本当にできるのだろうか。

 

標本の大きさが大きいことは,グループ間の違いはどれも治療の結果によるものであって遺伝的特徴や前から存在する条件によるものでないことを保証するものと想定されている。

 

しかし,この新しい実験計画では,新しい患者を集めているわけではない。既存の患者の遺伝的特徴を100回数えているだけなのだ。

 

 この問題は擬似反復(pseudoreplication)として知られていて,極めてありふれたものだ。

 

例えば,ある培養物からの細胞を調べた後に,同じ培養物からさらに細胞を取り出して調べる形で,生物学者が結果を「反復」するかもしれない。

 

たった2匹のラットから得られた何百ものニューロンは標本の大きさが大きいと主張するといった形で,神経科学者は同じ動物からニューロンを複数調べるかもしれない。

 

海洋生物学者は,同じ水槽の中にいる魚同士は独立していないということを忘れて,水槽の魚に対して実験を行おうとするかもしれない。

 

この場合,試験しようとしている処置だけでなく,水槽の条件が魚に影響するかもしれない。

 

これらの実験がラットや魚の一般的な傾向について明らかにしようとするものならば,その結果は大いに誤解させるものになる。

 

 擬似反復は,間違った質問に答えるデータを集めることと捉えることができる。

 

動物行動学者は,鳥の鳴き声を理解しようとすることがしばしばある。

 

例えば,さまざまな鳴き声を鳥に聞かせたときに,鳥がどう反応するかを評価するのだ。

 

鳴き声は,人間の訛りのように,地域によって変わることがある。そして,こうした鳴き声の方言は比較することが可能だ。

 

1990年代より前において,こうした実験の一般的な手続きとは,各方言から代表的なさえずりを1つ録音して,これらのさえずりを10羽か20羽の鳥に聞かせて反応を記録するというものだった。

 

観察する鳥を増やせば増やすほど,標本の大きさは大きくなる。

 

 だが,研究で解明したいことは,さまざまなさえずりの方言についてであって,個々のさえずりについてではない。さえずりがどれほど「代表的」なものであったとしても,それを多くの鳥に聞かせることが,方言Aがシルスイキツツキのオスにとって方言Bより魅力的である証拠に結びつくわけではない。

 

特定のさえずりあるいは録音が魅力的だという証拠にしかならないのだ。研究で解明したいことに対して適切な答えを得たければ,双方の方言におけるさえずりの標本がたくさん必要となるだろう。

 

 擬似反復は,先はどの血圧の実験の例のように,同じ被験者から時間の経過とともに別々の測定を行うこと(自己相関[autocorrelation])によっても引き起こされうる。

 

同一の被験者について測定した日ごとの血圧の間には,企業の年ごとの収益の数値と同様に,自己相関がある。

 

こうした自己相関の数学的構造は複雑で,患者ごとに,あるいはビジネスごとに異なったものになる。

 

うっかりとした科学者が,各々の測定がその他の測定から独立しているかのようにこうしたデータを扱ってしまえば,擬似反復による結果を手に入れてしまうことになる。

 

そして,これは誤解を招く結果になる。

 

擬似反復への申し開き

 

実験計画を綿密に立てることで,測定同士の依存関係を打破することができる。

 

農場実験では,各耕地に植えてある異なる品種の穀物の成長率を比較することがあるだろう。

 

しかし,耕地によって,土壌や潅漑の質が異なるのならば,各々の耕地でどれだけ多くの植物を測定したとしても,穀物の違いと土壌の条件による違いとを切り分けることができないだろう。

 

より良い実験計画にするには,各耕地を小さな区画に分けて,各々の区画にランダムに穀物の品種を割り当てれば良いだろう。

 

区画として選択できる範囲が十分に幅広いものならば,土壌の違いが,ある穀物に対して他の穀物より系統的に有利になることはないだろう。

 

 あるいは,実験計画を変更できない場合,統計分析が擬似反復の説明に役立つ可能性がある。

 

統計の技法は,各測定が互いに独立していない状況を魔法のように消し去るわけではないし,適当でない実験計画から良い実験結果を得られるようにするわけでもない。
測定の間の依存関係を定量化し,データを正確に解釈できる方法を提供するだけだ(つまり,こうした統計的技法は,素朴な分析と比べれば,信頼区間が広くなったり,P値が大きくなったりする)。

 

擬似反復の説明に役立つ統計の技法としては以下のようなものがある。

 

「独立していないデータ点の平均をとる 例えば,ある個人の血圧の測定結果すべてを平均し,それを1つのデータ点と見なす。これは完璧な方法ではない。もしある患者について他の患者よりたくさん測定していたとしても,そのことは平均の数値に反映されない。測定の確実さのレベルは測定するほど上がるが,これを結果に反映したければ,測定がたくさんなされた患者に対する重みが大きくなるような重み付きの分析を行うべきだ。独立していないデータ点を取り分けて1つ1つ分析する 患者の血圧の測定をすべてまとめるかわりに。1人の患者から,例えば5日目の血圧だけを取り出して,他のデータ点は無視する。しかし,注意が必要だ。こうしたことを測定日ごとに繰り返せば。次章で議論する多重比較の問題を引き起こすことになる。独立していないことをP値と信頼区間を調節することで補正する データ点の間の依存関係の度合いを推定・説明する手続きとして,多くのものが存在している。例えば,クラスター標準誤差(clustered standard error), 反復測定検定(repeated measures test),階層モデル(hierarchical model)などが挙げられる。」

 

セミナー詳細こちら                    解析ご相談こちら


 

擬似反復の統計学【統計解析講義応用】

擬似反復の統計学【統計解析講義応用】

擬似反復の統計学【統計解析講義応用】