試験デザインについての考察【統計解析講義応用】

試験デザインについての考察【統計解析講義応用】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

試験デザインについての考察|【統計学・統計解析講義応用】

試験デザインについての考察【統計解析講義応用】


目次  試験デザインについての考察【統計解析講義応用】

 

 

試験デザインについての考察

 

診断精度試験をデザインする上で考慮すべき問題は数多くある.

 

数人の著者らが,診断精度を評価するための臨床試験の段階を定義している。

 

Zhouらは3つの基本的な段階:第1相(フェーズ〔Phase〕I)一探索.第n相一性能調査(中等度),そして第V相一臨床適用(高度),を提唱している.

 

第1相では,通常少ない人数(10〜50名)の患者で,検査の性能を明らかな疾患状態の症例と健常なボランティアについて調査する.

 

第n相では,より多くの被検者(50〜100例)が検査され,多くの場合その目的は,診断が難しい症例と合併症あるいはその他の潜在的に紛らわしい症状を有するような困難な対象例を含むより広範囲な群に対する検査の性能を調べることによって,検査の改良もしくは既存の他の検査との比較を行うことである.

 

診断が難しい症例を対象とし,比較する検査の結果が一致しにくい典型的な第II相比較試験では,症例と対照例の診断が容易で検査がよく一致する傾向がある試験よりも要求されるサンブルサイズは通常少ない.

 

直感的には,大抵の場合,検査の間により大きな差があればどちらの検査が正しいかを決定することはより簡単になる.

 

最初の2つの相は.一般には後ろ向き症例対照試験として実施される.

 

第V相の診断試験は,検査精度および相対精度の可能な限り正確でバイアスのない推定値を得ることが目的である.

 

第V相では,試験集団は関連する精度の推定を行う対象にできるだけ近いものにするべきである.

 

第V相の試験の規模は大きく(100例もしくは希少な疾患についてはさらに多い),また範囲バイアスや症例と対照の間の検査条件の差といった,後ろ向き試験に一般に見られるバイアスの影響を避けるために試験は通常前向きなものとなる.

 

検査法の開発が進むに従い,試験は異なる問題に答えるようにデザインされる.

 

早期の試験はその検査が何らかの診断的な値を持つかどうか調べるのに対して,後の方で行われる試験では新しい検査と標準的な検査を比較しようとするだろう.

 

試験の目的を設定した後には,研究者は検査を評価するための測定の精度を測る尺度を決めなくてはならない.

 

ROC曲線下面積は,症例と対照を区別する検査の能力を要約しているので,早期探索段階の試験(第1相)ではよい選択になる.

 

ある検査法が何らかの診断情報を持つかどうかを検討する試験では, AUCが0.5もしくは他の事前に定義した容認可能な値より大きいかどうかを調べるかもしれない.

 

第n相の試験でも,多くの場合でAUCはこれに必要とされるサンプルサイズが他の一般的な尺度を用いる時よりも小さくなるような.精度を測る主要な尺度となるある固定した値もしくは範囲のFPFの下での感度も,またもう1つの関心のある対象となるかもしれない.

 

比較試験ではAUCを比較することが頻繁に行われる.

 

第V相の試験における精度の測定尺度は,大規模試験であるとか,どれが臨床的に妥当な関心のある測定であるか,といった設定により多様なものとなる.

 

 

例えば,一般集団のふるいとしての検査の有用性が検討対象となるがんのスクリーニング試験では. PPVは検査の能力と同様に早期発見を通じて疾患による死亡率を低下させるためには重要である.

 

卵巣がんの診断は,診断検査の開発において1つの有益な研究事例である.

 

この疾患は診断が難しく,その治療がさらに難しくなる後期のステージで発見されることが多い.

 

したがって,早期発見のための診断検査の開発には大きな関心が寄せられる.

 

卵巣がんの診断検査には,経膣超音波検査と腫瘍マーカーCA-125の2つの検査が存在するが,これら検査法の早期発見における有用性には疑問が呈されている.

 

早期開発試験の1つの例では44名の症例,45名の健常女性,そして37例の良性骨盤腫瘍の患者について血清サイトカインマーカーとCA・125の組み合わせについて調べ,2つの検査法の感度と特異度が比較された高度な統計手法が2つのマーカーを用いた最適化分類アルゴリズムを特定するために用いられ,得られたアルゴリズムのROC曲線がCA-125単独の場合のそれと比較された.

 

その結果はAUCで0.966という見込みのあるものであったが,被検者らのサンプルはおそらく精度を過大推定してしまう傾向があると思われる範囲バイアスを含んでいた.

 

対して,前立腺,肺,大腸,卵巣(Prostate, Lung Colorectal and Ovarian, PLCO)がんスクリーニング試験は.がんのスクリーニングが,がん死亡率を低下させることができるかを調べる大規模な前向きランダム化第V相試験で.その目的のうちの1つは, CA-125と超音波検査の双方によるスクリーニングが卵巣がんによる死亡率を低下させるかを評価することであった.

 

この試験では,年齢が55歳から74歳の男女74,000例をがんのスクリーニングまたは通常の臨床ケアにランダム化することを計画していた.

 

初期の結果では,4ラウンドの卵巣がんのスクリーニング検査の後に. PPVは1.3%で72%の卵巣がんが後期のものと診断された.

 

これらの結果は,ベースラインの時点で存在するがんによって悲観的な方向に歪んでいるかもしれない.PLCO試験に参加した女性は最低13年間追跡観察されることになっており,卵巣がんにおける死亡率の低下についての評価は試験の最終結果を待たなければならない.

 

 

試験デザインについての考察【統計解析講義応用】


セミナー詳細                    解析ご相談                    LINEでお友達

試験デザインについての考察【統計解析講義応用】

試験デザインについての考察【統計解析講義応用】