臨床試験データの階層|【医療統計学・統計解析】
臨床試験データの階層
臨床試験データには構造的な違いだけでなく,データの種類により収集される次元が異なるという側面がある.
本来,その臨床試験において収集された臨床試験データは一度だけコンピュータに入力されればよい.
しかしながら,ただ一つの臨床試験を考えた場合でも,臨床検査値の基準範囲といった施設に付随するような情報については,患者ごとに複数回にわたって収集して入力するよりも,施設単位で収集して入力する方が望ましい.
また,多くの場合には,たった一つの臨床試験を実施して終わるということはないはずである.
とくに製薬企業においては,数多くの臨床試験が実施されており,一つの薬剤について考えたとしても複数の臨床試験が実施されるのが一般的であり,複数の臨床試験を通じての集計や解析を行う必要がある.
つまり,臨床試験データを取り扱う際には臨床試験データを併合してデータの集計や解析を行うということについても考慮しておかなければならない.
このため,臨床試験データはいくつかの階層に分けて考えた方が効率的な処理を実現することができる.
階層を考えることも,データモデルを構築する上でとても大切なことである.
階層に基づいてデータの定義を行うべきレベルや実際に取得できるデータのレベルがある.
全ての臨床試験を通じて用いられるものを「Global Level」,その薬剤を通じて用いられるものを「Drug Level」,そのプロトコルを通じて用いられるものを「Protocol Level」として考え,さらに施設ごとに用いられるものを「Center Level」,患者ごとに用いられるものを「Patient Level」,患者の訪問ごとに用いられるものを「Visit Level」という分類がある.
このほかにも,疾患領域ごとに用いられる「TA (Therapeutic Area) Level」というようなものも考えることができる.
基本的な臨床試験データは患者ごとに収集されるものであるため,単純に考えれば全ての臨床試験データそのものはPatient Level以下に割り当てられることになる.
すなわち,背景情報は患者単位で収集され,投薬情報,臨床検査値や薬物血中濃度などはVisit単位で収集される.
そして,有効性と安全性については,総合判定は患者単位と言えるが,経時的推移や有害事象などはVisit単位で収集されると考えた方がよい.
しかしながら,背景に含まれるデータ項目を定義するレベルという意味ではGlobal LevelからProtocol Level までのそれぞれに可能性がある.
すなわち,全ての臨床試験で少なくとも「イニシャル」,「性別」,「年齢」などは収集するはずであり,イニシャルは文字型として2バイト長,性別は文字型として4バイト長,年齢は整数型というような項目の定義についてはGlobal Levelで共有化することが充分に可能なのである.
同様にして,投薬情報,有効性,安全性,臨床検査および血中濃度についても,項目の定義という意味ではGlobal LevelからProtocol Level までのいずれもが考え得る.
これらの項目についてはできる限り,上位レベルでの定義を行い広く組織内で共有化できるようにしておくべきである.
上位レベルで定義を行うことにより,試験1では性別をM/Fのコードで入力しており,試験2では男性/女性で入力しているといった不統一を防ぐことができる.
臨床検査が集中測定で行われる場合などであれば,その基準範囲というのは使用するセントラルラボごとに一律であり,そういう意味では全ての臨床試験を通じて同じものを適用することができるためGlobal Level と考えられる.
薬剤の領域によっては,特殊な検査項目があり,その領域内だけで基準範囲が統一的に規定されれば充分な場合や,プロトコル内だけでの統一的な規定を行うことも考えられる.
ただし,そのような場合もGlobal Levelの基準範囲との重複については配慮しておくべきであろう.
また,施設内での臨床検査を中心に実施する場合には,施設ごとの基準範囲設定で充分であるというケースもあり,この場合はCenter Level ということになる.
なお,臨床検査値の基準範囲が男性と女性で異なることはよく知られているが,さらに年齢層別や疾患別に区別することがあり,このような場合には患者ごとの対応が必要になる.
さらに,まれにではあるが,臨床試験中に基準範囲が変更されるケースがあるので注意が必要である.
男性を「1」,女性を「2」と定義するようなコードについても,なるべく全ての臨床試験を通じて同じものを適用すべきと考えられる.
すなわち, Global Level での管理が必要ということである.
一つの臨床試験だけを考えた場合には,自由に必要なコードを定義してもよいが,いくつかの臨床試験データを併合して集計・解析しようという場合は多い.
このような場合に,試験ごとに性別のコード内容が異なっていたとすれば,臨床試験データを併合するために大変な労力が必要になり効率的ではない.
ただし,薬剤の領域によっては,特殊な観察項目があり,その領域内だけでコードの統一が取れていれば充分な場合はあり得る.
このような場合には, TA Level やDrug Level での管理でもよいと思われるが,少なくともコードの管理についてはProtocol Level までで定義されなければならない.
先に挙げた例では,性別というような項目の内容が明らかに限定された数の項目であったので, Global Level でのコードの統一もそれほど困難なものではない.
しかし,施設というような項目の場合には,問題が生じることがある.
試験1では,東京病院と大阪病院の2施設が参加し,試験2では大阪病院と福岡病院の2施設が参加するというような場合に,試験1で東京病院を「1」,大阪病院を「2」と定義し,試験2では大阪病院を「1」,福岡病院を「2」と定義してしまうと,試験1と試験2を併合しようとする際にコードの混乱が起きる.
本来は施設をGlobal Levelでのコード統一の対象として,東京病院を「1301」,大阪病院を「2701」,福岡病院を「4001」などと定義としておけば併合の際に混乱は生じないのだが,各試験で用いられるコードが単純な連番ではなくなるため,臨床担当者は整理の都合上好ましく思わないことがある.
このような場合には, Global Levelでのコードと試験ごとのProtocol Levelでのローカルコードを併用し,グローバルコードとローカルコードの間の関係を示すマッピングを行うことにより,手間は増えるが対応することは可能である.
関連記事