臨床試験の有効率: 正しい評価法を探る【ChatGPT統計解析】
「有効率(efficacy rate)」とは、臨床試験における治療効果の評価に使用される指標であり、特定の治療法がどれだけ有効であったかを示します。例えば、100人の患者に治療を施し、そのうち50人が有効と判断された場合、有効率は50%となります。ただし、統計学的には「率」は時間の要素を含むため、正確には「割合」というべきですが、医療分野では「有効率」という表現が一般的です。臨床試験で有効率を算出する際には、判定不能例の扱いが問題となり、すべての症例を解析対象とするITT基準やプロトコルに従った症例のみを対象とするPPS基準などが使用されます。ランダム割り付けによる試験では、ITT基準が一般的であり、これにより群間の背景の偏りを防ぎます。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
統計学における有効率(efficacy rate)
ある治療法を1群の患者に適用して、その後の治療効果を見るような研究のことを「臨床試験」という。
ここで、治療効果と簡単に言うが、一般によく使われるのが「有効率」という用語である。
たとえば、100人の患者にその治療法を適用して、そのうち有効と判定された患者が50人だったとしよう。
このとき、有効率は50%という言い方をする。
統計学的に厳密に言うと、率(rate)というのは時間的要素を含んだ言葉である。
たとえば、自動車を運転するときに時速という言葉をよく耳にするだろう。
時速60キロとは、1時間に60km走るだけの速さのことである。
これでスピード感がわかると思う。
したがって、これは率(rate)ではなく割合(proportion)というべきであろう。
割合というのは、分子が分母の一部であるときに使う言葉である。
八頭身と言うが、これは身長の8分の1が頭であり、頭でっかちではないスマートな人に使う。
余談になるが、バレエのプリマになると十頭身を求められるそうである。
ここに示した場合も、有効であった50人は100人の一部分であるから、これは割合になる。
「有効率」ではなく「有効割合」と呼ぶほうが正しいが、医療の世界では慣習的には有効率を呼ぶほうが多い。
また、英語でもefficacy rateと呼ぶように、割合でなく率という用語を使っているようである。
臨床試験で有効率を求めるには
どう呼ぶかよりは、むしろ計算の仕方が重要である。
たとえば、ある治療法を適用したが途中で副作用が出てしまい、4週間投与のところが2週でやめざるをえないケースが生じたとする。
このような症例が多数出たときに、有効率はどのようにして算出すればよいだろうか。
ここで、100例に治療法を適用し、そのうち4週を完了できた症例が92例であったとしよう。
この完了例92人中、有効と判定された症例が50例、無効と判定された症例が42例だったとしよう。
4週を完了できなかった8例は、「判定不能」ということになる。
このとき、有効率はどのように算出するのが適当であろうか。
ある人は、何しろ最初は100例いたわけで、そのうち50例は有効であったので、50÷100=0.5(50%)と算出すると言うだろう。
ここでは判定不能例は無視されている。
ところが、ある人は、判定不能というのはどちらでもないので、それは分母から外すべきだど言い張るだろう。
そこで、有効率は50÷92 = 0.54 (54 %)と主張する。
このいずれが正しいだろうか。
4週を完了できなかった8例では有効性を見ることはできないと考えれば、後者のほうが正しいかもしれない。
しかし、有効になるかどうかを考える前に、副作用で脱落するような症例はもともと無効と考えたほうが妥当だとすれば、前者のほうが正しいかもしれない。
このように判定不能が生じたときには有効率の計算が難しい。
そこで、通常の臨床試験では解析に入る前に、分母に含めるか否かを判定するような症例判定委員会を行うのである。
それでも、その採否いかんで有効率が高くなったり低くなったりするので、下手をすると恣意が入りがちである。
そのような危惧があるので、現在では登録された症例はすべて解析対象にする、という基準を使うことが多い。
このことをITT (Intention To Treat)基準と言っている。
つまり、分母は100例とするのである。
それもよいけど、それでは判定不能の8例は有効とするのか、それとも無効とするのかが問題になる。
この判定法にもいくつかルールがある。
たとえば、前の時点で評価されたものを使うというルールがある。
この場合でいうと、4週時点の評価がなくても2週時点の評価があれば、それを用いるのである。
あるいは、途中で中止あるいは脱落というのであれば、悪いほう、つまり無効として評価するというルールもある。
それでは、全く評価がなされていなければどうするか。
この場合でも無効とするのがー案であるが、それはひどすぎると言う人もいるだろう。
そこで、あまりにも臨床試験になっていないような症例(たとえば、このように1回も評価がなされていないとか、1回も試験薬を飲まなかった症例)は除外したほうがよいという方策も登場してきた。
それが通常FAS (Full Analysis Set)と呼ばれる解析対象集団である。
完了例を分母にとってもよし
つけ加えておくと、PPS(Per Protocol Set)という解析対象集団がある。
これは、プロトコル(計画書)どおりに実施された症例に限定して解析するというルールである。
これを採用するなら、先ほどの例では分母を92例にして有効率を求めることになる。
つまり、50÷92 = 0.54(54%)の有効率となるわけである。
このPPSが科学的には最もよさそうに思えるのだが、臨床試験ではそれよりもITTが優位にある。
その理由は何だろうか。
やや専門的になるが、臨床試験ではランダム割り付けされることが多い。
ランダムに割り付けるということで、比較する群の背景は自然に似るようになるのである。
それにもかかわらず、後で症例を除外すると背景に偏りが生じるかもしれない。
これを防ぐためにITTを用いているのである。
逆にいうと、ランダム割り付けを伴った臨床試験でITTとしていない研究は、注意して読む必要があると言えよう。
関連リンク