操作化と代用測定|【統計学・統計解析講義基礎】
操作化と代用測定
操作化
研究が大変な原因は主に統計分析にあると、その研究分野でスタートを切ったばかりの人々はよく考える。
そのため、統計計算を行うための数式とコンピュータ・プログラミング技術を覚えることに努力を傾けてしまう。
しかし、研究での大きな問題は数学や統計には全くと言っていいほど関係がなく、むしろ自分の研究分野を知ることと測定上の実質的な問題を熟考することにすべて関係している。
これは操作化(operationalization)の問題である。
操作化とは、どう概念が定義され、測定されるかを特定するプロセスを指す。
対象とする値が直接測定できないとき、操作化は常に必要である。
わかりやすい例が、知能である。
直接知能を測る方法がないため、そのような直接的測定の代わりに、測ることができるもの(IQ値など)を採用する。
同様に、都市の「災害対策」度を測る直接の方法はない。
しかし、やるべき作業のチェックリストを作成して、各都市に完了した作業の数と質や徹底ぶりに基づく災難対策得点を与えることによって、この概念を操作化できる。
もうひとつの例として、個人の身体活動量を測定したいと想定しよう。
運動を直接チェックする機能がなければ、自己申告のアンケートか、日記風の記録として、「身体活動量」を操作化できる。
社会科学では、研究される性質の多くが抽象的なので、操作化はよく議論されるトピックである。
しかし、操作化は他の多くの分野でも同様に適用できる。
例えば、医療関係者の最終的な目的には死亡数を減らし、病気の負担と苦しみを緩和することにある。
ありがたいことに死亡数は多くの病気の稀な結果であるため、簡単に確かめられ定量化されるが、あまりに変化が少ないため役に立たないことが少なくない。
一方、「病気の負担」と「苦しみ」は多くの研究の適切な結果を特定するのに用いることができる概念だが、測定する直接の手段がないがために、操作化されなければならない。
病気の負担の操作化の例には、エイズ患者の血液中に含まれるウイルスレベルの測定や癌患者のための腫瘍の大きさの測定がある。
苦しみの緩和、すなわちQOL (quality of Ufe : 生活の質)の改善度は、自己申告されたより高い健康状態、QOL測定用に設計された調査のより高い点数、患者個人へのインタビューで得られた気分のよさ、鎮痛に必要とされるモルヒネ処方量の減少などで操作化される。
長さといった具体的な特性でも測るのに異なる方法があるので、物理量の測定にも操作化は必要であると主張する人もいる(定規がふさわしい道具である状況もあれば、マイクロメーターがふさわしい状況もある)。
関心の対象または性質を直接測ることができない分、操作化の問題が人文科学の分野でより大きな問題なのは明白であると言えよう。
代用測定
代用測定(proxy measurement)とは、ある測定法の代替として行う測定法のことを指す。
代用測定は操作化の派生だと考えることもできる。
代用測定では、安くて簡単に手に入る測定法を、難しく高価な測定法の代わりに用いることがもっとも一般的である。
例えば、他の人(子供の様子を評価するならその親など)に尋ねて、ある人物の情報を集めることなどである。
代用測定のわかりやすい例として、その場で、人が飲酒していないか確かめるために、警官が使う手法をいくつか思い起こしてほしい。
移動できる医学研究室などない状態で、酒量が法の範囲内かどうか判断するのに、運転手の血中アルコール量を直接測ることができる方法は警官にはない。
その代わりに、酩酊度に関わる兆候、血中アルコール量と相関すると考えられる簡単な実地検査、呼気アルコール検査、またはこれらのすべてに警官は頼る。
酔っていることを確認できる兆候には、息がアルコール臭く、呂律が回らない、赤くなることなどがある。
一般に酔っていることの確認に用いられる尖地検査では、被験者は片足で立つ、動くものを目で追うといった動作をすることが求められる。
酒気検査は、呼気中のアルコール量を測定する。
これらの評価方法のどれも血中アルコール量を直接測らないが、現場で行える速くて簡単な理にかなった近似値を得る検査法であると認められる。
代用測定は、また別の目的でも使われる。
病院と医者が行う治療の質を評価するために米国で使われているさまざまな方法を考えてみよう。
おそらく、治療法を直接観測する方法の不備や容認されている基準の関係で、治療の質を測る直接的な方法を思いつくのは難しい(そのような評価過程に関係する測定法も「治療の質」という抽象的な概念の操作化であるとも言えるが)。
そういった評価法を実際に開発利用することは、法外に商価で、評価者として大人数のチームを訓練し、彼らが同じ評価基準を持つことを当てにし、忠者のプライバシーの権利を侵害することになりかねないだろう。
その代わりに一般的に、より高い治療の質を示すとされる作業を測定して解決するのだ。
例えば診察室に訪れて、禁煙カウンセリングが適切に施されたかどうかや、患者に応じて適切な薬がすぐに投与されたかどうかを観測する。
その指標を得ることが比較的簡単であることに加えて、それが関心の真の対象のよい指標であるならば、代用測定は最も役に立つ。
例えば、もしある特定の治療のプロセスを正しく行うことが患者の症状へのよい結果と強い関連性があり、そのプロセスを行わないことや手順を誤ることが患者の症状へのよくない結果と強い関係があるならば、そのプロセス実行は治療の質の代理指標として役立つ。
これらの密接な関係がなければ、代用測定の有用性は確かではなくなる。
数理検定を用いても、ある測定法が他の測定法のよい代用となるかどうかはわからない。
しかし、コンピュータを使って行われる測定間の相関、カイニ乗のような統計量はこの問題を見極めるのに役立つことがある。
さらに、代用測定にはそれ自体の問題もある。
先ほどの治療に対するプロセスの例では、この方法では、個別のケースや治療を構成する要素やどんな方法が行われたか特定するのに必要な記録を利用可能であるかなどの知識がなくても、決定可能であることが前提になっている。
測定に関する他の多くの問題と同様に、よい代用測定を選ぶには、その分野での一般的なやり方についての知識と常識による判断に頼るしかない。
代替エンドポイント
代替エンドポイントは、治療の真の最終目標(エンドポイント)の代わりとして臨床試験で使われる一種の代用測定である。
例えば、治療の真のエンドポイントが、治療によって命を救うことだとしよう。
しかし、治療を受けている状態で死亡することは稀であろうから、治療の効果がある証拠を素早く出すものが代替エンドポイントに用いられる。
通常、治療の真のエンドポイントと相関している生理指標が代理目標となる。
例えば、薬が前立腺癌による死亡を防ぐことを目的とすれば、代替エンドポイントは、腫瘤の縮小または前立腺特異抗原の濃度の低下である。
代替エンドポイントを使うことには問題点もある。
治療がこれらについて改善効果を示す場合があるが、それが実際の治療結果をもたらすことと必ずしも一致するわけではないということだ。
例えば、ステファン・ミシェルズ(Stefan Michiels)らによる高度な分析で次のことがわかった。
頭と首に局所的にできた扁平上皮癌では、その部分だけを制御する方法(代替エンドポイント)と全生存率(治療の本当のエンドポイント)間の相関は0.65-0.76(双方の結果が全く同じならば、相関は1.00となる)であり、一方、無再発生存率(代替エンドポイント)と全生存率(治療の本当のエンドポイント)間の相関は0.82-0.90だった。
代替エンドポイントには、臨床試験の亊実に付け加えたり、試験前に決めた成果の代用に使われたり、あるいはその両方が行われるといった不正使用の問題もある。
代替エンドポイントは簡単に達成できるので(例えば、真のエンドポイントが生存率の改善で、代替エンドポイントが抗癌剤試行での無憎悪生存率改善である場合)、真のエンドポイントにはほとんど影響を及ぼさないどころか悪影響がない程度でも、代替エンドポイントの効果に基づいて新薬が承認されてしまうことになる。
関連リンク