項目反応理論:被験者の能力とテスト項目の困難度|項目特性曲線【統計学・統計解析講義基礎】
項目反応理論では、「能力」のものさしという一本の直線上に、個々の被験者の能力値と個々のテスト項目の困難度を位置づける。項目特性曲線は能力値の関数として正答確率を表現
目次 項目反応理論:被験者の能力とテスト項目の困難度|項目特性曲線【統計学・統計解析講義基礎】
正答確率50%の能力
A君はテストのある項目を解けなかった。これをA君が「能力」がなかったからと考えることもできるし、あるいは項目が難しかったからと考えることもできます。
あるいは、項目の「困難度」が「能力」を上回ったからと考えることもできます。
ある人(被験者)の能力値が、ある項目の困難度よりも高ければ高いほど、その被験者がその項目に正答する確率が高いと考えるのは自然なことです。
そして、被験者の能力値と項目の困難度が同じ値であれば、正答する確率はちょうど50%であると考えます。
逆に言えば、ある項目について、その項目に正答する確率がちょうど50%であるような能力値を、その項目の困難度とするのです。
「項目反応理論」とよばれる理論では、このように「能力」のものさしという一本の直線上に、個々の被験者の能力値と個々のテスト項目の困難度を位置づけます。
項目特性曲線
図の曲線は、3つの項目のそれぞれについて、縦軸の正答確率が、横軸の能力値によってどのように変化するかを示したものです。
このような曲線のことを「項目特性曲線」(item characteristic curve)といいます。
たとえば、項目1の場合、能力値が−1のところで正答確率がちょうど50%となるので、この項目の困難度は−1ということになります。
同様に、項目2、項目3の困難度はそれぞれ1および0となります。
項目困難度は通常bという記号で表現されます。
項目特性曲線は、直線上の位置によって、右側にあるほど困難度の高い難しい項目であることを示します。
また、曲線の傾き(勾配)にも重要な意味があります。
例えば、項目1と項目3で、正答確率50%あたりでの傾きを比べると、項目1のほうが急ですが、それは、能力値の差異が正答確率に反映される程度が項目1のほうが大きい(能力が上昇することが正答確率に影響する度合いが大きい)ことを意味しています。
傾きが急で、能力値の差異が正答確率に反映されやすいということは、項目に正答するか誤答するかによって能力の高低を識別することがより容易であるということです。
項目の識別力は通常αという記号で表現されます。
図に示した3つの項目の識別力αの値は正答確率50%のところでの曲線の傾きそのものではないですが、それと比例する値です。
なお、ここでの−1、0、1などの数字そのものは相対的位置関係だけに意味があり、−1あるいは0だからといって、否定的内容を含むものではありません。
テストのコンピューター化と項目反応理論
コンピューターによって自動的にテスト項目が選択されて被験者に提示され、回答終了と同時に成績が算出されるようなコンピューター化されたテストが増加してきています。
なかにはペーパーテストでもできることを単にコンピューターに搭載しただけのテストもありますが、最新のものは、被験者の回答パターンからその都度、能力レベルを推定しながら、そのレベルに応じて、その被験者にとって難しすぎず、やさしすぎない最適の項目を選んで提示する、いわゆる「適応型テスト」(adaptive test)の機能を備えています。
被験者にとって難しすぎる項目はほぼ確実に誤答となり、やさしすぎる項目はほぼ確実に正答となるから、それらの項目を提示しても被験者の能力を推定するうえであまり有用な情報とはなりません。
その被験者が正答できるかどうか五分五分に近い項目を提示することが、その被験者の能力を推定するための方法を提供します。
項目反応理論における能力の推定
項目特性曲線は、能力値の関数として正答確率を表現するものです。
この関数を用いると、任意の項目セットに対して、任意の正誤パターンの回答を与える確率が、能力値の関数として計算できます。
例えば、ほとんどの項目に対して正答という回答パターンが得られる確率は、能力値が非常に高いときに高くなります。
そうした確率計算に基づいて、被験者の実際の正誤パターンから、能力値を統計学的な方法で推定する方法が開発されています。