項目反応理論で解き明かす!能力とテスト困難度の秘密【ChatGPT統計解析】

項目反応理論で解き明かす!能力とテスト困難度の秘密【ChatGPT統計解析】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

項目反応理論で解き明かす!能力とテスト困難度の秘密【ChatGPT統計解析】

項目反応理論で解き明かす!能力とテスト困難度の秘密【ChatGPT統計解析】
項目反応理論(IRT)は、テストの被験者の「能力」とテスト項目の「困難度」を同一の直線上に位置付ける方法を提供する。この理論において、項目特性曲線(ICC)は被験者の能力値に対する正答確率を表す関数であり、個々のテスト項目に対する能力値が困難度と等しい時、正答確率が50%になるとされる。この曲線は、テスト項目がどれだけの能力値を持つ被験者にとって適切か、またその項目の識別力はどの程度かを示す。項目反応理論は、テストのコンピューター化による適応型テストの開発に貢献し、被験者の能力をより精確に推定することを可能にする。この理論は、正誤パターンから能力値を統計的に推定する方法の基礎を提供し、個々の被験者に最も適したテスト項目の選択を可能にする。


目次  項目反応理論で解き明かす!能力とテスト困難度の秘密【ChatGPT統計解析】

 

正答確率50%の能力

 

A君はテストのある項目を解けなかった。これをA君が「能力」がなかったからと考えることもできるし、あるいは項目が難しかったからと考えることもできます。

 

あるいは、項目の「困難度」が「能力」を上回ったからと考えることもできます。

 

ある人(被験者)の能力値が、ある項目の困難度よりも高ければ高いほど、その被験者がその項目に正答する確率が高いと考えるのは自然なことです。

 

そして、被験者の能力値と項目の困難度が同じ値であれば、正答する確率はちょうど50%であると考えます。

 

逆に言えば、ある項目について、その項目に正答する確率がちょうど50%であるような能力値を、その項目の困難度とするのです。

 

「項目反応理論」とよばれる理論では、このように「能力」のものさしという一本の直線上に、個々の被験者の能力値と個々のテスト項目の困難度を位置づけます

 

項目特性曲線

 

項目反応理論で解き明かす!能力とテスト困難度の秘密【ChatGPT統計解析】

 

図の曲線は、3つの項目のそれぞれについて、縦軸の正答確率が、横軸の能力値によってどのように変化するかを示したものです。

 

このような曲線のことを「項目特性曲線」(item characteristic curve)といいます。

 

たとえば、項目1の場合、能力値が−1のところで正答確率がちょうど50%となるので、この項目の困難度は−1ということになります。

 

同様に、項目2、項目3の困難度はそれぞれ1および0となります。

 

項目困難度は通常bという記号で表現されます。

 

項目特性曲線は、直線上の位置によって、右側にあるほど困難度の高い難しい項目であることを示します。

 

また、曲線の傾き(勾配)にも重要な意味があります。

 

例えば、項目1と項目3で、正答確率50%あたりでの傾きを比べると、項目1のほうが急ですが、それは、能力値の差異が正答確率に反映される程度が項目1のほうが大きい(能力が上昇することが正答確率に影響する度合いが大きい)ことを意味しています。

 

傾きが急で、能力値の差異が正答確率に反映されやすいということは、項目に正答するか誤答するかによって能力の高低を識別することがより容易であるということです。

 

項目の識別力は通常αという記号で表現されます

 

図に示した3つの項目の識別力αの値は正答確率50%のところでの曲線の傾きそのものではないですが、それと比例する値です。

 

なお、ここでの−1、0、1などの数字そのものは相対的位置関係だけに意味があり、−1あるいは0だからといって、否定的内容を含むものではありません。

 

 

テストのコンピューター化と項目反応理論

 

コンピューターによって自動的にテスト項目が選択されて被験者に提示され、回答終了と同時に成績が算出されるようなコンピューター化されたテストが増加してきています。

 

なかにはペーパーテストでもできることを単にコンピューターに搭載しただけのテストもありますが、最新のものは、被験者の回答パターンからその都度、能力レベルを推定しながら、そのレベルに応じて、その被験者にとって難しすぎず、やさしすぎない最適の項目を選んで提示する、いわゆる「適応型テスト」(adaptive test)の機能を備えています。

 

被験者にとって難しすぎる項目はほぼ確実に誤答となり、やさしすぎる項目はほぼ確実に正答となるから、それらの項目を提示しても被験者の能力を推定するうえであまり有用な情報とはなりません。

 

その被験者が正答できるかどうか五分五分に近い項目を提示することが、その被験者の能力を推定するための方法を提供します。

 

項目反応理論における能力の推定

 

項目特性曲線は、能力値の関数として正答確率を表現するものです。

 

この関数を用いると、任意の項目セットに対して、任意の正誤パターンの回答を与える確率が、能力値の関数として計算できます。

 

例えば、ほとんどの項目に対して正答という回答パターンが得られる確率は、能力値が非常に高いときに高くなります。

 

そうした確率計算に基づいて、被験者の実際の正誤パターンから、能力値を統計学的な方法で推定する方法が開発されています。

 

ChatGPTに聞いてみた

プロンプト

あなたは最高のデータサイエンティストです。
項目反応理論について解説してください。
#制約条件:
サルでもわかる平易な日本語で
文字数は300字程度

ChatGPTの回答

項目反応理論(IRT)は、テストやアンケートの質問が、人の能力や性質をどう測るかを説明する理論です。例えば、数学のテストがあったとしましょう。このテストには簡単な問題もあれば難しい問題もあります。IRTは、それぞれの問題に答えられる人の能力のレベルを見ることで、その人の数学の理解度を測ります。この理論のスゴイところは、問題の難しさ、人がその問題に正解する確率、そしてその問題がどれだけ能力を正確に測れるかを数学的に分析する点です。これにより、テストの各質問が、さまざまな能力レベルの人たちにどのように影響するかを理解できます。要するに、IRTはテスト作成者が、テストが公平で正確に各人の能力を測定しているかを確認するのに役立ちます。これにより、一人一人にピッタリ合ったテストを作ることができるようになります。

 

 

項目反応理論で解き明かす!能力とテスト困難度の秘密【ChatGPT統計解析】


セミナー詳細                    解析ご相談                    LINEでお友達

項目反応理論で解き明かす!能力とテスト困難度の秘密【ChatGPT統計解析】

項目反応理論で解き明かす!能力とテスト困難度の秘密【ChatGPT統計解析】