統計学で学ぶ4つの信頼性評価法の鍵【ChatGPT統計解析】
統計学における信頼性評価は、四つの主要な方法を用いて行われます。再検査信頼性は、異なる時間に実施されたテストの一貫性を測定します。平行検査信頼性は、異なる版のテストを用いた際の安定性を評価します。内的整合性は、テストが一貫して同じ構成概念を測定しているかを確認します。評定者間信頼性は、異なる評定者が同じ尺度による評定においてどれだけ一致するかを示します。これらの方法は、テストや尺度の一貫性と信頼性を数値的に評価するため、相関係数を計算することが多いです。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
4つの種類の信頼性があります。
それぞれ特定の目的を持っており、多くの場合、信頼性の数値的な指標を得るため、相関係数が用いられます。
再検査信頼性
ある期間にわたっての安定性や一貫性があるかを評価します。
2つの異なる機会に実施されたテストが、一定のレベルの信頼性を確立していることが望ましいといえます。
計算方法としては、時点1の得点と時点2の得点間の相関係数を計算します。
たとえば、成熟のアセスメントが、高校1年生の秋と春に実施され、これらの得点の相関から、成熟尺度の再検査信頼性を計算します。
平行検査信頼性
テストが2つの異なる版で実施された際の、テストの安定性や一貫性を評価します。
同じ測定道具について2つの形態があるとき、一定のレベルの信頼性を確立していることが望ましいといえます。
計算方法としては、版1と版2の得点間の相関係数を計算します。
運転手としてのレディネスのテストが2つの異なる版で、同じ時点で、100人の高校生を対象に実施されます。
テストの信頼性の保証のために平行検査信頼性係数が計算されます。
内的整合性
テストが一貫して同じ次元や構成概念を査定しているかどうかを評価します。
テストが1つのことを測定していて、それだけを測定しているかに関心があるとき、一定のレベルの信頼性を確立していることが望ましいといえます。
テストは1次元であること、そしてただ1つの次元だけを評価していることを立証するのが目的です。
計算方法としては、テストにおける各項目への反応とテストの総合点との相関係数を計算します。
たとえば、愛着概念を検討するために、あるテストを開発しているとします。
内的整合性は、そのテストが愛着を測定しており、他には何も測定していないことを保証するために計算されます。
評定者間信頼性
評定尺度が評定者を超えて一貫しているかを評価します。
2人以上の評定者がこの尺度での評定を終えたときの、評定の一致度を計算することによって評価されます。
2人以上の評定者の信頼性を立証するのが目的です。
計算方法としては、同じ現象を観察した異なる評定者間の一致度を評価します。
たとえば、ある研究者が攻撃性の尺度を開発し、その尺度の信頼性を保証したいと思ったとします。
2人の評定者が、子どもたちの攻撃的と見なされる行動に関して評定しました。
評定者間信頼性は、評定者の評定の一致のパーセンテージであり、どの程度それらが一致するかを見るものです。