測定の真実!妥当性が物語る信頼の証【ChatGPT統計解析】
妥当性は、測定道具が本来測定しようとしている対象を実際に測定できているかどうかを示します。この特性は、テストや尺度の結果に意味を与える重要な要素であり、結果が役立つかどうかを決定します。テストの妥当性を確認するには、外的な証拠の存在が必要です。例えば、テスト項目が適切なサンプルを測定しているか、または既存の信頼性高いテストとの関連性があるかどうかを評価します。新しい測定道具の妥当性を検討する際、そのテスト結果が既に確立されたテストの結果とどれだけ関連しているかを調べることが一般的な方法です。これにより、新しいテストが有効かつ信頼できる測定手段であるかが判断されます。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
妥当性:実際に測定できているか
妥当性は、行動を測定するいかなるテスト、尺度、あるいは道具にとっても最も重要な、信頼性に続く2つめの心理測定上の特質です。
それは、その道具が測定しようとしているものを実際に測定できているかを示したものです。
そして、もしテストや測定道具に妥当性があるならば、それによって得られた結果は意味を持ちます。
妥当性がなければ、結果としての得点に意味を付与することはできません。
そして、結果は役に立たないものとなります。
もちろん、用いた道具に妥当性がなければ、実験の価値もまた疑問視されます。
テストの妥当性を確かめるには外的な証拠の存在が重要
基本的に、テストの妥当性を確かめようとするとき、外的な証拠の存在が重要です。
たとえば、テスト項目がテストで測定されるべきものからの標本であると判断されるなら、それはある種の妥当性の証拠です。
あるいは、もし信頼性と妥当性が確認されている尺度の得点と、開発中のテストの得点が有意に関連するならば、そのテストが望ましい機能を有していることのさらなる証拠となります。
しかしながら、妥当性の程度について単純に1つの数値を割りあてることはできないので、「低い」から「高い」の間でどの程度の妥当性があるのかを考えてみましょう。
たとえば、プロスポーツ施設建設のための公的基金の利用に対する意識調査において、調査機関は、可能な調査項目を検証し、調査で評価しようとしていることをそれらの項目が正しく反映しているかを判断するために、建築家、開発業者、スポーツファン、そして他の関連する聴衆、といった集団を用いるでしょう。
研究者のグループが、患者が評定した「片頭痛治療最適化質問票」の信頼性と妥当性を調査した例があります。
この研究者たちは、約300人の患者について、開発中のテストに答えてもらうのに加えて、片頭痛の存在に関連すると考えられている他の尺度やテストも受けてもらいました。
すなわち研究参加者は、すでに妥当性が検証され、実用化されている質問紙や尺度、たとえば、日々の生活の多面的な状況で片頭痛がQOLに及ぼす影響を測定する「頭痛影響テスト」などに答えました。
この目的は、すでに確立されている片頭痛の指標を使って、開発中の尺度の信頼性と妥当性がどの程度であるかを確認することでした。
これは、新しい測定道具の妥当性を検討するための、もっとも一般的な方法です。
つまり、新しいテストの結果が、すでに確立されている、妥当性が認められたテストの結果とどの程度関連するかを見るのです。
関連リンク