妥当性の全貌:測定の精度を高める5つの鍵【ChatGPT統計解析】
内容的妥当性は、測定道具が、考えうるすべての測定対象となっている項目について満遍なくカバーしているかどうかを確かめるために用いられます。基準関連妥当性は、開発中のテストが測る知識、スキル、能力が、その測定道具と関連する他の基準と相関しているかどうかを確認するために用いられます。併存的妥当性は、測定道具の現在の状態を評価するために用いられます。予測的妥当性は、測定道具の将来の価値を評価するために用いられます。構成概念妥当性は、測定道具が、幸福、攻撃性、希望、楽観性など潜在的な心理学的構成概念を反映しているかどうかを確認するために用いられます。これらの妥当性は、テストや測定がその目的に合致しているかを判断するために重要です。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
妥当性には5つの種類があり、それらはいずれも、さまざまな種類の測定道具について、測定するべきものを測定できているかどうか、その正しさを評価するために用いられます。
内容的妥当性
内容的妥当性は、測定道具が、考えうるすべての測定対象となっている項目について満遍なくカバーしているかどうかを確かめるために用いられます。
選ばれた項目が考えうる項目全体を反映しているかどうかを知りたいときに用いられます。
内容的妥当性は、たとえば到達度テストの評価のために用いることができます。
測定対象となる項目全体をテスト項目が反映しているかどうかを判断するために専門家に尋ねる、といった方法があります。
基準関連妥当性
基準関連妥当性は、開発中のテストが測る知識、スキル、能力が、その測定道具と関連する他の基準と相関しているかどうかを確認するために用いられます。
テスト得点が他の基準と系統的に関連しているかを知りたいときに用いられます。
具体的には、テストから得られた得点と何らかの他の測度(既に妥当性が担保されており、同じ能力のセットを評価している)との相関を求めます。
基準関連妥当性には、2つの種類があります。
併存的妥当性
併存的妥当性は、測定道具の現在の状態を評価するために用いられます。
たとえば、新しく開発された空間能力を測定するテストが、ブロックパズルを解く能力とどの程度相関するかを評価します。
予測的妥当性
予測的妥当性は、測定道具の将来の価値を評価するために用いられます。
たとえば、新しく開発された対人関係を測るテストが、将来の内科医の入院患者の扱い方をどの程度予測するかを評価します。
構成概念妥当性
構成概念妥当性は、測定道具が、幸福、攻撃性、希望、楽観性など潜在的な心理学的構成概念を反映しているかどうかを確認するために用いられます。
テストが何らかの潜在的な心理学的構成概念を測定しているかどうかを知りたいときに用いられます。
構成概念妥当性は、新しく開発されたテストの得点と、研究対象となっている構成概念を理論的に反映する他の課題のパフォーマンスとの関係を見ることで求められます。
言い換えれば、テスト得点とテストが意図している構成概念を反映する何らかの理論的根拠のある結果との相関を求めます。
ChatGPTに聞いてみた
プロンプト
あなたは最高のデータサイエンティストです。
内容的妥当性、基準関連妥当性、併存的妥当性、予測的妥当性、構成概念妥当性について解説してください。
#制約条件:
サルでもわかる平易な日本語で
文字数は500字程度
ChatGPTの回答
妥当性とは、私たちが作ったテストやアンケートが、本当に知りたいことをちゃんと測れているかのチェックリストです。これには5つの大事なポイントがあります。
内容的妥当性:
これは、テストが全ての大事なポイントをカバーしているかのチェックです。例えば、数学のテストを作るなら、足し算だけじゃなく、引き算や掛け算、割り算も入れないとね。全部の内容をバランスよく入れてるか見るわけです。
基準関連妥当性:
これは、作ったテストの点数が、他の信頼できるテストや基準とどれだけ同じような結果を出すかを見ます。同じことを測っているなら、似たような結果が出るはず、ってことです。
併存的妥当性:
これは、テストが今現在の状態を正確に測れているかどうかを見るものです。例えば、ピアノの上手さを測るテストを作ったら、今すぐにピアノが弾けるかどうかをちゃんと測れてるかを確認します。
予測的妥当性:
これは、テストが将来のことを予測できるかどうかをチェックします。例えば、大学入試のテストが、大学での成績を予測できるかどうか。これから起こることをちゃんと予言できるか見るわけです。
構成概念妥当性:
これはちょっと難しいけど、テストが、測りたいと思っている心理学的な特性や概念(例えば、幸福感や攻撃性など)をちゃんと測れているかを見ます。心の中のことをちゃんと表せてるか、ってことです。
要は、これらのチェックを全てクリアしていれば、テストが「信頼できる」と言えるわけです。サルでも分かるように言うと、テストがちゃんと「そのテストらしい仕事」をしているか、って話ですね。
関連リンク