妥当性の統計学【統計解析講義基礎】

妥当性の統計学【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

セミナー詳細                    解析ご相談                    LINEでお友達

妥当性の統計学|【統計学・統計解析講義基礎】

妥当性の統計学【統計解析講義基礎】


目次  妥当性の統計学【統計解析講義基礎】

 

 

妥当性の統計学

 

信頼性(reliability)と妥当性(validity)

 

信頼性(reliability)と妥当性(validity)は、実際には、絶対の要件ではなく、程度の問題であり状況によって左右される。

 

例えば、ある人ログループではとても信頼性の高い調査方法が、他のグループでは信頼性が低いことがある。

 

そのため、絶対の要件として信頼性と妥当性を考えるよりも、ある測定方法が、「その目的ではどれくらい妥当性と信頼性が高いか」や「その状況ではどのレベルの信頼性や妥当性が求められるのか」を考える方が、たいていの場合有効である。

 

妥当性

 

妥当性は、どれだけテストや順位尺度が測定しようとしているものを正確に測定できているかを表す。

 

一部の研究者は妥当性確認を測定から引き出される推論を支持する証拠収集の過程として考えている。

 

研究者間でも、何種類の妥当性が存在するかについて意見が分かれ、学術的合意も時とともに変化していて、さまざまなタイプの妥当性が、ある名称のもとで現れ、次の年には分割されて別の異なるものとして扱われたりしている。

 

話を単純にするために、ここでは一般的に受け入れられている妥当性の分類に留める。

 

つまり内容妥当性、構成概念妥当性、併存的妥当性、予測的妥当性の4種類である。

 

また内容妥当性に近い表面的妥当性も扱う。

 

内容妥当性(content validity)は、より広い分野についての推論が測定目的であるときに重要となる。

 

測定方法がどれだけその分野の重要な内容を反映しているかを表す。例えば、コンピュータプログラマの求職者は、採用後に使用する言語でプログラムを書いたり解釈したりする試験を受けることがある。

 

時間制限により、実際にプログラミング作業に必要とされるものに比べて、限られたコンテンツとプログラミング能力しか審査対象としていない。

 

 

しかし、内容と能力の部分集合をうまく選択した場合、その得点が、職務に要求されるすべての重要なプログラミング能力をよく表している可能性がある。

 

この場合、この試験は内容妥当性があると言える。

 

内容妥当性に密接に関連した概念として、表面的妥当性(face validity)が知られている。

 

優れた表面的妥当性を持つ尺度は、(一般大衆や、これによって評価される典型的な人に)公正な評価と見られている。

 

例えば、高校の幾何のテストを受けた生徒の保護者にそれが代数の公正なテストであると判断された場合、そのテストは表面的妥当性があると言える。

 

表面的妥当性は信頼を確立するのに重要である。

 

生徒の幾何学の達成度を測定したと主張しても生徒の両親が同意しない場合は、両親は子供のこの科目の達成度に関する見解を無視する場合もあるだろう。

 

加えて、両親にとって完全に他のモノに見える幾何のテストを生徒達が受ける場合、両親は協力し最善を尽くす動機が湧かないかもしれない。そのため、彼らの解答が彼らの達成度を本当に反映するものにはならない場合もある。

 

併存的妥当性(concurrent validity)は、測定結果から同じ時期の他の振る舞いやパフォーマンスをどれはどうまく推論できているかを表す。

 

例えば、ある達成度テストの得点がそのときの学内でのパフォーマンスや似たテストでの得点に強く関連している場合、それは併存的妥当性があると言える。

 

予測的妥当性(predictive validity)は、これと似ているが、将来のある事象について推論する能力に関連する。

 

ある達成度テストの得点がその後の学内でのパフォーマンスや将来の就職の成功に強く関連しているとすると、それは予測的妥当性があると言える。

 

 

妥当性の統計学【統計解析講義基礎】


セミナー詳細                    解析ご相談                    LINEでお友達

妥当性の統計学【統計解析講義基礎】

妥当性の統計学【統計解析講義基礎】