相対評価 vs 絶対評価:TOEICに学ぶ効果的な活用法【ChatGPT統計解析】
相対評価は、集団内での他者との比較に基づいて個人の成績を評価する方法であり、得点分布に基づいて偏差値やパーセンタイル順位などが用いられる。しかし、基準集団に依存するため、評価が客観的でない場合や学習の進歩が反映されにくいという批判がある。この問題を解決するために提唱されたのが絶対評価であり、具体的な教育目標の達成度に基づいて評価する方法である。絶対評価は個々の生徒の進歩を評価しやすいが、基準設定が難しい場合もあり、相対評価と併用することが望ましい。TOEICのように、絶対評価と相対評価の双方を組み合わせた例もある。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
相対評価と絶対評価(norm-referenced and criterion-referenced evaluation)の統計学
相対評価への批判と絶対評価
相対評価というのは、同じ学校の同学年の生徒全体などの集団を基準にし、その基準集団での得点分布に照らして個々の生徒の得点を解釈・評価する方法である。
具体的には、基準集団での平均が50になるように得点換算した「偏差値」や、正規分布とよばれる理論的な分布を想定して、1〜5の5段階にそれぞれ7%、24%、38%、24%、7%の生徒を割り振る「5段階相対評価」、あるいは基準集団の中で得点の低いほうから何%に当たるかという「パーセンタイル順位」などによって表現される。
相対評価は、どの集団を基準とするかによって評価が大きく異なる可能性があり、基準集団がどのようなレベルの集団であるかを知らなくては、評価結果が意味をもたない。
相対評価は、他との比較による相対的な評価であるだけでなく、評価結果が基準集団の選択に依存するという意味でも、相対的な評価なのである。
相対評価の教育的な機能については、それぞれの生徒にどのような指導をすればよいか具体的指針が得られないことが批判されてきた。
さらに、学習によって知識が増え理解が深まっても、集団内での相対的位置(順位)が変化しなければ、そうした進歩が評価に反映されないため、学習への動機付けの面でも問題があること、そして学習自体よりも競争に目を向けさせる評価法であるとの批判もされてきた。
相対評価のこうした問題点の解決を目指して提唱されてきたのが絶対評価である。
絶対評価とは
絶対評価は、簡単に言えば、「この点数なら何ができて何ができないか」を記述し、伝える評価である。
たとえば、小学校算数で「掛け算の意味がわかり、計算ができること」という教育目標があるとき、何点以上であればその目標を達成したとみなすかという基準(達成基準、到達基準、または分割点という)を設定し、それに基づいて「達成」「未達成」の判断を行う評価法である。
こうした評価法は「到達度評価」、あるいは「目標準拠評価」ともよばれる。
これなら任意に選ばれた基準集団に依存することなく、指導のための具休的指針も与え、また各生徒の進歩を適切に評価することも可能になるというのである。
さて、絶対評価が有効に機能するためには、何点以上であれば「達成」とみなすかという基準作りの作業が重要になってくる。
もし、詳細な観察などを通して「達成」か「未達成」かが明らかになっている生徒のサンプルが利用できるのであれば、そのサンプルにテストを実施してみることによって、下のような表を作成することができる。
このとき、分割点を何点とするかによって、表中の正しい判断の比率や2種類の誤った判断の比率が変化することになる。
そこで、2種類の誤った判断の重大さを勘案しながら最適と思われる分割点を決めることができる。
しかし、教育目標にはさまざまなものがあり、たとえば「詩の鑑賞能力を高める」、「歴史を学ぶことの大切さを知る」といった抽象的な目標について、上記の方法を適用するために真の達成者・未達成者を選ぶのは困難である。
また、掛け算の計算の例のような、比較的具体的で理解しやすい教育目標であっても、基準設定は必ずしも容易ではなく、現実には主観的、恣意的に基準が決められているケースも少なくない。
このように絶対評価も、その言葉が与える印象ほどには絶対的なものではない。
一方、これまで批判されることの多かった相対評価は、生徒自身が現実的な自己認識をするためにも有用であり、ことに進路指導においては必要である。
目的に応じて柔軟に、両者の利点を生かした評価を行うことが望まれる。
絶対評価の例:TOEIC
絶対評価の実際の例として、英語によるコミュニケーション能力を評価する代表的なテストであるTOEICの得点評価があげられる。
TOEICでは、相対評価の結果に加え、得点範囲を5つのレベルに分割して、各レベルが、現実のコミュニケーション場面でのどの程度の能力に相当するかという情報を与えている。
たとえば、220点〜470点の範囲のレベルDの者は「ゆっくり話してもらうか、繰り返しや言い換えをしてもらえば、簡単な会話は理解できる。身近な話題であれば応答も可能である。
語彙・文法・構文ともに不十分なところは多いが、相手が非ネイティブ(Non-Native)に特別な配慮をしてくれる場合には、意思疎通をはかることができるという具合である。
もちろん、こうした記述が可能になるためには、幅広いサンプルに対してテストを実施するとともに、そのサンプルの人達の現実場面でのコミュニケーション能力を別途調べ、その両者の対応関係を検討することが必要である。
関連リンク