2015/05/14
[第4回] 大学入学者選抜における能力測定の臨界点と複数回受験の効用 [2/4]
II. 多元的な評価尺度による総合的な評価はどこまで可能か?大学入学者選抜における能力測定の臨界点
図1をご覧頂きたい。今後の大学入学者選抜のあり方について尋ねた、この調査結果(「高大接続に関する調査」)から読み取れることは、全体の約8割程度の賛同(「とてもそう思う」+「まあそう思う」)が得られているという項目だけ抜き出してみると、賛同割合の高い順から、「高校は大学進学実績以外の領域でもっと評価された方がよい」(高校:91.0%)、「入学者選抜の方法はこれ以上多様化しないほうがよい」(大学:89.8%、高校:87.1%)、「教科学力を中心に評価するのがよい」(大学:80.3%、高校:79.6%)、「大学入試は高校の学習指導要領に準拠した範囲にとどめたほうがよい」(高校:79.4%)であり、何か、受験指導の体制はそのままに、但し、大学進学実績は高校側の評価には使ってほしくない、という意見が透けて見える。一方、 その他、中央教育審議会答申で謳われている項目については、高くても半分の5割程度かそれ以下の賛同しか得られていないことも見てとれる。新しい改革案に対して、概ね、高校側からも大学側からも反応は鈍いといっても差し支えない。
図1 今後の入試のあり方について(高校・大学)
出典:ベネッセ教育総合研究所「「高大接続に関する調査」」(2013年)
また、高校側と大学側の反応が分かれた項目に着目すれば、「高校での課外活動や社会活動等の状況を評価の材料にするのがよい」(高校:51.9%、大学:43.3%)、「高校での教科の学習履歴を評価の材料にするのがよい」(高校:51.2%、大学:38.6%)が挙げられる。少なくとも、国立大学で2000(平成12)年度からAO入試が開始されてからそろそろ20年近く経とうとしているが、AO入試が始まって以来、「高校での課外活動や社会活動等の状況」や「高校での教科の学習履歴」をどう評価すべきか、という問題に大学は苛まされてきた。そして、いま現在、「これ」というべき解決策を見いだせないでいるのが現状である。高校側から高校時代の生徒の諸活動を評価して欲しいという気持ちはよくよく理解できるが、評価のしようがない、というのが大学側の本音ではないだろうか。もちろん、えいやと何か取り決めを設けて、何らかの数値化を施し、評価する気になることはいつでも可能ではある。だが、大学人は日々その程度の評価で入学者選抜をしても良いのか、そうした評価における精度の粗さ・曖昧さと、生徒が直面するハイステイクスな選抜の状況との狭間で悩まされ続けているのが実状だ。また、20年近く、解決策が見出せなかったものが、明日すぐ見つかるものである、という楽観論にも立ちにくいのではないだろうか。
この点に関して、今回の大学入学者選抜改革を相対化する視点を紹介したい。「入試制度改革は同じパターン(対立軸)で繰り返される」。この見解は、古く1971(昭和46)年の中央教育審議会答申『今後における学校教育の総合的な拡充整備のための基本的施策について』(通称:「46答申」{1971[昭和46]年6月11日付答申})の中間報告である『わが国の教育発展の分析評価と今後の検討課題』(1969(昭和44)年6 月30日)に登場する(中央教育審議会1969:171)。下記の箇条書きには、導入(実施)と廃止が織り成された入学者選抜制度改革が5つ並んでいる。調査書選抜か筆記試験選抜か、客観式テストか記述式テストか、人物重視か学力重視か、という対立軸、或いは、適性検査・口頭試問・面接を導入するか否か、また或いは、総合選抜制の導入など選抜方法以外のシステム変更などである。
- ①受験準備教育の弊害を排除するための学力検査の廃止および調査書の重視([中等教育]昭和2年、15年、23年、42年)と②客観性、公平性の確保という要請からの学力検査の重視([昭和4年、18年、31年])
- ①採点の客観的な公平を確保するための客観テストの導入([中等教育]昭和23年)と②客観テストが思考力、創造力の育成に適当でないという観点からの記述テストの強調(昭和29年)
- ①将来の学習能力を予測するための適性検査の実施([高等教育]昭和25年)と②適性検査についても受験準備が行われ、また、受験者や試験実施者の負担が過重であるなどの理由による廃止(昭和30年)
- ①学力検査では判らない「人物」を評価し、受験準備教育の弊害を排除するための口頭試問や面接の実施([中等教育]昭和2年、38年、[高等教育]昭和2年、25年)と②客観性、公平性の確保という観点からのその廃止([中等教育]昭和23年、[高等教育]昭和22年)
- ①受験競争の激化を避けるための学区制や総合選抜制の実施([中等教育]昭和17年、[高等教育]明治35年、大正6年)と②個人の学校選択希望の尊重のためのその廃止([高等教育]明治41年、大正8年)
なぜ、「入学者選抜制度改革は同じパターン(対立軸)で繰り返される」のか?こうした疑問を解き明かすのに、測定道具としての「テスト」の重要な性質は見逃せない。結論を先取りすれば、実は、「テストの類型は、そんなに多くない」。また、成績指標として用いられるのも、学力試験(外部試験も含む)、調査書成績、適性検査など限りが有る。それが故に、取りうる改革の手段(組み合わせ)は限られている。その限られた手段の中から選択することで入試改革が行われているし、そもそも、入試として実現可能な選択パターンはそう多くない。そこで選択しうる、同じようなパターン(対立軸)の入試改革が繰り返されるのである。つまり、「多元的な評価尺度による総合的な評価」は、テストの類型のパターンの「範囲内」で行なうしかやりようがない、というのが、テストの性質を知り尽くした「テストの専門家」としての答えである。そのパターンは決して数多くないし、もっと言えば、これまでの歴史の中で、いくつものパターンが繰り返し試されてきている。その失敗(の歴史)を活かさなければ、今後の良い大学入学者選抜制度の設計は覚束なくなるであろう。
もう少し詳細に説明してみよう。池田(1973)では、教育測定における(心理)テストの類型をまとめている。ここから心理測定的な要素を省き、大学入学者選抜に即した測定道具としての「テスト」の類型を筆者が分類しなおしたのが表1である。
表1 大学入学者選抜場面における測定道具の分類
この表1から考えると、大学入学者選抜場面における測定方法は、3×2×3×2×2=72パターンしかないことが分かる。つまり、大学入学者選抜の場面において、測定道具の組み合わせは「有限」である。大学入学者選抜はこの「有限の組み合わせ」の範囲内で「しか」行われていないことはもっと理解されてしかるべきであろう。つまり、限定された測定方法の組み合わせによる「場合の数」しか、大学入学者選抜改革は存在しないのだ。大学入学者選抜制度の設計を考える際、「新たな」測定方法の構想が盛り込まれることも多々有るが、この場合の数の限界=能力測定の臨界点であるという認識が決定的に大事である。上記の分類は、測定道具としての「テスト」の性質だけの分類であるが、ここに、制度設計に際しては、複数テストの合計方法や、選抜時期などの「制度運用上の要因」が加わる分、少し複雑にはなる。だが、それでも、「限られた手数」の中で、組み合わされて行われているのが、大学入学者選抜制度改革の本質であることに変わりはない。
つまり、この表1から抜け出した「テスト」は測定道具として原理的に存在しないということである。項目反応理論を援用したCBT或いは適応型テストが「新しいテストのかたち」と思われるかもしれないが、単に規準集団が用意された(事前に項目ごとにパラメータが付与されている)「標準テスト」の1種に過ぎない。項目反応理論が心理テストの文脈から生まれた測定技術であるが故に、CBTであれ、適応型テストであれ、その根本的な仕組み、例えば、その規準集団はどこに求めるのか、というやり方・発想が変わった訳ではない。項目反応理論を用いる場合、受験生の能力値を「推定」するためには、受験生が受験する前段階で、項目パラメータ(どのレベルの受験生が何割程度正解するか、どのレベルの受験生を識別するのに適した項目なのか)を付与する必要がある。つまり、「事前に」規準が必要なのである。また、こうした項目パラメータは、学習指導要領が変更することによっても変わるし、誰がいつ受験するかによっても、変わる可能性があるなど、様々な技術的な問題を乗り越えなくてはならない。更には、問題のパラメータを付与する関係上、問題は初出でなくなることへの配慮も必要となってくる。また、測定精度も、能力値が高い方と低い方で低いことが知られている。こうした意味では、項目反応理論を用いたCBT或いは適応型テストの実施は、必ずしも大学入学者選抜制度改革における万能薬には到底なり得ず、余計に制度設計を複雑にする要素を孕んでいる。
ただ、米国の全米学力調査(NEAP)の経験から言えるのは、新しいテスト方法の導入は財務的に予算獲得に資するということであり1、CBT或いは適応型テストの実施も、大量の作題を用意したり、端末を個別に用意したりする必要があるなど、その受験システムの構築には、労力のみならず、多額の費用を必要とすることだ。
また、見落とされがちであるが、現実の大学入学者選抜でも、既に、十分に多元的な評価尺度による総合的な評価が行われているのである。例えば、最もそこからかけ離れているように思われるかもしれない国公立大学における一般入試の場合でも、表1の分類に従って見れば、大学入試センター試験では客観式テストを採用し、個別学力検査では記述テストを採用するなど、異なる測定道具を組み合わせて実施されている。個別学力検査でも、大学によっては、問題数を多く回答させる速度検査(スピード・テスト)的な要素の強い大学があったり、時間をゆっくり解かせる力量検査(パワー・テスト)的な要素が強い大学があったりするなど、大学ごとにそのアドミッション・ポリシーに従って、測定内容や目的の異なる測定道具を組み合わせて実施している。当然、記述学力以外の資質を測定すべく、表1の範囲内で、当該部局が求める能力に応じて、小論文や実技を組み合わせ、入学者選抜を実施している例もごまんとある。この意味で、現状においても、大学入学者選抜では、決して一面的な「能力」の観点のみから入学者選抜を実施しているわけではなく、共通テストを基礎とした上で、各大学が「多元的な評価尺度による総合的な評価」に基づいて大学入学者選抜が実施されていると言っても差し支えない。そして、それは臨時教育審議会答申の改革意図に沿ったものであると言っても決して過言ではない。
まとめると、そもそも、①入学者選抜の改革をめぐっては古くから、「同じ」論点での対立軸が「繰り返し」出されてきた。なぜこのようなことが起きるのかと言えば、②入試に用いられるテストの「組み合わせ」が「有限」だからである。それは、新しいテストと思われている項目反応理論を援用したCBTであっても例外ではなく、 表1の組み合わせの範疇に存在する。もっとも、③CBTを入試制度として適用するには、乗り越えるべき技術的課題が多く、必ずしも万能薬とは言えない。また、この「組み合わせ」の「範囲内」で、④既に、多くの国公立大学で実施されてきた大学入試センター試験と個別学力検査の組み合わせであったとしても、テストの類型をアドミッション・ポリシーに合わせて変えることで、実現可能な最大限の工夫の範囲内で、「多元的な評価による総合的な評価」で受験生の能力を測ってきた、と言えるのだ。
1) 全米学力調査の項目反応理論導入の経緯と予算措置の推移については,木村(2008)を参照。