2016/02/12

第92回 21世紀型能力の育成と評価 ~批判的思考~【後編】

研究員 伊藤 素江
 前編では批判的思考とは何かについて、そして高校での育成事例から得られる示唆についてお伝えしました。では、批判的思考力を育成できたかをどのように測定すればよいでしょうか? 後編である本稿では、国内外でみられるアンケートやテストによる批判的思考力の測定について検討します。

アンケートによる測定

 国内を見渡してみますと、残念ながら日本には批判的思考力を客観的に測定するテストとして標準化されたものはまだありません。国内でこれまで批判的思考力の育成の成果をみるために多くとられてきた方法は、批判的思考の態度や志向性を評価する方法です。これは例えば、「筋道を立てて物事を考える」といった批判的思考の態度に関する項目に「あてはまる」~「あてはまらない」の5段階で回答してもらうというもので、指導前後の回答の変化から指導の効果を検討するものです。前編で触れたとおり「態度」も批判的思考の構成要素の一部であり、高いパフォーマンスに欠かせない要素です。平山・楠見(2004)や廣岡(2000)など、批判的思考の「態度」や「志向性」尺度もさまざまな研究者により開発されています。
 しかしこの方法は生徒自身が自らを評価するという「自己評定式」で、控え目な性格の回答者は「あてはまらない」に多くつけるなど、客観性が十分に担保されないという問題があります。また、批判的思考は自分の思考プロセスを規準に基づいて評価・判断する内省的思考ですから(前編参照)、批判的思考力を身につけていればいるほど自分を厳しく評価する(「あてはまらない」に多く答える)可能性も考えられます。ですから批判的思考の情意的側面の測定結果は、慎重に解釈しなくてはなりません。
 実際、平山ら(2010)がアメリカで開発された”Cornell Critical Thinking Test”(次節で紹介)という客観式テストを日本語訳し、その結果と批判的思考態度尺度との関係を検討したところ、有意な相関はみられませんでした。また筆者らが大学生対象に行った研究(未発表)でも同様の結果でした。私たちは2009年頃から、前編でご説明した批判的思考力の定義に従った批判的思考力テスト(マーク式)の開発に取り組んでいます(楠見ほか 2010)。このテストの結果と批判的思考態度尺度(平山・楠見 2004)の関係をみたところ、相関係数は高くて.16にとどまりました。また独自に開発したアンケート項目「自分は現実を客観的に見ていると思う。」では、相関係数が-.15と負値になりました。自分はできていると思っている人ほど実際のテストはできなかった、という認識と実態のズレを示唆する結果だといえます。(テストの精度ももちろん検討するべきです。)

テストによる測定

 日本よりも批判的思考研究・育成の歴史が長くまた盛んな欧米諸国には批判的思考力をマーク式で問う客観式テストがあり、代表的なものを以下のとおり表にしました。米豪では大学教育の学習成果を測定するテストに批判的思考力テストが含まれており、広く実施されています。これらの国では、批判的思考力はあらゆる専門領域に共通するジェネリックスキルであり大学で育成されるべき能力として位置付けられているのです。
批判的思考力のみの測定を行うテスト 形式
1 Cornell Critical Thinking Test Level X, Z.
批判的思考に関する代表的研究者の一人、教育哲学者エニス,R.H.が主体となって1985年に開発したテスト。Level Xは5年生から12年生、Zは11~12年生以上が対象。帰納推論、演繹推論、信頼性、前提の同定、実験の予測・解釈などを問う。Xは71小問、Zは52小問。この日本語版を久原ら(1983)が作成している。
マーク式
2 Watson‐Glaser Critical Thinking Appraisal
1925年に開発された歴史あるテスト。教育哲学者のワトソン,G.と心理学者のグレーザー,E.M.の研究に基づく。前提の同定、結論の導出、演繹推論などを比較的短いパッセージの40小問で問う。
マーク式
3 California Critical Thinking Skills Test
批判的思考の代表的研究者の一人ファシオーネ,P.A.が中心となって検討し、1990年に専門家間の合意として出された批判的思考の定義(デルファイレポート)に基づいて開発されたテスト。現実的な問題解決場面を題材に、推論、結論の導出、演繹推論、帰納推論などを問う。
マーク式
批判的思考力を1科目もしくは測定する能力の一つとしているテスト 形式
4 CAAP(Collegiate Assessment of Academic Proficiency)
大学のアウトカムアセスメント。大学で出会うような典型的なイシューを題材に、議論の明確化・分析・評価・拡張を問う。4大問32小問、40分。開発:ACT(米)
マーク式
5 CLA+ (Collegeate Learning Assessment +)
大学のアウトカムアセスメント。大学教育のアウトカムとして批判的思考を重視し、学生たちが将来出会いそうな典型的な問題解決場面を素材に、その解決の導出を記述式で問うパフォーマンスベース型テスト。記述式1問・マーク式25問、90分。開発:CAE(米)
記述式
マーク式
6 GRE(Graduate Record Examinations)
大学院やビジネススクール進学に使われるテスト。”Analytical Writing”セクションで、批判的思考力を測定。複雑な考えをまとめ支持する力、論証を構築または評価する力、一貫した論考を維持する力を問う。2問、60分。開発:ETS(米)
記述式
7 GSA(Graduate Skills Assessment)
大学のアウトカムアセスメント。明示もしくは暗示された意味理解のための読解力、主張・論点・根拠などの明確化のための分析力と推論力、証拠の強さや信頼性・推論の妥当性判断のための評価力を問う。30小問。開発:ACER(豪)
マーク式
8 TSA(Thinking Skills Assessment)
ケンブリッジその他大学のアドミッションテスト。「結論の把握」「結論の導出」「暗黙の前提の同定」「演繹推論」など7スキルを設定。それらを1問1答で問う小問(問題文100字程度)で構成される。開発:Cambridge English Language Assessment(英)
マーク式
9 LSAT(Law School Admission Test)
アメリカの法科大学院入学試験。「議論のパーツ・関係の把握」「意見の相違・不一致点の明確化」「原理・原則の理解と適用」など、批判的思考に該当する能力を測定する問題が出題されている。開発:LSAC(米)
マーク式
※いずれのウェブサイトも2016年2月2日時点のものです。
 日本でも標準化された客観式テストの確立が求められますが、使用する前にテストの限界を認識しておく必要があります。
 例えば客観式テストはいくら現実的な事柄をテーマにしても、現実世界を再現できているわけではありません。また答えは提示された選択肢の一つとして示されています。「CLA+」は、このマーク式の限界を超えるために開発された記述式テストです。開発したCAEは「CLAのような自由記述式のテストこそが、学生がいかに仮説をたて、誤った推論を見分け、暗黙かつおそらく誤っているであろう前提を識別できるかを測定できる」(CAE 2013、筆者訳)としています。
 解答者が自ら考え答えを出す記述式の方が、確かに現実に近いパフォーマンスをみることができるでしょう。しかし記述式にも問題があります。マーク式テストは早ければ1問1分もかからずに答えることができるので、常識的なテスト時間である程度の数の問題を出題できます。そこには多様なテーマの問題が含まれるでしょう。一方で記述式は、問題文や資料を読ませたうえで一定程度の文字数の文章を書かせますので解答に時間がかかります。標準的なテスト時間で出題できる問題数はおのずと限られてしまいます。その結果たまたま苦手な分野のテーマに当たってしまった学生は不利になる、つまり批判的思考力だけでなく分野の向き不向きがテストの結果に影響してしまいます。
 そしていずれの形式のテストにも共通しているのが、「批判的思考力テスト」として実施されているがゆえの弱点です。受検者は、自分の批判的思考を「全開」にしてテストに臨むでしょう。21世紀を生きる私たちに求められるのは、複雑で変化の激しい現実世界で答えのない問いに立ち向かう時に、自らの判断で批判的思考を適切に発揮することだということを考えると、おのずとテストの限界がみえてきます。

さいごに

 批判的思考力を適切に評価するには、アンケートやテストそれぞれが持つ特性を理解し、批判的思考のどの部分を何のために評価したいのか明確な目的を持って複数のテストを組み合わせて使う必要があるでしょう。そしてテストだけに頼らず、探究学習の成果物やディスカッションでの様子など多様な観点を合わせて能力をとらえることが重要だと考えます。評価する側こそ批判的思考力を発揮し、批判的思考力の評価について批判的に考えるべきではないでしょうか。

参考文献

CAE(2013)”The Case for Critical-Thinking Skills and Performance Assessment.” Council for Aid to Education.
楠見孝・子安増生・道田泰司・林創・平山るみ・田中優子(2010)「ジェネリックスキルとしての批判的思考力テストの開発—大学偏差値、批判的学習態度、授業履修との関係性の検討」『日本教育心理学会第52回総会発表論文集』 661.
久原恵子・井上尚美・波多野誼余夫(1983)「批判的思考力とその測定」『読書科学』 27, 131-142.
平山るみ・楠見孝(2004)「批判的思考態度が結論導出プロセスに及ぼす影響 : 証拠評価と結論生成課題を用いての検討」『教育心理学研究』 52, 186-198.
平山るみ・田中優子・河﨑美保・楠見孝(2010)「日本語版批判的思考能力尺度の構成と性質の検討:コーネル批判的思考テスト・レベルZを用いて」『日本教育工学会論文誌』 33(4), 441-448.
廣岡秀一・小川一美・元吉忠寛(2000)「クリティカルシンキングに対する志向性の測定に関する探索的研究」『三重大学教育学部研究紀要』51. 161-173.

著者プロフィール

伊藤 素江
ベネッセ教育総合研究所 アセスメント研究開発室 研究員
上智大学大学院総合人間科学研究科教育学専攻博士課程満期退学。修士(教育学)。2006年にベネッセコーポレーション入社。読解力、語彙力、批判的思考力など、これからの社会で必要とされる能力に関するアセスメントの研究・開発に携わる。

主な研究テーマは、ジェネリックスキルの項目開発研究。