【Q＆A】ＡＩによる試験答案の自動採点、どこまで人間に代われる？

教育動向

発展する人工知能（ＡＩ）の技術が、社会全体を変えようとしつつあります。
ＡＩをめぐっては、2045年ごろに人間の能力を追い越す「シンギュラリティー（技術的特異点）」が到来する、という予測もありました。
本当にＡＩは、人間に取って代わることができるのでしょうか。文部科学省の「全国的な学力調査のＣＢＴ（コンピューター使用型テスト）化検討ワーキンググループ（ＷＧ）」の第７回会合で、乾健太郎・東北大学大学院教授（兼理化学研究所革新知能統合研究センター自然言語理解チームリーダー）が行った発表から、ＡＩがどこまで自動採点ができるのかを見ていきましょう。

この記事のポイント

Q.ＡＩ採点の現状は？
Q.ＡＩ採点の問題は？
Q.ＡＩに今後どこまで期待できる？

Q.ＡＩ採点の現状は？

既に英文では、長文のエッセーを「自動採点」できる技術があります。構成、文体、語句の選択などといった評価項目を基に、採点するものです。

そうなると、「できることは、もっとあるはず」と考えるのが、技術者の常だと乾教授は指摘します。たとえば英作文の添削なら、簡単な解説を付けることができます。実際、英語論文ライティング支援サービスが、2021年春に商用化される予定です。

日本語でも、国語の記述式問題で、一定の条件の下で「何文字以内で説明せよ」という設問なら、期待される用語を使ったかどうかで加点したり、誤字や文末の終わり方などで減点したりすることは、技術的に可能です。

Q.ＡＩ採点の問題は？

現状では、ＡＩには決定的な限界があります。そもそも人間のように、文章の「意味」を理解したり、書き手の「意図」を推測したりすることができないのです。

一方でＡＩは、非常に多くのデータから共通点を見いだして、自動的に判断することができます。模擬試験の答案について、１問当たり1,000答案程度のデータがあれば、ＡＩも、人間と同等程度の精度で採点ができるようになるといいます。

ただし、それには、幅がある表現に対して、柔軟に対応できるようにすることが必要になります。そのためには、個別の問題ごとに、人が採点モデルを作る必要が生じます。結局はそれだけ人手が掛かるわけで、コストとの兼ね合いが出てきます。

Q.ＡＩに今後どこまで期待できる？

現状では、記述式答案の採点に関する研究者も少なく、研究に利用できるようなデータも「決定的に不足」しているようです。逆に言えば、データと技術を流通させる仕組みを作ることができれば、世界をリードすることも可能だと、乾教授は指摘します。

人間とＡＩの役割分担も考えられるようです。簡単な判断はＡＩに任せ、人の判断さえ揺れるような主観的な判断が必要なものは人手に回す、といった形です。

まとめ & 実践 TIPS

ＡＩというと、いずれは人間と同じように考えることができるようなイメージを持たれがちです。しかし、採点一つ取っても「人間の教師の代わりができるような技術にも、もちろんならない」（乾教授）ことに注意が必要です。
小学校では2020年度から、プログラミング教育が始まりました。世の中のさまざまなモノが、プログラミングという人間の指示によって動いていることを、早くから体感させるためです。
ＡＩなどの高度な技術を、ブラックボックスにしてはいけません。技術を使って、よりよい世界を築くのは、あくまで意思を持った人間だからです。

出典：
全国的な学力調査のCBT化検討ワーキンググループ（第7回）配付資料
https://www.mext.go.jp/kaigisiryo/2020/03/mext_00023.html

プロフィール

渡辺敦司わたなべあつし

教育ジャーナリスト

著書：学習指導要領「次期改訂」をどうする　—検証　教育課程改革—

1964年北海道生まれ。横浜国立大学教育学部卒。1990年、教育専門紙「日本教育新聞」記者となり、文部省、進路指導問題などを担当。1998年よりフリー。初等中等教育を中心に、教育行財政・教育実践の両面から幅広く取材・執筆を続けている。

教育動向

【Q＆A】ＡＩによる試験答案の自動採点、どこまで人間に代われる？

Q.ＡＩ採点の現状は？

Q.ＡＩ採点の問題は？

Q.ＡＩに今後どこまで期待できる？

まとめ & 実践 TIPS

プロフィール

子育て・教育Q&A

【小学生】2018年から学校での英語教育はどう変わるの？

【高校生】問題が解けなかったときに、答えを写すことに意味がありますか？

【小学生】漢字二字の熟語の構成（組み立て）を見分けることができません。見分ける方法はありますか？