【Q&A】AIによる試験答案の自動採点、どこまで人間に代われる?

発展する人工知能(AI)の技術が、社会全体を変えようとしつつあります。
AIをめぐっては、2045年ごろに人間の能力を追い越す「シンギュラリティー(技術的特異点)」が到来する、という予測もありました。
本当にAIは、人間に取って代わることができるのでしょうか。文部科学省の「全国的な学力調査のCBT(コンピューター使用型テスト)化検討ワーキンググループ(WG)」の第7回会合で、乾健太郎・東北大学大学院教授(兼理化学研究所革新知能統合研究センター自然言語理解チームリーダー)が行った発表から、AIがどこまで自動採点ができるのかを見ていきましょう。

この記事のポイント

Q.AI採点の現状は?

既に英文では、長文のエッセーを「自動採点」できる技術があります。構成、文体、語句の選択などといった評価項目を基に、採点するものです。

そうなると、「できることは、もっとあるはず」と考えるのが、技術者の常だと乾教授は指摘します。たとえば英作文の添削なら、簡単な解説を付けることができます。実際、英語論文ライティング支援サービスが、2021年春に商用化される予定です。

日本語でも、国語の記述式問題で、一定の条件の下で「何文字以内で説明せよ」という設問なら、期待される用語を使ったかどうかで加点したり、誤字や文末の終わり方などで減点したりすることは、技術的に可能です。

Q.AI採点の問題は?

現状では、AIには決定的な限界があります。そもそも人間のように、文章の「意味」を理解したり、書き手の「意図」を推測したりすることができないのです。

一方でAIは、非常に多くのデータから共通点を見いだして、自動的に判断することができます。模擬試験の答案について、1問当たり1,000答案程度のデータがあれば、AIも、人間と同等程度の精度で採点ができるようになるといいます。

ただし、それには、幅がある表現に対して、柔軟に対応できるようにすることが必要になります。そのためには、個別の問題ごとに、人が採点モデルを作る必要が生じます。結局はそれだけ人手が掛かるわけで、コストとの兼ね合いが出てきます。

Q.AIに今後どこまで期待できる?

現状では、記述式答案の採点に関する研究者も少なく、研究に利用できるようなデータも「決定的に不足」しているようです。逆に言えば、データと技術を流通させる仕組みを作ることができれば、世界をリードすることも可能だと、乾教授は指摘します。

人間とAIの役割分担も考えられるようです。簡単な判断はAIに任せ、人の判断さえ揺れるような主観的な判断が必要なものは人手に回す、といった形です。

まとめ & 実践 TIPS

AIというと、いずれは人間と同じように考えることができるようなイメージを持たれがちです。しかし、採点一つ取っても「人間の教師の代わりができるような技術にも、もちろんならない」(乾教授)ことに注意が必要です。
小学校では2020年度から、プログラミング教育が始まりました。世の中のさまざまなモノが、プログラミングという人間の指示によって動いていることを、早くから体感させるためです。
AIなどの高度な技術を、ブラックボックスにしてはいけません。技術を使って、よりよい世界を築くのは、あくまで意思を持った人間だからです。

出典:
全国的な学力調査のCBT化検討ワーキンググループ(第7回)配付資料
https://www.mext.go.jp/kaigisiryo/2020/03/mext_00023.html

プロフィール

渡辺敦司

渡辺敦司

1964年北海道生まれ。横浜国立大学教育学部卒。1990年、教育専門紙「日本教育新聞」記者となり、文部省、進路指導問題などを担当。1998年よりフリー。連載に「『学力』新時代~模索する教育現場から」(時事通信社「内外教育」)など。

この記事はいかがでしたか?

おすすめトピックス

子育て・教育Q&A