羽根邦夫Blog

”工学博士、電磁波対策製品WAVESAFE発明者のブログ”

AIが東大受験した

 AI(最新のチャットGPT5.2シンキング)が東大と京大の入試を受験したところ、2年前は不合格で、昨年はぎりぎり入学、今年は人間の主席よりも50点差をつけて合格したそうです。詳しい結果は、産経新聞4月28日をご覧ください。
 一般的な大学の入試問題は、高校までの教科書と、社会的常識としての時事問題と世の中の知識をベースにして、創られます。これに対して、AIは問いに関連する情報を、膨大な量のデータベースを参照して複数個の答えを見つけ出し、それぞれを吟味し選んでつなぎ合わせ、創られた文章を推敲して質問への答えとします。
 これは、AIが大学入試を受験すると言うことは、試験場に参考書を持ち込んで受験をするのと同じことです。しかも多数の参考書から1個所あるいは複数の答えを選び、吟味して推敲して答えることです。大学の入試の問題の出題は、一般の高校生が学校と社会で接することができる、高校までの教科書と新聞記事いう限られた範囲の知識をベースにしているはずで、AIが満点を取れるのが当たり前、と考えても良いでしょう。それでも今回は人間よりも良い得点でしたが、満点ではありませんでした。

 答えが満点で無かったのは、参照したデータベースが偏っていたか、AIの複数のデータをつなぎ合わせる推量のアルゴリズムが不完全であったか、のいずれかになります。ごくまれに、出題が教科書や世に知られていないデータを使った場合が有るかもしれませんが、大学は出題委員会で出題を吟味しているので、出題が悪いということは無いでしょう。
 実際に、今年度の受験でAIは解答に要した時間は15分で東大入試に首席で合格しました。驚くべきは、2年前は不合格で、今年は首席と、という進歩の早さです。結果は550点満点で、理系は503点でした。数学は当然ながら満点で、AIは理系の問題には強い事が分ります。文系では452点とのことでした。しかしここで、両科目共に満点で無かった理由を考えるのは、興味あることです。
 試験科目は理文共通の1次テストが、国語、外国語、地歴公民、理科、数学、専門の2次テストは理系が国語、数学、英語、理科で文系は国語、数学、英語、地歴です。全ての科目に優れた能力を持つAI受験生に対して、大学側として採点を行った教員の評価は、全科目で余裕の合格点を取った、文章解は表現はぎこちないが受験生が書きそうな文章とのことでした。
 ただし、英語科目では極めて上位だったが、英文を日本語で要約する問題だけが得点が伸びなかった、とのことです。これは、文章全体から推量する能力が得意ではないからで、同時に行った京大での受験においても比喩や皮肉を解釈する問題は点数が低く、表現の機微はほぼできていないとのことでした。
 つまり、AIは理系の課題を人間と議論するには十分な能力を持つが、時事や社会問題を人間と対話する能力は不十分、と言うことです。これは、チャットGPTだけの問題ではなく、他社のAIについても同じ傾向でしょう。比喩と皮肉は、人間にとっても広い知識と文化的教養が必要です。大学受験というレベルの低い文化レベルの出題に対しても不十分だったという事は、まだまだコンピュータに負けないぞ、と私たちはホッとできます。
 結論として、知識はあるが論理的な解答を作れないために、翻訳や歴史などの記述問題での課題が有ることが今後のAIの課題です。AIは人間に敵対するものでは無く、人間は利用しなければなりません。比喩や皮肉は、人間同士が理解し合う時に役に立つ潤滑剤ですから、AIがこれを持てば人間との意思疎通で大変に役立ちます。今回の大学受験がこれからのAIの課題の一つを示してくれました。2045年には、シンギュラリティと呼ばれる、コンピュータが人間の能力を超える事態が予測されています。これに向けた進歩に期待をしましょう。

Copyright © 2015-2021 Hane, Inc. & Beacon Associates, Inc.