AI、大学入試共通テストを受ける

【2024年最新】共通テストを色んな生成AIに解かせてみた(ChatGPT vs Bard vs Claude2)|株式会社LifePrompt

2023年の流行語大賞にも選ばれた「生成AI」。 ChatGPTだけでなく、Google BardやClaude2など似たようなAIチャットボットも登場し、性能も日に日に上がっている感覚があり…

去年2023年はChat GPTなどの「生成せいせいAI」がとても話題になりました。みなさんもニュースなどで聞いたり読んだりしたのではないでしょうか。
生成AIとは、コンピュータが学習したデータを元に、新しいデータや情報を出力する技術です。 これまで人間がやっていた「考える」や「計画する」をAIがやってくれて、いろいろなアイディアや情報を生み出すのです。

さて、今回の記事は、この前(1/14-15)にあった「2024年 大学入試共通テスト」をいろんなAIに解かせてみたよ、という話です。出場者はこの3名!

Bard(Google)
特にことばに関する問題を得意としてます。文章を読んで理解したり、言葉を使って人と会話することが上手です。

GPT-4(OpenAI)
文章を書くことや、様々な知識に基づいた問題解決が得意。英語のテストでは高得点を取れる力を持っています。絵をいたりもできます。

Claude2(Anthropic)
人間のように会話をするのが得意です。フレンドリーでわたしたちがわかりやすい回答をすることで知られています。

さて、それぞれ得意なことが違うAIですが、その結果は?

赤字は受験者平均点(河合塾予想)をこえた
LifePrompt社 noteから

結果は…
GPT-4が数学以外で受験者平均点よりもかなり良い成績でした。Claude2もGPT-4には負けましたが、3つの科目で平均点を超えています。この結果から、AIの得意なこと、苦手なことが見えてきます。

AIが得意なこと
知識(暗記)問題や読解問題:
シンプルな問題: ことばの穴うめや、簡単なマルバツ問題などが得意で、英語の問題も大得意。

AIが苦手なこと
複雑な問題: たとえば、いくつかの出来事を順番に並べ替える問題や、図表を読んで解く問題など、順番に考えながら解く問題が苦手。
特に、数学の問題はAIにはとてもむずかしいのです。数学は計算だけじゃなく、問題を読み、それをどう解くかを考えないといけないからです。

AIは、知識をたくさん持っていて、読むことや単純な問題は得意だけど、複雑ふくざつな問題や数学のような計算が必要な問題はまだ苦手なのですね。人間はAIに取って代わられる、なんて言う人もいるけど、人間にしかできないこと(たとえば「ものごとを順番に考える」)とAIにやってもらう単純なことのバランスがじょうずにとれたら、人間はもっと「自分で考える」「AIの出したアイデアをもとに、創造そうぞうする」ことができるようになるのではないでしょうか。

どんなにすばらしい技術があっても、使うのはわたしたち人間ですから、わたしたちもかしこい使い方ができないともったいないですよね。

記事作成者

清水 裕矢 | Shimizu Yuya
清水 裕矢 | Shimizu YuyaProgress CFO / こども未来投資プロジェクト 代表理事
外国語大学卒業後に学習塾小中学文系/高校英語講師、パソコン教室インストラクター/営業を経て、2006年に外資系産業ガス会社に入社。以降17年以上複数企業にて財務経理責任者やCFOを歴任。現在も複数企業の会計アドバイザー等を務める。
こどもの金融リテラシー講座 CA$H! 講師/カリキュラム・テキスト作成。
2023年11月30日に「キッズノミクス クイズで学ぼう、お金と経済」を発売。
『「会計」「IT」「英語」があれば、社会人人生なんとかなる』がポリシー。