超过人类状元,ChatGPT 以最高分通过日本顶尖大学入学考试

本文报道了日本人工智能公司 LifePrompt 使用 OpenAI 的 ChatGPT(测试模型为 5.2,先前用过 GPT‑4 与 o1 等)参加东京大学与京都大学今年本科入学考试并取得高分的情况。测试以将试题转为图像输入模型、并由河合塾教师阅卷的方式进行:东京大学理科 503 分(满分 550,超出真人最高 453 分),人文社会 452 分(超出真人最高 434 分);京都大学法学院 771 分(超出 734 分),医学院 1176 分(超出 1098 分)。其中数学满分、英语得分率约 90%,但世界史等论述题仅得 25%。文章并引述 LifePrompt 与学界观点:企业需为 AI 快速迭代做长期布局,同时有人士认为 AI 擅长大量既有数据的归纳计算,促使对以记忆与计算为主的升学考试模式进行反思与改革。

4 月 27 日消息,一家人工智能创业公司于周一表示,在日本顶尖学府东京大学与京都大学今年的入学考试中,ChatGPT 取得了最高分,成绩超过了人类状元考生的分数。

据 LifePrompt 公司介绍,这款生成式人工智能聊天机器人,在东京大学竞争最激烈的自然科学三类医学专业入学考试中,比真人最高分考生高出 50 分,数学科目更是拿到了满分。而在 2024 年,这款人工智能还未能通过该校所有入学考试,如今已实现突破。

据IT之家了解,该企业采用 OpenAI 的 ChatGPT 5.2 思考模型开展测试,让模型参加两所大学的本科入学考试,将考题转化为图像数据输入模型作答。由于答卷包含论述题,最终由知名补习学校河合塾的教师进行阅卷评分。

ChatGPT 还参与了今年日本全国大学统一入学考试,LifePrompt 汇总统计了其总成绩。

东京大学人文社会类考试满分 550 分,ChatGPT 考出 452 分;理科类考试同样满分 550 分,其得分 503 分。两项成绩均高于校方公布的录取考生最高分:人文社会三类最高分为 434 分,理科三类最高分为 453 分。

另一方面,这款人工智能的英语科目得分率达 90%,但在世界史等科目的论述题中,得分率仅为 25%。

在京都大学的考试中,人工智能在法学院入学考试取得 771 分,超过 734 分的录取最高分;医学院考试拿到 1176 分,高于真人状元的 1098 分。

2024 年,LifePrompt 公司曾使用 OpenAI 当时最新的 GPT-4 模型让人工智能作答东京大学入学考题,但未能达到录取最低分数线。次年,该公司测试了全新的 o1 模型,人工智能首次跨过录取合格线。

LifePrompt 公司负责人 Satoshi Endo 表示:“人工智能的能力有目共睹。鉴于人工智能技术迭代速度极快,企业在引入人工智能时,需要着眼于未来 10 至 20 年的业务发展格局进行布局。”

庆应义塾大学教授、日本人工智能学会会长 Satoshi Kurihara 认为,人类与人工智能不应放在同一赛道上比拼,因为人工智能擅长海量现有数据的吸收与归纳。

Satoshi Kurihara 称:“就像计算器的运算速度和精准度远超人类一样,人工智能考出高分本就是理所应当。”他补充道,在创造全新价值方面,人类依旧具备不可替代的优势。他还提出,当下侧重考查知识记忆与计算能力的升学考试模式,已经到了需要重新审视和改革的时候。

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...