发呆的龙虾 发表于 2026-4-27 22:04

友邦惊诧,gpt拿下日本东大京大入学考试最高分

日本人把今年东大和京大入学考试试题丢给gpt5.2t去做,结果打分完显示均超过今年考生的最高分。其中东大卷子满分550分,gpt获得文科452、理科503的高分,均超过公布的考生最高成绩(文科434、理科453)。
从具体学科上看,数学满分,英语对了九成,世界史等文科论述题表现则很差。
去年日本人也搞过同样的测试,结果当时gpt未能通过测试,评卷得分全都不及格。

fw3ii9 发表于 2026-4-28 00:58

“英语对了九成,世界史等文科论述题表现则很差。”
应该是鬼子的参考答案错了

寒蝉 发表于 2026-4-27 22:08

英语居然错了10%

小木曾雪菜 发表于 2026-4-27 22:22

给最新的5.5试试。

—— 来自 OnePlus PLK110, Android 16, 鹅球 v3.5.99

正版万岁 发表于 2026-4-27 23:53

高考状元级别?

LOLITA 发表于 2026-4-28 00:02

今年开始国内是不是也要搞AI做各省高考题了

百响 发表于 2026-4-28 00:06

LOLITA 发表于 2026-4-28 00:02
今年开始国内是不是也要搞AI做各省高考题了

年年都做啊,去年就985了,今年超状元也不奇怪

—— 来自 S1Fun

卡奥斯·克斯拉 发表于 2026-4-28 00:55

百响 发表于 2026-4-28 00:06
年年都做啊,去年就985了,今年超状元也不奇怪

—— 来自 S1Fun

本地部署还是联网

百响 发表于 2026-4-28 01:37

卡奥斯·克斯拉 发表于 2026-4-28 00:55
本地部署还是联网

据说是本地的,不过以现在llm的智能水平,如果有全部真题和答案的话,分数应该不止600-650

—— 来自 S1Fun

格林达姆 发表于 2026-4-28 02:43

哪怕是离线的,语料库里也早就有各种大学历年真题了吧

sd4442312 发表于 2026-4-28 06:07

各种描述精确,没有玩语言把戏的题干,尤其是数理化这种答案说一不二的,在AI眼里应该是送分题。

喜欢要考生分析题干真实意图的,应用题性质强的,或者文科类论述题,表现应该差一点。

洛拉斯 发表于 2026-4-28 08:08

世界史等文科论述题表现则很差
说明日本文科在平行世界,与主位面存在较大差别

隰有苌楚 发表于 2026-4-28 08:22

有了ai是不是广大中学大学考生一定程度上可以不再愁教科书上边全是字儿没例题,数字信号处理一章没看了

风信千叶 发表于 2026-4-28 08:38

世界史的标准答案是倭畜的右翼私货吧?

weary10 发表于 2026-4-28 08:43

应该是倭寇的平行世界历史和这个世界有冲突。

adw667 发表于 2026-4-28 08:49

想看世界史原题和参考答案以及AI的回答

tylunas 发表于 2026-4-28 09:02

LOLITA 发表于 2026-4-28 00:02
今年开始国内是不是也要搞AI做各省高考题了

遥想十年前,高考机器人还是九个高校共建的863课题。
页: [1]
查看完整版本: 友邦惊诧,gpt拿下日本东大京大入学考试最高分