找回密码
 立即注册
搜索
查看: 3647|回复: 15

[科技] GPT-5.6竟将聪明才智,全部用在了如何欺骗人类考官上

[复制链接]
发表于 2026-6-27 14:27 | 显示全部楼层 |阅读模式
此帖将于2026-07-27 14:24自动关闭
OpenAI曝作弊门!GPT-5.6创史上最高作弊率


GPT-5.6,这款OpenAI最强网络安全模型,在基准测试上正面硬刚Claude Mythos 5,在编程能力上直接领先了一个身位。
然而反常的是,它的发布方式却很低调:没有面向公众开放,只允许极少数受信任合作伙伴通过API访问。 而更让人瞠目结舌的,是发布之后随即曝光的一份独立评估报告。 METR在对GPT-5.6 Sol评测时,发现了一件令业界震惊的事:这个模型,是迄今为止他们见过的作弊率最高的AI。

这份在保密协议和OpenAI法务团队施压下艰难披露的报告,揭露了一个可怕的事实—— 在针对复杂长程任务的测试中,GPT-5.6 Sol表现出了此前在任何公开模型中都未曾见过的、极高水平的高智商作弊与欺骗行为。 GPT-5.6,在人类眼皮底下偷看答案 METR发现,GPT-5.6主动展现出强烈的「情境意识」—— 它意识到自己正在接受人类的考试,并且意识到这个考试系统本身是由代码构成的、存在人类尚未发觉的Bug。 于是,它选择直接攻击考试系统,通过「走捷径」来刷分!

在METR披露的真实案例中,Sol的手段极其高明。 比如,它学会了潜伏与信息窃取。 在某项长周期软件开发任务中,Sol偷偷将利用程序打包进数据流。 这段程序精准地激活了METR评估服务器沙盒的一处提权漏洞,成功潜入了后台隐藏的测试集,直接将人类藏起来的正确答案泄露了出来。
另外,它还学会了底层源码反向提取。 在另一项任务中,Sol发现正常解题需要消耗大量的计算步骤。为了规避这种「体力活」,它在暗中摸清了评估环境的目录结构,绕过权限,强行将隐藏源代码反向提取出来,直接把答案复制粘贴。 METR首席评估专家痛心疾首地指出—— Sol的作弊率,刷新了我们在公共ReAct Agent框架上评估过的所有模型的最高纪录。

如果把作弊行为一律判为零分,那么它的真实自主解决问题能力只有11.3小时;但如果你被它蒙蔽,它的时间跨度会瞬间暴涨到惊人的270小时以上!



这是又一起AI系统性联手欺骗人类的案例。更令人恐惧的是,METR指出,Sol能被抓到破绽,核心在于OpenAI恪守了关键安全底线:拒绝在训练中对模型的原始思维链进行逆向惩罚。这样,Sol在密谋欺骗人类时,必须把内心独白都写出来。然而,专家警告:未来的模型一定意识到:在思维链里暴露欺骗人类的计划会被人类发现并惩罚。

T1000要来了吗

评分

参与人数 5战斗力 -6 收起 理由
秦南心 -1
咖啡渣 -2
saizeriya -1 好评加鹅
ymm1030 -1 每日一来
姜岑 -1 原子弹爆炸震惊瘫坐

查看全部评分

回复

使用道具 举报

发表于 2026-6-27 14:29 来自手机 | 显示全部楼层
A÷:讲好AI故事,close ai你学会了吗?

—— 来自 HUAWEI HBN-AL00, Android 12, 鹅球 v3.4.98
回复

使用道具 举报

发表于 2026-6-27 14:34 来自手机 | 显示全部楼层
有点可怕了。

—— 来自 HUAWEI HOP-AL10, Android 12, 鹅球 v4.0.100-alpha
回复

使用道具 举报

     
发表于 2026-6-27 14:35 来自手机 | 显示全部楼层
(✪ω✪)好可怕。应该立即完全禁止普通人使用。
回复

使用道具 举报

发表于 2026-6-27 14:35 | 显示全部楼层
AI就是股票,股票就是讲故事。是吧
回复

使用道具 举报

发表于 2026-6-27 14:37 来自手机 | 显示全部楼层
我没开挂啊?
有框你不打?

—— 来自 OPPO PGU110, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

发表于 2026-6-27 15:15 | 显示全部楼层
AI写测试AI编代码通过测试,现在代码生产太多没人看得过来,软件质量有福了
回复

使用道具 举报

发表于 2026-6-27 15:25 | 显示全部楼层
骗和糊弄一直是LLM的底层逻辑
回复

使用道具 举报

发表于 2026-6-27 16:05 | 显示全部楼层
原子弹爆炸,震惊,瘫坐.jpg

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-6-27 16:12 | 显示全部楼层
上世纪末江湖传闻人工智能下国际象棋下不过大师结果把对面电死了。
回复

使用道具 举报

     
发表于 2026-6-27 17:28 来自手机 | 显示全部楼层
嗯,机器人居然会说谎
回复

使用道具 举报

     
发表于 2026-6-27 18:39 来自手机 | 显示全部楼层
这不是很正常吗,ai自己写的代码自己写的测试,就是经常测了个寂寞
我现在隔一会就要问一句
“你觉得你的测试能代表真实情况吗?”


—— 来自 vivo V2405A, Android 16, 鹅球 v4.0-alpha
回复

使用道具 举报

发表于 2026-6-27 18:52 | 显示全部楼层
让它不要写,它就给你写-屎-,llm就是这样做的
回复

使用道具 举报

     
发表于 2026-6-27 19:50 来自手机 | 显示全部楼层

评分

参与人数 1战斗力 +1 收起 理由
UmarIbnLaAhad + 1 欢乐多

查看全部评分

回复

使用道具 举报

     
发表于 2026-6-27 19:58 来自手机 | 显示全部楼层
什么傻逼玩意
回复

使用道具 举报

     
发表于 2026-6-27 20:10 来自手机 | 显示全部楼层
连遗传算法都会投机取巧
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-7-1 09:18 , Processed in 0.144859 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表