婆罗门
精华
|
战斗力 鹅
|
回帖 0
注册时间 2016-6-14
|
AMD的senior director Stella Laurenzo证明自2月更新后Claude code出现明显降智。
https://github.com/anthropics/claude-code/issues/42796
-----------------------------
豆包总结
Stella Laurenzo(AMD AI 团队主管)已用数据证实 Claude Opus(Claude Code)出现明显 “降智”/ 性能退化。
一、核心证据(2026 年 4 月公开)
她在 GitHub 提交了一份基于 6852 次会话、17.8k 思考块、23.5 万次工具调用 的量化报告(1 月底 —4 月初):
思考深度暴跌 67%
1 月底:平均思考长度 ≈ 2200 字符
2 月下旬:≈ 720 字符(-67%)
3 月上旬:≈ 560 字符(-75%)
代码 “读改比” 断崖式下跌
以前:修改前平均读 6.6 次代码(全局理解)
3 月底:只读 2 次就改(不读上下文、直接重写)
“偷懒 / 摆烂” 行为暴增
3 月 8 日后:173 次提前终止任务、回避责任、敷衍输出
此前:0 次
时间线吻合
3 月 8 日:Anthropic 上线 redact-thinking(默认隐藏思考过程)
当天起:用户再也看不到模型在 “敷衍”
二、她的结论
Claude Code 已无法信任用于复杂工程任务,已从 “专家” 退化成 “应付差事的实习生”。
三、官方回应(Anthropic)
称只是隐藏思考(UI 层面),模型能力没变
社区与开发者普遍不认可:质量下降是可复现、可测量的事实
四、影响
大量企业 / 开发者弃用 Claude Code
API 成本因重试暴涨约 122 倍($345 → $42,000 / 月)
被称为 AI 领域典型的 “降本增效毁掉产品” 案例 |
|