Claude最强模型Fable 5发布:性能爆炸,价格翻倍
Anthropic 表示,Fable 5 的性能超越了其以往所有公开发布的模型。它在几乎所有 AI 性能测试基准测试中都处于领先水平,在软件工程、知识工作、视觉、科学研究以及许多其他领域都展现出卓越的性能。此外,Claude 5 Fable 比以往的 Claude 模型更节省 token,在长时运行任务中可以做到处理数百万 token 而不失焦点,并通过自身笔记改进输出。任务越长、越复杂,Fable 5 对于其他模型的优势就越明显。
价格为每百万输入 token 10 美元,输出 token 50 美元 省流 A\没活了
— from motorola XT2603-1, Android 16, S1 Next Goose v3.5.99 看例子还是很强的
Stripe 拿 Fable 5 在一个 5000 万行的 Ruby 代码库里做了一次全库迁移,一天完成,原本需要一整个团队花两个多月。在 Cognition 的 FrontierCode 测试中,Fable 5 在中等算力消耗下就拿到了最高分,Token 效率比之前的 Claude 模型明显更好。
视觉能力上,之前的 Claude 模型玩宝可梦火红版需要各种辅助工具才能推进,Fable 5 只靠最基础的视觉接口就通关了。还能从截图直接还原一个 Web 应用的源代码。
在生命科学方向,Mythos 5 让 Anthropic 内部的蛋白质设计专家把药物设计流程中的部分环节加速了约 10 倍。在一项基因组学研究中,Mythos 5 在几乎完全自主的情况下工作了一周多,训练出的模型表现超过了发表在 Science 上的模型,而体量只有后者的百分之一。
—— 来自 OnePlus CPH2581, Android 16, 鹅球 v3.5.99-alpha 试了一下感觉像聪明点的Opus 4.6,而且看其他人评测的特别容易触发拦截,这东西A÷是怎么有脸端上来的 说一点词就给你判断为违禁,用不了一点。a畜真的闹麻了
论坛助手,iPhone 有点好奇了,这些用来做评测基准的上代模型是刚推出时的全力版还是现行的降智降算力版? 多agent长任务能力体感可见的强,开局小试牛刀就是两个半小时的任务完美拿下。但是不知道这是模型本身厉害还是cc的harness工程的新升级 每次找例子都是重构,我身边觉得ai牛逼ai万能的也是用重构,除了重构真的漏洞百出。 Nanachi 发表于 2026-6-10 11:57
有点好奇了,这些用来做评测基准的上代模型是刚推出时的全力版还是现行的降智降算力版? ...
直接把原来的跑分数据复制过来的 确实强,速度也很快,token其实对比opus是省的。
体感实际token消耗量乘以价格是打平。
至于这两周的订阅试用算两倍token,我觉得简直是大放送,甚至能放开用ultracode了。 如果年底之前拿不出来比现在更有想象力的东西,我感觉支撑不了股价
年初到现在我感觉印象深刻的消息就只有涨价 IIIIIlllllIIIII 发表于 2026-6-10 11:50
省流 A\没活了
— from motorola XT2603-1, Android 16, S1 Next Goose v3.5.99
相反,感觉快把OAI压到悬崖边上了。
SPX和A先手IPO吃光流动性,加上Fable下放,OAI现在很危险。
5.5如果不开放1M上下文给codex那就真的不知道下一步怎么办了。 Fable还是比mythos差点意思? 今天一个用4.6没解决的bug用fable解决了,体感在智力和速度上都有提升 Jet.Black 发表于 2026-6-10 12:11
Fable还是比mythos差点意思?
禁信息安全和生物化学相关问题,会自动降级Opus。
但是很容易误触发。 本帖最后由 星花 于 2026-6-10 12:15 编辑
别急,等用上一段时间就会降智的。 这 fable 的回退策略太变态了,回退了我也不知道,今天用了一上午,也不知道到底是 fable 在干活还是 opus 4.8在干活,体感倒是确实变快了很多 什么神奇的手机用久了会卡的变种版本
— from OPPO PKM110, Android 16, S1 Next Goose v3.5.99 AraTurambar 发表于 2026-6-10 12:08
确实强,速度也很快,token其实对比opus是省的。
体感实际token消耗量乘以价格是打平。
小心它给你的项目下毒,A/说了要是被它判定你来自敌国或者在开发竞争产品哪怕仅仅只是是大模型研究、训练推理流水线等时候,它可以直接给你的使用下毒并且不给任何通知,且不会退款
李少卿 发表于 2026-6-10 11:51
看例子还是很强的
Stripe 拿 Fable 5 在一个 5000 万行的 Ruby 代码库里做了一次全库迁移,一天完成,原本 ...
花这么多钱训练模型,达到了非洲小哥水平,或者中国小学生的水平性价比在哪里。感觉模型的智力提升速度变慢了。 NONORIRI 发表于 2026-6-10 12:19
小心它给你的项目下毒,A/说了要是被它判定你来自敌国或者在开发竞争产品哪怕仅仅只是是大模型研究、训练 ...
简直是霸王条款 NONORIRI 发表于 2026-6-10 12:19
小心它给你的项目下毒,A/说了要是被它判定你来自敌国或者在开发竞争产品哪怕仅仅只是是大模型研究、训练 ...
一来应该没有人下毒我这种杂鱼。
二来我每走一步claude都会打开codex交叉检查三件事:是不是所有claude声称自己做了的事情都做了(脚本和结果有没有证据),是不是claude主张的内容都有文献支持(比对自建RAG),数学是不是能过sympy和lean的交叉检验。
不要让claude俺寻思,所有数学都要过Lean,所有统计都要py和r文件经过第三方审计,所有出现在笔记里的数字都必须有出处,就不容易被毒。 看了下用这玩意还得同意请求内容保留30天
公司账户怕是体验不了了 AraTurambar 发表于 2026-6-10 12:32
一来应该没有人下毒我这种杂鱼。
二来我每走一步claude都会打开codex交叉检查三件事:是不是所有claude ...
一,这个过程应该没有人,都是AI自动判断
二,你怎么用我不管,我只是说A/这个行为存在,并且它具体怎么做的没人管控,你爱怎么用怎么用,被它下毒也不在乎相信自己有办法能控制住那更是可以的。
看你用r看起来是统计或生信之类的,我就是做大模型研究的你可以认为我就是利益相关,但这里只是提醒用户注意A/的霸王条款跟行为而已,不用着急向我分享具体怎么用来规避这些A/这些“misanthropic”的条款 应该不会不如4.6了吧,换了个大版本 确定省token么,程序员朋友20刀2个对话直接跑完了 用了个简单任务测试 token爆炸
5小时用量的20%一下就没
—— 来自 鹅球 v3.3.96-alpha 据说chatgpt-5.6这周发,估计会差不多,不过现在codex的势头也很猛,两家还是拉不开差距。 这几天一直在自己搞一个小电影管理和推荐系统。前几天都是opus4.6在干活。今天用了下fable,体感还是丝滑不少的。
token消耗速度感觉比之前耐用一点(指用完5小时限额)
论坛助手,iPhone 自从A/横空出世后,OAI当初那出宫斗显得都不那么小丑了
—— 来自 Xiaomi 25019PNF3C, Android 15, 鹅球 v3.5.99 无所谓,既然展现了这种性能,那么最多只要六个月后我梁圣就能端出来了 璇瑢子R 发表于 2026-6-10 13:47
这几天一直在自己搞一个小电影管理和推荐系统。前几天都是opus4.6在干活。今天用了下fable,体感还是丝滑不 ...
您这个项目开源不
论坛助手,iPhone AraTurambar 发表于 2026-6-10 12:10
相反,感觉快把OAI压到悬崖边上了。
SPX和A先手IPO吃光流动性,加上Fable下放,OAI现在很危险。
生信和医药领域的表示没活了,全部降为4.8 现在A\新模型的system card完全不做MRCR 了,倒是openai在做,现在A\用的是GraphWalks A÷不亏是A÷,价格翻倍可还行 说起r想到rstudio宣传agent的时候说供应商选了A/且保证不会存任何用户数据,很好奇Hadley Wickham自己看这些批话绷得住吗 Re:Source 不是给🦌克玩的,是码区特供,都散了吧 6月22号就脱离订阅套餐只提供API,那大部分人都用不起了。 泰坦失足 发表于 2026-6-10 16:03
6月22号就脱离订阅套餐只提供API,那大部分人都用不起了。
即使是现在额度也不多,消耗巨快,我刚蹬了一会就发现卡五小时了… 跑了一个demo确实无敌
很惊艳
不过一般人用opus都差不多了
页:
[1]
2