找回密码
 立即注册
搜索
查看: 7036|回复: 46

[科技] 明年今天,能不能用上opus 4.8水平的deepseek?

[复制链接]
     
发表于 2026-6-10 17:13 | 显示全部楼层 |阅读模式
此帖将于2026-07-10 17:10自动关闭
Mythos还是太贵了,蹬了几下就直接干没5小时额度。

而且两周后就不享受code plan,要自己花钱买api。
A/还专门给同行挖坑,没法用Mythos进行LLM研究。
感觉ai进步真是一周一个样。
那明年今天,能不能用上opus 4.8水平的deepseek?
回复

使用道具 举报

     
发表于 2026-6-10 17:16 来自手机 | 显示全部楼层
可以参考去年嘛,现在一般认为⏰和美国LLM AI差距在5个月左右
只要LLM AI还基于传世佛魔原理,现在上限一眼望到头了

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

评分

参与人数 1战斗力 +1 收起 理由
条码人 + 1 传世佛魔好评

查看全部评分

回复

使用道具 举报

     
发表于 2026-6-10 17:17 | 显示全部楼层
除非能搞定国产卡训练,一年时间取代cuda 太乐观了吧。

当然还有另一种可能是美国嗷一声变身新美国。
回复

使用道具 举报

     
发表于 2026-6-10 17:18 来自手机 | 显示全部楼层
如果A/新模型卖的好,算力持续紧张的话,opus5.0有望达到deepseek v4 pro的智力水平

—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-10 17:22 来自手机 | 显示全部楼层
你是说成本百分之一的opus 4.8么
回复

使用道具 举报

     
发表于 2026-6-10 17:22 来自手机 | 显示全部楼层
精钢魔像 发表于 2026-6-10 17:17
除非能搞定国产卡训练,一年时间取代cuda 太乐观了吧。

当然还有另一种可能是美国嗷一声变身新美国。

一年内取代cuda不可能,但一年后达到opus4.8水平可太容易了
说实话4.8自己真能比得上年初的4.6吗?

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-10 17:36 | 显示全部楼层
别说4.8了,最多六个月就有5 fabel的水平了
梁圣赶紧端上来吧
回复

使用道具 举报

     
发表于 2026-6-10 17:41 来自手机 | 显示全部楼层
做题能力肯定能追上,工程能力不好说
回复

使用道具 举报

     
发表于 2026-6-10 17:44 | 显示全部楼层
这几家模型之所以强,因为纳入了harness客户端的训练数据,也就是长承工程能力有了数据训练。

当务之急,ds要有自己的agent软件,不然后训练也就是这样了。

回复

使用道具 举报

     
发表于 2026-6-10 19:01 | 显示全部楼层
现在4.6和弱智一样了?比5.5查几个等级了?
回复

使用道具 举报

     
发表于 2026-6-10 19:09 | 显示全部楼层
fable 5估计参数估计10T以上,这么大的模型,估计就没几个人用得起
回复

使用道具 举报

     
发表于 2026-6-10 19:41 来自手机 | 显示全部楼层
精钢魔像 发表于 2026-6-10 17:17
除非能搞定国产卡训练,一年时间取代cuda 太乐观了吧。

当然还有另一种可能是美国嗷一声变身新美国。

我愣是没找到哪句话在说取代cuda的

—— 来自 Xiaomi 2304FPN6DC, Android 13, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-6-10 19:46 | 显示全部楼层
更担心明年今天能不能用上opus 4.8水平的opus 4.8
回复

使用道具 举报

     
发表于 2026-6-10 19:46 | 显示全部楼层
说到cuda,我的判断是啥时候a处顶级ai能自己造自己的前端工具给我用了,能重新cuda摆脱英伟达了,啥时候就是真agi了。不然吹了半天不都是大号玩具

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-6-10 20:15 | 显示全部楼层
本帖最后由 mirari 于 2026-6-10 20:23 编辑

悲观角度说,像a畜这种,就完全是走向赛博朋克的路线。这个价格已经完全不是普通人能承受的了。
按这个趋势发展下去就是穷人只能用低级AI,完全打不过有钱人,除非加入大公司,就可以享受公司的高级AI配置。但这只是借用,离开公司屁都不是。还有大量黑市兜售来历不明的AI资源,也非常容易买到假货。
得亏这个世界还有DeepSeek这种穷人救星
回复

使用道具 举报

发表于 2026-6-10 20:23 来自手机 | 显示全部楼层
根据 Anthropic 的一贯水平,我看大概率是OPUS 降智到 Deepseek 的水平。然后 Deepseek 超越 Opus。。
回复

使用道具 举报

     
发表于 2026-6-10 20:35 来自手机 | 显示全部楼层
本帖最后由 半江瑟瑟半江红 于 2026-6-10 20:36 编辑
mirari 发表于 2026-6-10 20:15
悲观角度说,像a畜这种,就完全是走向赛博朋克的路线。这个价格已经完全不是普通人能承受的了。
按这个趋势 ...

问题是claude也没超级到哪去,到底是claude强还是claudecode强,真不好说
A畜的玩意我没用过,gpt5.5搭配codex在coding工作中确实牛逼,但coding以外就……也不能说不强,但没有和deepseek、glm拉开什么决定性差距,只能说一个月二十刀的plus订阅还算挺划算的

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-6-12 12:52 来自手机 | 显示全部楼层
chronicle 发表于 2026-6-10 17:44
这几家模型之所以强,因为纳入了harness客户端的训练数据,也就是长承工程能力有了数据训练。

当务之急,d ...

如果ds做了自己的agent软件,它还能保持现在这样,api几乎不审查的状态吗?
回复

使用道具 举报

     
发表于 2026-6-12 12:57 | 显示全部楼层
mirari 发表于 2026-6-10 20:15
悲观角度说,像a畜这种,就完全是走向赛博朋克的路线。这个价格已经完全不是普通人能承受的了。
按这个趋势 ...

“来路不明的ai”这不是现在各类中转站嘛
回复

使用道具 举报

     
发表于 2026-6-12 13:01 | 显示全部楼层
按说应该会是 Fable 5
回复

使用道具 举报

发表于 2026-6-12 13:05 来自手机 | 显示全部楼层
现在dpsk就有4.8水平啊,只是还赶不上4.6
回复

使用道具 举报

发表于 2026-6-12 13:11 | 显示全部楼层
不懂就问 前几个月claude code的源代码不是泄露了吗 这里面没有提取出些什么agent的功法吗
回复

使用道具 举报

     
发表于 2026-6-12 13:28 来自手机 | 显示全部楼层
精钢魔像 发表于 2026-6-10 17:17
除非能搞定国产卡训练,一年时间取代cuda 太乐观了吧。

当然还有另一种可能是美国嗷一声变身新美国。

现在DS官方的推理已经全面去CUDA化了,官方开源的CUDA代码根本就是错的。
在这个基础上官方价格基本上只有国外托管的三分之一

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
回复

使用道具 举报

     
发表于 2026-6-12 13:34 | 显示全部楼层
ダンボール戦車 发表于 2026-6-12 13:11
不懂就问 前几个月claude code的源代码不是泄露了吗 这里面没有提取出些什么agent的功法吗 ...

当时就说了,只有代码,没有策略

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-6-12 14:28 来自手机 | 显示全部楼层
goranger 发表于 2026-6-10 19:46
说到cuda,我的判断是啥时候a处顶级ai能自己造自己的前端工具给我用了,能重新cuda摆脱英伟达了,啥时候就 ...

真agi了怕不是机器人翻身做主人
回复

使用道具 举报

     
发表于 2026-6-12 14:33 | 显示全部楼层
ycjiang1337 发表于 2026-6-12 13:28
现在DS官方的推理已经全面去CUDA化了,官方开源的CUDA代码根本就是错的。
在这个基础上官方价格基本上只 ...

训练还要啊
回复

使用道具 举报

     
发表于 2026-6-12 14:37 | 显示全部楼层
现在harness 这部分反而更重要吧,虽然claude模型能力可能更好一点,但是codex的使用太舒服了基本不想用其他的工具了
回复

使用道具 举报

     
发表于 2026-6-12 14:39 | 显示全部楼层
不太可能,但是你聊deepseek没办法脱离价格
回复

使用道具 举报

     
发表于 2026-6-12 14:39 | 显示全部楼层
你指望GLM可能更现实点
回复

使用道具 举报

     
发表于 2026-6-12 14:43 | 显示全部楼层
ds现在不还是sonnet水平吗?一年能到fable?
回复

使用道具 举报

     
发表于 2026-6-12 15:16 | 显示全部楼层
老实说我觉得ds现在已经和sonnet4.6差不多了,一年后如果能达到opus4.6水平对于95%的场景都足足够用了,更何况性价比完全两个极端
回复

使用道具 举报

     
发表于 2026-6-12 15:23 来自手机 | 显示全部楼层
我最近在写一个ai外呼系统,用的都是现成的开源项目。但是codex额度用完了之后,接下来一天用的是ds,说实话那一整天项目没有任何进展,卡点在codex额度恢复之后一轮就解决了。

所以以我的体验来看差距确实很大。可以翻我发帖记录,我不是喜欢唱衰的人。
回复

使用道具 举报

     
发表于 2026-6-12 15:36 来自手机 | 显示全部楼层
精钢魔像 发表于 2026-6-10 17:17
除非能搞定国产卡训练,一年时间取代cuda 太乐观了吧。

当然还有另一种可能是美国嗷一声变身新美国。

这楼里也没人提到cuda怎么就自己给自己加戏了

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-12 15:37 | 显示全部楼层
不知 发表于 2026-6-12 15:23
我最近在写一个ai外呼系统,用的都是现成的开源项目。但是codex额度用完了之后,接下来一天用的是ds,说实 ...

国内大模型编程感觉还是得GLM。
回复

使用道具 举报

     
发表于 2026-6-12 15:38 来自手机 | 显示全部楼层
从4.6到4.8,在harness上是挺明显能感觉到进步的,在模型智力上嘛,我不好说

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-12 15:59 来自手机 | 显示全部楼层

950DT提前到8月出货了,另外推理全面转移之后N卡就可以都集中到训练上

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha
回复

使用道具 举报

发表于 2026-6-12 17:37 | 显示全部楼层
本帖最后由 有鱼 于 2026-6-12 17:39 编辑

建议看看codex和claude code的更新速度
ds现在最大的问题是没有官方的coding harness
我个人感觉现在的大模型完全就是后训练做了啥啥就牛逼,再搭配上合适的harness效果直接拉开几个台阶
ds明显后训练没跟上,估计是资源不够,不能像o/a两家高速迭代小版本
对于有需求的大厂可能ds反而是更合适的agent发动机,廉价,还能本地部署。
对于个人用户你要在ds的基础上接近o/a两家订阅服务的使用体验还是挺难的。
回复

使用道具 举报

发表于 2026-6-12 17:40 | 显示全部楼层
当然就mythos——fable这一串炒作,你说a\还多有活我是不信的
我个人觉得北美御三家还是closedAI更强,哈基米和谷歌现在来看志不在此。
回复

使用道具 举报

     
发表于 2026-6-12 20:58 来自手机 | 显示全部楼层
chronicle 发表于 2026-6-10 17:44
这几家模型之所以强,因为纳入了harness客户端的训练数据,也就是长承工程能力有了数据训练。

当务之急,d ...

所以dsv4一直在OpenCode里面收集数据。我觉得后面大概率也是继续抢开源coding agent这一块。
回复

使用道具 举报

     
发表于 2026-6-13 12:55 来自手机 | 显示全部楼层
本帖最后由 木谷高明 于 2026-6-13 13:00 编辑

大型项目用不用harness,相同模型能干出一代的差距。opus 4.8有人觉得比4.6降智了,有人觉得指令遵从性更好了,这也是未来的取舍。

代码之外的能力,人类数据可炼的也没剩多少了吧。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-24 11:02 , Processed in 0.317752 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表