明年今天,能不能用上opus 4.8水平的deepseek?
Mythos还是太贵了,蹬了几下就直接干没5小时额度。而且两周后就不享受code plan,要自己花钱买api。
A/还专门给同行挖坑,没法用Mythos进行LLM研究。
感觉ai进步真是一周一个样。
那明年今天,能不能用上opus 4.8水平的deepseek?
可以参考去年嘛,现在一般认为⏰和美国LLM AI差距在5个月左右
只要LLM AI还基于传世佛魔原理,现在上限一眼望到头了
—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99 除非能搞定国产卡训练,一年时间取代cuda 太乐观了吧。
当然还有另一种可能是美国嗷一声变身新美国。
如果A/新模型卖的好,算力持续紧张的话,opus5.0有望达到deepseek v4 pro的智力水平
—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v3.5.99 你是说成本百分之一的opus 4.8么 精钢魔像 发表于 2026-6-10 17:17
除非能搞定国产卡训练,一年时间取代cuda 太乐观了吧。
当然还有另一种可能是美国嗷一声变身新美国。
一年内取代cuda不可能,但一年后达到opus4.8水平可太容易了
说实话4.8自己真能比得上年初的4.6吗?
—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99 别说4.8了,最多六个月就有5 fabel的水平了
梁圣赶紧端上来吧 做题能力肯定能追上,工程能力不好说 这几家模型之所以强,因为纳入了harness客户端的训练数据,也就是长承工程能力有了数据训练。
当务之急,ds要有自己的agent软件,不然后训练也就是这样了。
现在4.6和弱智一样了?比5.5查几个等级了? fable 5估计参数估计10T以上,这么大的模型,估计就没几个人用得起 精钢魔像 发表于 2026-6-10 17:17
除非能搞定国产卡训练,一年时间取代cuda 太乐观了吧。
当然还有另一种可能是美国嗷一声变身新美国。
我愣是没找到哪句话在说取代cuda的
—— 来自 Xiaomi 2304FPN6DC, Android 13, 鹅球 v3.5.99-alpha 更担心明年今天能不能用上opus 4.8水平的opus 4.8 说到cuda,我的判断是啥时候a处顶级ai能自己造自己的前端工具给我用了,能重新cuda摆脱英伟达了,啥时候就是真agi了。不然吹了半天不都是大号玩具
论坛助手,iPhone 本帖最后由 mirari 于 2026-6-10 20:23 编辑
悲观角度说,像a畜这种,就完全是走向赛博朋克的路线。这个价格已经完全不是普通人能承受的了。
按这个趋势发展下去就是穷人只能用低级AI,完全打不过有钱人,除非加入大公司,就可以享受公司的高级AI配置。但这只是借用,离开公司屁都不是。还有大量黑市兜售来历不明的AI资源,也非常容易买到假货。
得亏这个世界还有DeepSeek这种穷人救星
根据 Anthropic 的一贯水平,我看大概率是OPUS 降智到 Deepseek 的水平。然后 Deepseek 超越 Opus。。 本帖最后由 半江瑟瑟半江红 于 2026-6-10 20:36 编辑
mirari 发表于 2026-6-10 20:15
悲观角度说,像a畜这种,就完全是走向赛博朋克的路线。这个价格已经完全不是普通人能承受的了。
按这个趋势 ...
问题是claude也没超级到哪去,到底是claude强还是claudecode强,真不好说
A畜的玩意我没用过,gpt5.5搭配codex在coding工作中确实牛逼,但coding以外就……也不能说不强,但没有和deepseek、glm拉开什么决定性差距,只能说一个月二十刀的plus订阅还算挺划算的
—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99 chronicle 发表于 2026-6-10 17:44
这几家模型之所以强,因为纳入了harness客户端的训练数据,也就是长承工程能力有了数据训练。
当务之急,d ...
如果ds做了自己的agent软件,它还能保持现在这样,api几乎不审查的状态吗? mirari 发表于 2026-6-10 20:15
悲观角度说,像a畜这种,就完全是走向赛博朋克的路线。这个价格已经完全不是普通人能承受的了。
按这个趋势 ...
“来路不明的ai”这不是现在各类中转站嘛 按说应该会是 Fable 5 现在dpsk就有4.8水平啊,只是还赶不上4.6 不懂就问 前几个月claude code的源代码不是泄露了吗 这里面没有提取出些什么agent的功法吗 精钢魔像 发表于 2026-6-10 17:17
除非能搞定国产卡训练,一年时间取代cuda 太乐观了吧。
当然还有另一种可能是美国嗷一声变身新美国。
现在DS官方的推理已经全面去CUDA化了,官方开源的CUDA代码根本就是错的。
在这个基础上官方价格基本上只有国外托管的三分之一
—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha ダンボール戦車 发表于 2026-6-12 13:11
不懂就问 前几个月claude code的源代码不是泄露了吗 这里面没有提取出些什么agent的功法吗 ...
当时就说了,只有代码,没有策略
—— 来自 S1Fun ycjiang1337 发表于 2026-6-12 13:28
现在DS官方的推理已经全面去CUDA化了,官方开源的CUDA代码根本就是错的。
在这个基础上官方价格基本上只 ...
训练还要啊 现在harness 这部分反而更重要吧,虽然claude模型能力可能更好一点,但是codex的使用太舒服了基本不想用其他的工具了 不太可能,但是你聊deepseek没办法脱离价格 你指望GLM可能更现实点 ds现在不还是sonnet水平吗?一年能到fable? 老实说我觉得ds现在已经和sonnet4.6差不多了,一年后如果能达到opus4.6水平对于95%的场景都足足够用了,更何况性价比完全两个极端 我最近在写一个ai外呼系统,用的都是现成的开源项目。但是codex额度用完了之后,接下来一天用的是ds,说实话那一整天项目没有任何进展,卡点在codex额度恢复之后一轮就解决了。
所以以我的体验来看差距确实很大。可以翻我发帖记录,我不是喜欢唱衰的人。 精钢魔像 发表于 2026-6-10 17:17
除非能搞定国产卡训练,一年时间取代cuda 太乐观了吧。
当然还有另一种可能是美国嗷一声变身新美国。
这楼里也没人提到cuda怎么就自己给自己加戏了
—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99 不知 发表于 2026-6-12 15:23
我最近在写一个ai外呼系统,用的都是现成的开源项目。但是codex额度用完了之后,接下来一天用的是ds,说实 ...
国内大模型编程感觉还是得GLM。 从4.6到4.8,在harness上是挺明显能感觉到进步的,在模型智力上嘛,我不好说
—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99 精钢魔像 发表于 2026-6-12 14:33
训练还要啊
950DT提前到8月出货了,另外推理全面转移之后N卡就可以都集中到训练上
—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha chronicle 发表于 2026-6-10 17:44
这几家模型之所以强,因为纳入了harness客户端的训练数据,也就是长承工程能力有了数据训练。
当务之急,d ...
所以dsv4一直在OpenCode里面收集数据。我觉得后面大概率也是继续抢开源coding agent这一块。 本帖最后由 木谷高明 于 2026-6-13 13:00 编辑
大型项目用不用harness,相同模型能干出一代的差距。opus 4.8有人觉得比4.6降智了,有人觉得指令遵从性更好了,这也是未来的取舍。
代码之外的能力,人类数据可炼的也没剩多少了吧。
页:
[1]
2