明年今天，能不能用上opus 4.8水平的deepseek？

闪雷可达鸭 发表于 2026-6-10 17:13

Mythos还是太贵了，蹬了几下就直接干没5小时额度。

而且两周后就不享受code plan，要自己花钱买api。
A/还专门给同行挖坑，没法用Mythos进行LLM研究。
感觉ai进步真是一周一个样。
那明年今天，能不能用上opus 4.8水平的deepseek？

半江瑟瑟半江红 发表于 2026-6-10 17:16

可以参考去年嘛，现在一般认为⏰和美国LLM AI差距在5个月左右
只要LLM AI还基于传世佛魔原理，现在上限一眼望到头了

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

精钢魔像 发表于 2026-6-10 17:17

除非能搞定国产卡训练，一年时间取代cuda 太乐观了吧。

当然还有另一种可能是美国嗷一声变身新美国。

oswald 发表于 2026-6-10 17:18

如果A/新模型卖的好，算力持续紧张的话，opus5.0有望达到deepseek v4 pro的智力水平

—— 来自 Xiaomi 2410DPN6CC, Android 16, 鹅球 v3.5.99

wjxforever 发表于 2026-6-10 17:22

你是说成本百分之一的opus 4.8么

半江瑟瑟半江红 发表于 2026-6-10 17:22

精钢魔像发表于 2026-6-10 17:17
除非能搞定国产卡训练，一年时间取代cuda 太乐观了吧。

当然还有另一种可能是美国嗷一声变身新美国。

一年内取代cuda不可能，但一年后达到opus4.8水平可太容易了
说实话4.8自己真能比得上年初的4.6吗？

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

ymm1030 发表于 2026-6-10 17:36

别说4.8了，最多六个月就有5 fabel的水平了
梁圣赶紧端上来吧

很久就在那边l 发表于 2026-6-10 17:41

做题能力肯定能追上，工程能力不好说

chronicle 发表于 2026-6-10 17:44

这几家模型之所以强，因为纳入了harness客户端的训练数据，也就是长承工程能力有了数据训练。

当务之急，ds要有自己的agent软件，不然后训练也就是这样了。

文字文字 发表于 2026-6-10 19:01

现在4.6和弱智一样了？比5.5查几个等级了？

drodchang 发表于 2026-6-10 19:09

fable 5估计参数估计10T以上，这么大的模型，估计就没几个人用得起

雪影发表于 2026-6-10 19:41

精钢魔像发表于 2026-6-10 17:17
除非能搞定国产卡训练，一年时间取代cuda 太乐观了吧。

当然还有另一种可能是美国嗷一声变身新美国。

我愣是没找到哪句话在说取代cuda的

—— 来自 Xiaomi 2304FPN6DC, Android 13, 鹅球 v3.5.99-alpha

Nez 发表于 2026-6-10 19:46

更担心明年今天能不能用上opus 4.8水平的opus 4.8

goranger 发表于 2026-6-10 19:46

说到cuda，我的判断是啥时候a处顶级ai能自己造自己的前端工具给我用了，能重新cuda摆脱英伟达了，啥时候就是真agi了。不然吹了半天不都是大号玩具

论坛助手,iPhone

mirari 发表于 2026-6-10 20:15

本帖最后由 mirari 于 2026-6-10 20:23 编辑

悲观角度说，像a畜这种，就完全是走向赛博朋克的路线。这个价格已经完全不是普通人能承受的了。
按这个趋势发展下去就是穷人只能用低级AI，完全打不过有钱人，除非加入大公司，就可以享受公司的高级AI配置。但这只是借用，离开公司屁都不是。还有大量黑市兜售来历不明的AI资源，也非常容易买到假货。
得亏这个世界还有DeepSeek这种穷人救星

larry1 发表于 2026-6-10 20:23

根据 Anthropic 的一贯水平，我看大概率是OPUS 降智到 Deepseek 的水平。然后 Deepseek 超越 Opus。。

半江瑟瑟半江红 发表于 2026-6-10 20:35

本帖最后由半江瑟瑟半江红于 2026-6-10 20:36 编辑

mirari 发表于 2026-6-10 20:15
悲观角度说，像a畜这种，就完全是走向赛博朋克的路线。这个价格已经完全不是普通人能承受的了。
按这个趋势 ...

问题是claude也没超级到哪去，到底是claude强还是claudecode强，真不好说
A畜的玩意我没用过，gpt5.5搭配codex在coding工作中确实牛逼，但coding以外就……也不能说不强，但没有和deepseek、glm拉开什么决定性差距，只能说一个月二十刀的plus订阅还算挺划算的

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

稻高一尺 发表于 2026-6-12 12:52

chronicle 发表于 2026-6-10 17:44
这几家模型之所以强，因为纳入了harness客户端的训练数据，也就是长承工程能力有了数据训练。

当务之急，d ...

如果ds做了自己的agent软件，它还能保持现在这样，api几乎不审查的状态吗？

jie2000 发表于 2026-6-12 12:57

mirari 发表于 2026-6-10 20:15
悲观角度说，像a畜这种，就完全是走向赛博朋克的路线。这个价格已经完全不是普通人能承受的了。
按这个趋势 ...

“来路不明的ai”这不是现在各类中转站嘛

80后卢瑟 发表于 2026-6-12 13:01

按说应该会是 Fable 5

朋友发表于 2026-6-12 13:05

现在dpsk就有4.8水平啊，只是还赶不上4.6

ダンボール戦車 发表于 2026-6-12 13:11

不懂就问前几个月claude code的源代码不是泄露了吗这里面没有提取出些什么agent的功法吗

ycjiang1337 发表于 2026-6-12 13:28

精钢魔像发表于 2026-6-10 17:17
除非能搞定国产卡训练，一年时间取代cuda 太乐观了吧。

当然还有另一种可能是美国嗷一声变身新美国。

现在DS官方的推理已经全面去CUDA化了，官方开源的CUDA代码根本就是错的。
在这个基础上官方价格基本上只有国外托管的三分之一

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

真红之闪电 发表于 2026-6-12 13:34

ダンボール戦車发表于 2026-6-12 13:11
不懂就问前几个月claude code的源代码不是泄露了吗这里面没有提取出些什么agent的功法吗 ...

当时就说了，只有代码，没有策略

—— 来自 S1Fun

catox 发表于 2026-6-12 14:28

精钢魔像 发表于 2026-6-12 14:33

ycjiang1337 发表于 2026-6-12 13:28
现在DS官方的推理已经全面去CUDA化了，官方开源的CUDA代码根本就是错的。
在这个基础上官方价格基本上只 ...

训练还要啊

zypyong 发表于 2026-6-12 14:37

现在harness 这部分反而更重要吧，虽然claude模型能力可能更好一点，但是codex的使用太舒服了基本不想用其他的工具了

神必迷你龙 发表于 2026-6-12 14:39

不太可能，但是你聊deepseek没办法脱离价格

StarForceTi 发表于 2026-6-12 14:39

你指望GLM可能更现实点

GYSS_ 发表于 2026-6-12 14:43

ds现在不还是sonnet水平吗？一年能到fable？

raragon 发表于 2026-6-12 15:16

老实说我觉得ds现在已经和sonnet4.6差不多了，一年后如果能达到opus4.6水平对于95%的场景都足足够用了，更何况性价比完全两个极端

不知发表于 2026-6-12 15:23

我最近在写一个ai外呼系统，用的都是现成的开源项目。但是codex额度用完了之后，接下来一天用的是ds，说实话那一整天项目没有任何进展，卡点在codex额度恢复之后一轮就解决了。

所以以我的体验来看差距确实很大。可以翻我发帖记录，我不是喜欢唱衰的人。

StrangerJ 发表于 2026-6-12 15:36

精钢魔像发表于 2026-6-10 17:17
除非能搞定国产卡训练，一年时间取代cuda 太乐观了吧。

当然还有另一种可能是美国嗷一声变身新美国。

这楼里也没人提到cuda怎么就自己给自己加戏了

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99

yizi1 发表于 2026-6-12 15:37

不知发表于 2026-6-12 15:23
我最近在写一个ai外呼系统，用的都是现成的开源项目。但是codex额度用完了之后，接下来一天用的是ds，说实 ...

国内大模型编程感觉还是得GLM。

StrangerJ 发表于 2026-6-12 15:38

从4.6到4.8，在harness上是挺明显能感觉到进步的，在模型智力上嘛，我不好说

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99

ycjiang1337 发表于 2026-6-12 15:59

精钢魔像发表于 2026-6-12 14:33
训练还要啊

950DT提前到8月出货了，另外推理全面转移之后N卡就可以都集中到训练上

—— 来自 HUAWEI SGT-AL50, Android 12, 鹅球 v3.4.97-alpha

有鱼发表于 2026-6-12 17:37

有鱼发表于 2026-6-12 17:40

tylunas 发表于 2026-6-12 20:58

chronicle 发表于 2026-6-10 17:44
这几家模型之所以强，因为纳入了harness客户端的训练数据，也就是长承工程能力有了数据训练。

当务之急，d ...

所以dsv4一直在OpenCode里面收集数据。我觉得后面大概率也是继续抢开源coding agent这一块。

木谷高明 发表于 2026-6-13 12:55

本帖最后由木谷高明于 2026-6-13 13:00 编辑

大型项目用不用harness，相同模型能干出一代的差距。opus 4.8有人觉得比4.6降智了，有人觉得指令遵从性更好了，这也是未来的取舍。

代码之外的能力，人类数据可炼的也没剩多少了吧。

页: [1] 2

Stage1st's Archiver

明年今天，能不能用上opus 4.8水平的deepseek？