ayanamilin 发表于 2026-4-24 16:39
还有集美拿Opus 4.7玩酒馆(是不是中转站不清楚),每月开销几千人民币的呢 ...
我也用过openrouter的opus4.5的api,那钱和流水一样,实在不是可接受的价格。如果deepseek的PRO能到1/6左右,我感觉还不错
代码能力如何?我kimi正好要充值了……还可以的话我换成v4pro
还是再等2天?
怎么感觉调用MCP的能力变差了
真红之闪电 发表于 2026-4-24 17:12
代码能力如何?我kimi正好要充值了……还可以的话我换成v4pro
还是再等2天? ...
如果你的工作流里要调用MCP或者Skill的最好再等一等
ayanamilin 发表于 2026-4-24 15:15
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间,很大一部分原因就是要跟华子做适配 ...
不是哦,原计划年前的,当时都准备好了,都已经定了日子。后来不知道什么原因又取消了,主要是知道的都有保密条例不会说。估计是梁文锋还想要更好的效果吧。 Re:Source
发呆的龙虾 发表于 2026-4-24 17:07
我都是自己写的提示词,没用酒馆预设。
—— 来自 HUAWEI BRA-AL00, Android 12, 鹅球 v3.5.99 ...
就是后训练问题,基模训练完了,后训练等待慢慢完善,或者要用更强力规范的系统提示词教会它怎么做
试了下海猫里面一刀将蛋糕切成八份的题,答不出来
明白了——不附带任何前提条件,那么可以跳出物理限制或日常常识,去考虑**文字游戏**或**极端巧解**。
最经典的“一刀切八块”脑筋急转弯答案是:
> **先把蛋糕切成四块(这四块可以用手掰开,也可以用线切割,但不算“用刀切”),然后把四块叠成一摞,再用刀从上到下切一刀。这样一刀下去,四块同时被切成两半,总共得到八块。**
也就是说:
- 真正“用刀”的动作只有一次。
- 预先将蛋糕分成四份的手段,不算“切”(比如手撕、借助其他工具、蛋糕本来就是分体的)。
如果你坚持“不允许任何预先分割”,那么数学上**绝对不可能**:
- 一个连续的物体被一个平面切割一次,只能分成 **2 块**,永远不会变成 8 块。
所以这道题的关键不是几何,而是**对“切”的定义**——只要允许“非刀切割”的预分块,就能实现一刀八块。
zy450 发表于 2026-4-24 15:39
最近人员变动比较大,希望不要影响DS后续研发
你去看tech report后面,就几个标了*的,谈不上变动大 Re:Source
A畜这几天八成又要破防,搞抹黑和封锁动作,毕竟真挡财路了。
gemini出道天下无敌,现在变成小树林急急而奔。
AI 的迭代速度实在太快了。
本帖最后由 zris 于 2026-4-24 17:43 编辑
说起来想要玩AIRP可以关注下一个专门拿DS训练的aion labs
他家那个训练的V3.2玩airp简直无敌,遵循格式,比claude还牛逼
开源SOTA应该算不得夸张说法,但是agent能力还是挂个问号,不管怎么说追上来就好,也相信下个版本会更猛,现阶段我可能会codex+gpt5.5和ClaudeCode+K2.6/V4/Mimo2.5混用
Surlert 发表于 2026-4-24 17:33
A畜这几天八成又要破防,搞抹黑和封锁动作,毕竟真挡财路了。
a 畜这几天还在被奥特曼上眼药呢
奥柏伦亲王 发表于 2026-4-24 17:40
开源SOTA应该算不得夸张说法,但是agent能力还是挂个问号,不管怎么说追上来就好,也相信下个版本会更猛, ...
gpt5 靠后训练也救回来了,ds4 肯定也行。等正式版吧,智力底子在还是好说
等着pro什么时候价格能下来,今天没时间就只以前的提示词各试了一段续写,flash惨不忍睹,理解力和文笔比之前都倒退了。
flash API是还不稳定,我roll出来最好的一段是在思考链里面藏着
—— 来自 鹅球 v3.5.99
写文推荐用seed 2.0 pro过度下,纯网文大侠
stanzgy 发表于 2026-4-24 16:47
瞄了眼 /r/localllama 全是ds v4和 qwen 3.6。ds啥都好就是模型太大了很难本地部署。
论坛助手,iPhone ...
我现在就挺期待qwen3.6-deepseekv4-distilled
肯定会有 期待比opus distilled强
—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99
我看了几个测评,感觉和gpt5 opus有很大差距,
可以算超级性价比版的glm5吧
用v4p接入cc干活了一下午,花了我二十几块钱
—— 来自 nubia NX809J, Android 16, 鹅球 v3.5.99-alpha
华子的昇腾应该就没准备做类似cuda生态,之前的卡特性都很老,fp8和fp16的混合精度支持都有问题
ayanamilin 发表于 2026-4-24 16:39
还有集美拿Opus 4.7玩酒馆(是不是中转站不清楚),每月开销几千人民币的呢 ...
酒馆用硅基的glm5一次对话都干掉一块钱
我看实际上不如cherry的知识库
—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事
tk553521 发表于 2026-4-24 18:34
用v4p接入cc干活了一下午,花了我二十几块钱
—— 来自 nubia NX809J, Android 16, 鹅球 v3.5.99-alpha ...
我已经改回v4flash了,感觉差不多,思考速度还快了不少
Rowen233 发表于 2026-4-24 19:03
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事 ...
这种级别的模型个人电脑跑不起来的。
走来走去 发表于 2026-4-24 17:14
不是哦,原计划年前的,当时都准备好了,都已经定了日子。后来不知道什么原因又取消了,主要是知道的都有 ...
你可以看下 vllm-ascend 做适配的代码分支创建时间以及代码量,dsv4是在0.13上做适配的。昇腾推理引擎的适配最早不会早于一月份。
我之前掌握的信息也是ds在年前就把模型训练好了,并且把架构交到了华子的手上,后面的时间都是华子还有别的厂商在做适配。你可以翻翻我在这栋楼里的历史发言。
—— 来自 S1Fun
本帖最后由 Rowen233 于 2026-4-24 19:18 编辑
huidh123 发表于 2026-4-24 19:06
这种级别的模型个人电脑跑不起来的。
flash倒是已经有MLX的量化版了就是只能512GB的Mac Studio跑
但目前好像没搜到有人成功部署
Rowen233 发表于 2026-4-24 19:03
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事 ...
在写文章批判笔电难大,勿扰。
ayanamilin 发表于 2026-4-24 19:13
你可以看下 vllm-ascend 做适配的代码分支创建时间以及代码量,dsv4是在0.13上做适配的。昇腾推理引擎的 ...
早期版本可能,训完不太可能,后面都能明显看到web端的模型在变。后训练肯定一直在进行 Re:Source
糟糕喵 发表于 2026-4-24 15:49
网络上显然有这种讨论就自然收录进去了。
这也太吓人了,万一接入了agent…
—— 来自 S1Fun
又用了会flash,感觉这个东西是真正的强大,速度无敌快,还很便宜
就这样吧,复杂的还得是opus
Rowen233 发表于 2026-4-24 19:03
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事 ...
这不是很显然么,dsv4 pro 1T以上的参数,得多少内存啊…..这得多少台mac组集群
论坛助手,iPhone
Rowen233 发表于 2026-4-24 19:03
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事 ...
你不该先反省一下为什么会刷到这种弱智发的内容?
本帖最后由 绝地潜兵 于 2026-4-24 20:04 编辑
reasoning_effort
string
Possible values:
控制模型的推理强度。对普通请求,默认为 high。对一些复杂 Agent 类请求(如 Claude Code、OpenCode),自动设置为 max。出于兼容考虑 low、medium 会映射为 high, xhigh 会映射为 max。
嗨呀,Chatbox没有调整reasoning_effort的地方
这下得换到CherryStudio了……