找回密码
 立即注册
搜索
楼主: 绕指流光

[科技] FT:DeepSeek下周发|已发,转为v4讨论楼

  [复制链接]
发表于 2026-4-24 17:09 | 显示全部楼层
chatbox我也在用,但是目前好像没找到调整reasoning_effort参数的方法
回复

使用道具 举报

     
发表于 2026-4-24 17:10 | 显示全部楼层
ayanamilin 发表于 2026-4-24 16:39
还有集美拿Opus 4.7玩酒馆(是不是中转站不清楚),每月开销几千人民币的呢 ...

我也用过openrouter的opus4.5的api,那钱和流水一样,实在不是可接受的价格。如果deepseek的PRO能到1/6左右,我感觉还不错
回复

使用道具 举报

     
发表于 2026-4-24 17:12 | 显示全部楼层
代码能力如何?我kimi正好要充值了……还可以的话我换成v4pro
还是再等2天?
回复

使用道具 举报

     
发表于 2026-4-24 17:13 | 显示全部楼层
怎么感觉调用MCP的能力变差了
回复

使用道具 举报

     
发表于 2026-4-24 17:13 | 显示全部楼层
真红之闪电 发表于 2026-4-24 17:12
代码能力如何?我kimi正好要充值了……还可以的话我换成v4pro
还是再等2天? ...

如果你的工作流里要调用MCP或者Skill的最好再等一等
回复

使用道具 举报

发表于 2026-4-24 17:14 | 显示全部楼层
ayanamilin 发表于 2026-4-24 15:15
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间,很大一部分原因就是要跟华子做适配 ...

不是哦,原计划年前的,当时都准备好了,都已经定了日子。后来不知道什么原因又取消了,主要是知道的都有保密条例不会说。估计是梁文锋还想要更好的效果吧。    Re:Source
回复

使用道具 举报

     
发表于 2026-4-24 17:19 | 显示全部楼层
发呆的龙虾 发表于 2026-4-24 17:07
我都是自己写的提示词,没用酒馆预设。

—— 来自 HUAWEI BRA-AL00, Android 12, 鹅球 v3.5.99 ...

就是后训练问题,基模训练完了,后训练等待慢慢完善,或者要用更强力规范的系统提示词教会它怎么做
回复

使用道具 举报

     
发表于 2026-4-24 17:23 | 显示全部楼层
试了下海猫里面一刀将蛋糕切成八份的题,答不出来
明白了——不附带任何前提条件,那么可以跳出物理限制或日常常识,去考虑**文字游戏**或**极端巧解**。  

最经典的“一刀切八块”脑筋急转弯答案是:  

> **先把蛋糕切成四块(这四块可以用手掰开,也可以用线切割,但不算“用刀切”),然后把四块叠成一摞,再用刀从上到下切一刀。这样一刀下去,四块同时被切成两半,总共得到八块。**

也就是说:  
- 真正“用刀”的动作只有一次。  
- 预先将蛋糕分成四份的手段,不算“切”(比如手撕、借助其他工具、蛋糕本来就是分体的)。  

如果你坚持“不允许任何预先分割”,那么数学上**绝对不可能**:  
- 一个连续的物体被一个平面切割一次,只能分成 **2 块**,永远不会变成 8 块。  

所以这道题的关键不是几何,而是**对“切”的定义**——只要允许“非刀切割”的预分块,就能实现一刀八块。
回复

使用道具 举报

发表于 2026-4-24 17:25 | 显示全部楼层
zy450 发表于 2026-4-24 15:39
最近人员变动比较大,希望不要影响DS后续研发

你去看tech report后面,就几个标了*的,谈不上变动大    Re:Source
回复

使用道具 举报

头像被屏蔽
发表于 2026-4-24 17:31 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-4-24 17:33 | 显示全部楼层
A畜这几天八成又要破防,搞抹黑和封锁动作,毕竟真挡财路了。
回复

使用道具 举报

头像被屏蔽
发表于 2026-4-24 17:35 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-4-24 17:38 | 显示全部楼层
本帖最后由 zris 于 2026-4-24 17:43 编辑

说起来想要玩AIRP可以关注下一个专门拿DS训练的aion labs

他家那个训练的V3.2玩airp简直无敌,遵循格式,比claude还牛逼
回复

使用道具 举报

     
发表于 2026-4-24 17:40 | 显示全部楼层
开源SOTA应该算不得夸张说法,但是agent能力还是挂个问号,不管怎么说追上来就好,也相信下个版本会更猛,现阶段我可能会codex+gpt5.5和ClaudeCode+K2.6/V4/Mimo2.5混用
回复

使用道具 举报

     
发表于 2026-4-24 17:41 | 显示全部楼层
Surlert 发表于 2026-4-24 17:33
A畜这几天八成又要破防,搞抹黑和封锁动作,毕竟真挡财路了。

a 畜这几天还在被奥特曼上眼药呢
回复

使用道具 举报

     
发表于 2026-4-24 17:43 | 显示全部楼层
奥柏伦亲王 发表于 2026-4-24 17:40
开源SOTA应该算不得夸张说法,但是agent能力还是挂个问号,不管怎么说追上来就好,也相信下个版本会更猛, ...

gpt5 靠后训练也救回来了,ds4 肯定也行。等正式版吧,智力底子在还是好说
回复

使用道具 举报

     
发表于 2026-4-24 17:49 来自手机 | 显示全部楼层
等着pro什么时候价格能下来,今天没时间就只以前的提示词各试了一段续写,flash惨不忍睹,理解力和文笔比之前都倒退了。
回复

使用道具 举报

发表于 2026-4-24 17:52 来自手机 | 显示全部楼层
flash API是还不稳定,我roll出来最好的一段是在思考链里面藏着

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 17:57 | 显示全部楼层
写文推荐用seed 2.0 pro过度下,纯网文大侠
回复

使用道具 举报

     
发表于 2026-4-24 18:05 来自手机 | 显示全部楼层
stanzgy 发表于 2026-4-24 16:47
瞄了眼 /r/localllama 全是ds v4和 qwen 3.6。ds啥都好就是模型太大了很难本地部署。

论坛助手,iPhone ...

我现在就挺期待qwen3.6-deepseekv4-distilled
肯定会有 期待比opus distilled强

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 18:16 来自手机 | 显示全部楼层
我看了几个测评,感觉和gpt5 opus有很大差距,
可以算超级性价比版的glm5吧
回复

使用道具 举报

     
发表于 2026-4-24 18:34 来自手机 | 显示全部楼层
用v4p接入cc干活了一下午,花了我二十几块钱

—— 来自 nubia NX809J, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-4-24 18:58 | 显示全部楼层
华子的昇腾应该就没准备做类似cuda生态,之前的卡特性都很老,fp8和fp16的混合精度支持都有问题
回复

使用道具 举报

     
发表于 2026-4-24 19:01 来自手机 | 显示全部楼层
ayanamilin 发表于 2026-4-24 16:39
还有集美拿Opus 4.7玩酒馆(是不是中转站不清楚),每月开销几千人民币的呢 ...

酒馆用硅基的glm5一次对话都干掉一块钱
我看实际上不如cherry的知识库

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 19:03 来自手机 | 显示全部楼层
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事
回复

使用道具 举报

     
发表于 2026-4-24 19:04 | 显示全部楼层
tk553521 发表于 2026-4-24 18:34
用v4p接入cc干活了一下午,花了我二十几块钱

—— 来自 nubia NX809J, Android 16, 鹅球 v3.5.99-alpha ...

我已经改回v4flash了,感觉差不多,思考速度还快了不少
回复

使用道具 举报

     
发表于 2026-4-24 19:06 来自手机 | 显示全部楼层
Rowen233 发表于 2026-4-24 19:03
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事 ...

这种级别的模型个人电脑跑不起来的。
回复

使用道具 举报

发表于 2026-4-24 19:12 | 显示全部楼层
v4flash感觉拉满reasoning_effort之后聪明不少

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-24 19:13 | 显示全部楼层
走来走去 发表于 2026-4-24 17:14
不是哦,原计划年前的,当时都准备好了,都已经定了日子。后来不知道什么原因又取消了,主要是知道的都有 ...

你可以看下 vllm-ascend 做适配的代码分支创建时间以及代码量,dsv4是在0.13上做适配的。昇腾推理引擎的适配最早不会早于一月份。

我之前掌握的信息也是ds在年前就把模型训练好了,并且把架构交到了华子的手上,后面的时间都是华子还有别的厂商在做适配。你可以翻翻我在这栋楼里的历史发言。

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-4-24 19:15 | 显示全部楼层
本帖最后由 Rowen233 于 2026-4-24 19:18 编辑
huidh123 发表于 2026-4-24 19:06
这种级别的模型个人电脑跑不起来的。

flash倒是已经有MLX的量化版了就是只能512GB的Mac Studio跑
但目前好像没搜到有人成功部署
回复

使用道具 举报

头像被屏蔽
发表于 2026-4-24 19:16 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2026-4-24 19:17 | 显示全部楼层
ayanamilin 发表于 2026-4-24 19:13
你可以看下 vllm-ascend 做适配的代码分支创建时间以及代码量,dsv4是在0.13上做适配的。昇腾推理引擎的 ...

早期版本可能,训完不太可能,后面都能明显看到web端的模型在变。后训练肯定一直在进行    Re:Source
回复

使用道具 举报

     
发表于 2026-4-24 19:29 | 显示全部楼层
糟糕喵 发表于 2026-4-24 15:49
网络上显然有这种讨论就自然收录进去了。

这也太吓人了,万一接入了agent…

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-4-24 19:31 | 显示全部楼层
又用了会flash,感觉这个东西是真正的强大,速度无敌快,还很便宜
回复

使用道具 举报

发表于 2026-4-24 19:45 | 显示全部楼层
flash是对的,而且用起来感觉比gemini的flash/gpt的instant强多了

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-24 19:48 | 显示全部楼层
就这样吧,复杂的还得是opus
回复

使用道具 举报

     
发表于 2026-4-24 19:53 | 显示全部楼层
Rowen233 发表于 2026-4-24 19:03
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事 ...

这不是很显然么,dsv4 pro 1T以上的参数,得多少内存啊…..这得多少台mac组集群

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-24 19:54 | 显示全部楼层
Rowen233 发表于 2026-4-24 19:03
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事 ...

你不该先反省一下为什么会刷到这种弱智发的内容?
回复

使用道具 举报

发表于 2026-4-24 19:58 | 显示全部楼层
本帖最后由 绝地潜兵 于 2026-4-24 20:04 编辑
reasoning_effort
string
Possible values: [high, max]

控制模型的推理强度。对普通请求,默认为 high。对一些复杂 Agent 类请求(如 Claude Code、OpenCode),自动设置为 max。出于兼容考虑 low、medium 会映射为 high, xhigh 会映射为 max。

嗨呀,Chatbox没有调整reasoning_effort的地方
这下得换到CherryStudio了……
回复

使用道具 举报

发表于 2026-4-24 20:05 | 显示全部楼层
绝地潜兵 发表于 2026-4-24 19:58
嗨呀,Chatbox没有调整reasoning_effort的地方
这下得换到CherryStudio了……

cherry studio可以通过自定义参数改,可惜ios上好像没有

论坛助手,iPhone
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-18 23:17 , Processed in 0.185632 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表