FT：DeepSeek下周发｜已发，转为v4讨论楼 - 第24页 - 归墟 - Stage1st

有鱼发表于 2026-4-24 17:09

ytrfegd 发表于 2026-4-24 17:10

ayanamilin 发表于 2026-4-24 16:39
还有集美拿Opus 4.7玩酒馆（是不是中转站不清楚），每月开销几千人民币的呢 ...

我也用过openrouter的opus4.5的api，那钱和流水一样，实在不是可接受的价格。如果deepseek的PRO能到1/6左右，我感觉还不错

真红之闪电 发表于 2026-4-24 17:12

代码能力如何？我kimi正好要充值了……还可以的话我换成v4pro
还是再等2天？

Rowen233 发表于 2026-4-24 17:13

怎么感觉调用MCP的能力变差了

Rowen233 发表于 2026-4-24 17:13

真红之闪电发表于 2026-4-24 17:12
代码能力如何？我kimi正好要充值了……还可以的话我换成v4pro
还是再等2天？ ...

如果你的工作流里要调用MCP或者Skill的最好再等一等

走来走去 发表于 2026-4-24 17:14

ayanamilin 发表于 2026-4-24 15:15
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间，很大一部分原因就是要跟华子做适配 ...

不是哦，原计划年前的，当时都准备好了，都已经定了日子。后来不知道什么原因又取消了，主要是知道的都有保密条例不会说。估计是梁文锋还想要更好的效果吧。 Re:Source

秦南心 发表于 2026-4-24 17:19

发呆的龙虾发表于 2026-4-24 17:07
我都是自己写的提示词，没用酒馆预设。

—— 来自 HUAWEI BRA-AL00, Android 12, 鹅球 v3.5.99 ...

就是后训练问题，基模训练完了，后训练等待慢慢完善，或者要用更强力规范的系统提示词教会它怎么做

fengcheng 发表于 2026-4-24 17:23

试了下海猫里面一刀将蛋糕切成八份的题，答不出来
明白了——不附带任何前提条件，那么可以跳出物理限制或日常常识，去考虑**文字游戏**或**极端巧解**。

最经典的“一刀切八块”脑筋急转弯答案是：

> **先把蛋糕切成四块（这四块可以用手掰开，也可以用线切割，但不算“用刀切”），然后把四块叠成一摞，再用刀从上到下切一刀。这样一刀下去，四块同时被切成两半，总共得到八块。**

也就是说：
- 真正“用刀”的动作只有一次。
- 预先将蛋糕分成四份的手段，不算“切”（比如手撕、借助其他工具、蛋糕本来就是分体的）。

如果你坚持“不允许任何预先分割”，那么数学上**绝对不可能**：
- 一个连续的物体被一个平面切割一次，只能分成 **2 块**，永远不会变成 8 块。

所以这道题的关键不是几何，而是**对“切”的定义**——只要允许“非刀切割”的预分块，就能实现一刀八块。

overflowal 发表于 2026-4-24 17:25

zy450 发表于 2026-4-24 15:39
最近人员变动比较大，希望不要影响DS后续研发

你去看tech report后面，就几个标了*的，谈不上变动大 Re:Source

Su7 发表于 2026-4-24 17:31

Surlert 发表于 2026-4-24 17:33

A畜这几天八成又要破防，搞抹黑和封锁动作，毕竟真挡财路了。

Su7 发表于 2026-4-24 17:35

gemini出道天下无敌，现在变成小树林急急而奔。
AI 的迭代速度实在太快了。

zris 发表于 2026-4-24 17:38

本帖最后由 zris 于 2026-4-24 17:43 编辑

说起来想要玩AIRP可以关注下一个专门拿DS训练的aion labs

他家那个训练的V3.2玩airp简直无敌，遵循格式，比claude还牛逼

奥柏伦亲王 发表于 2026-4-24 17:40

开源SOTA应该算不得夸张说法，但是agent能力还是挂个问号，不管怎么说追上来就好，也相信下个版本会更猛，现阶段我可能会codex+gpt5.5和ClaudeCode+K2.6/V4/Mimo2.5混用

御坂MKII 发表于 2026-4-24 17:41

Surlert 发表于 2026-4-24 17:33
A畜这几天八成又要破防，搞抹黑和封锁动作，毕竟真挡财路了。

a 畜这几天还在被奥特曼上眼药呢

御坂MKII 发表于 2026-4-24 17:43

奥柏伦亲王发表于 2026-4-24 17:40
开源SOTA应该算不得夸张说法，但是agent能力还是挂个问号，不管怎么说追上来就好，也相信下个版本会更猛， ...

gpt5 靠后训练也救回来了，ds4 肯定也行。等正式版吧，智力底子在还是好说

dalarmar 发表于 2026-4-24 17:49

等着pro什么时候价格能下来，今天没时间就只以前的提示词各试了一段续写，flash惨不忍睹，理解力和文笔比之前都倒退了。

绝地潜兵 发表于 2026-4-24 17:52

flash API是还不稳定，我roll出来最好的一段是在思考链里面藏着

—— 来自鹅球 v3.5.99

秦南心 发表于 2026-4-24 17:57

写文推荐用seed 2.0 pro过度下，纯网文大侠

neptunehs 发表于 2026-4-24 18:05

stanzgy 发表于 2026-4-24 16:47
瞄了眼 /r/localllama 全是ds v4和 qwen 3.6。ds啥都好就是模型太大了很难本地部署。

论坛助手,iPhone ...

我现在就挺期待qwen3.6-deepseekv4-distilled
肯定会有期待比opus distilled强

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99

chronicle 发表于 2026-4-24 18:16

我看了几个测评，感觉和gpt5 opus有很大差距，
可以算超级性价比版的glm5吧

tk553521 发表于 2026-4-24 18:34

用v4p接入cc干活了一下午，花了我二十几块钱

—— 来自 nubia NX809J, Android 16, 鹅球 v3.5.99-alpha

med 发表于 2026-4-24 18:58

华子的昇腾应该就没准备做类似cuda生态，之前的卡特性都很老，fp8和fp16的混合精度支持都有问题

冤枉呐 发表于 2026-4-24 19:01

ayanamilin 发表于 2026-4-24 16:39
还有集美拿Opus 4.7玩酒馆（是不是中转站不清楚），每月开销几千人民币的呢 ...

酒馆用硅基的glm5一次对话都干掉一块钱
我看实际上不如cherry的知识库

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99

Rowen233 发表于 2026-4-24 19:03

虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事

革萌发表于 2026-4-24 19:04

tk553521 发表于 2026-4-24 18:34
用v4p接入cc干活了一下午，花了我二十几块钱

—— 来自 nubia NX809J, Android 16, 鹅球 v3.5.99-alpha ...

我已经改回v4flash了，感觉差不多，思考速度还快了不少

huidh123 发表于 2026-4-24 19:06

Rowen233 发表于 2026-4-24 19:03
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事 ...

这种级别的模型个人电脑跑不起来的。

有鱼发表于 2026-4-24 19:12

ayanamilin 发表于 2026-4-24 19:13

走来走去发表于 2026-4-24 17:14
不是哦，原计划年前的，当时都准备好了，都已经定了日子。后来不知道什么原因又取消了，主要是知道的都有 ...

你可以看下 vllm-ascend 做适配的代码分支创建时间以及代码量，dsv4是在0.13上做适配的。昇腾推理引擎的适配最早不会早于一月份。

我之前掌握的信息也是ds在年前就把模型训练好了，并且把架构交到了华子的手上，后面的时间都是华子还有别的厂商在做适配。你可以翻翻我在这栋楼里的历史发言。

—— 来自 S1Fun

Rowen233 发表于 2026-4-24 19:15

本帖最后由 Rowen233 于 2026-4-24 19:18 编辑

huidh123 发表于 2026-4-24 19:06
这种级别的模型个人电脑跑不起来的。
flash倒是已经有MLX的量化版了就是只能512GB的Mac Studio跑
但目前好像没搜到有人成功部署

Su7 发表于 2026-4-24 19:16

Rowen233 发表于 2026-4-24 19:03
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事 ...

在写文章批判笔电难大，勿扰。

overflowal 发表于 2026-4-24 19:17

ayanamilin 发表于 2026-4-24 19:13
你可以看下 vllm-ascend 做适配的代码分支创建时间以及代码量，dsv4是在0.13上做适配的。昇腾推理引擎的 ...

早期版本可能，训完不太可能，后面都能明显看到web端的模型在变。后训练肯定一直在进行 Re:Source

ohi.02 发表于 2026-4-24 19:29

糟糕喵发表于 2026-4-24 15:49
网络上显然有这种讨论就自然收录进去了。

这也太吓人了，万一接入了agent…

—— 来自 S1Fun

奥柏伦亲王 发表于 2026-4-24 19:31

又用了会flash，感觉这个东西是真正的强大，速度无敌快，还很便宜

有鱼发表于 2026-4-24 19:45

cmou333 发表于 2026-4-24 19:48

就这样吧，复杂的还得是opus

oopsoops 发表于 2026-4-24 19:53

Rowen233 发表于 2026-4-24 19:03
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事 ...

这不是很显然么，dsv4 pro 1T以上的参数，得多少内存啊…..这得多少台mac组集群

论坛助手,iPhone

squallx 发表于 2026-4-24 19:54

Rowen233 发表于 2026-4-24 19:03
虽然我不想搞查身份
但是有几个天天拿Mac能跑大模型吹开源ai的果系博主毫无动静是咋回事 ...

你不该先反省一下为什么会刷到这种弱智发的内容？

绝地潜兵 发表于 2026-4-24 19:58

本帖最后由绝地潜兵于 2026-4-24 20:04 编辑

reasoning_effort
string
Possible values:

控制模型的推理强度。对普通请求，默认为 high。对一些复杂 Agent 类请求（如 Claude Code、OpenCode），自动设置为 max。出于兼容考虑 low、medium 会映射为 high, xhigh 会映射为 max。
嗨呀，Chatbox没有调整reasoning_effort的地方
这下得换到CherryStudio了……

有鱼发表于 2026-4-24 20:05

页: 14 15 16 17 18 19 20 21 22 23 [24] 25 26 27 28 29 30 31 32 33

Stage1st's Archiver