FT：DeepSeek下周发｜已发，转为v4讨论楼

罗莉控 · 发表于 2026-4-24 15:36

Azcarlo 发表于 2026-4-24 14:33
engram我觉得不好说，知乎上看到有人在小模型上复现结果不是太好，只是一个模型提点trick，没有想象中那么 ...

感觉Engram还是得配合类似HBF这类极度优化读取带宽的新型硬件，目前硬件上Engram优势不大

spck · 发表于 2026-4-24 15:38

所以菊花没有自家大模型虽然是个问题但也不是很大的问题，大不了直接抱ds大腿，生态足够了

—— 来自 S1Fun

zy450 · 发表于 2026-4-24 15:39

最近人员变动比较大，希望不要影响DS后续研发

qz66618 · 发表于 2026-4-24 15:39

回过头看，如果真的是因为算力导致训练拖延，原计划春节期间发布，那ds目前仍然保持着第一梯队的科研实力啊

—— 来自鹅球 v3.5.99

qwased · 发表于 2026-4-24 15:39

问他怎么分橘子他会一直思考怎么才能一刀砍死多个小朋友

厍无春 · 发表于 2026-4-24 15:41

qz66618 发表于 2026-4-24 14:23
看技术报告这次没有用到engram啊，技术不成熟还是什么原因

—— 来自鹅球 v3.5.99 ...

预览版，等更新吧

andychen · 发表于 2026-4-24 15:47

玩酒馆的可以参考下这个

https://github.com/victorchen96/deepseek_v4_rolepaly_instruct

糟糕喵 · 发表于 2026-4-24 15:49

qwased 发表于 2026-4-24 15:39
问他怎么分橘子他会一直思考怎么才能一刀砍死多个小朋友

网络上显然有这种讨论就自然收录进去了。

高粱河车神 · 发表于 2026-4-24 15:52

spck 发表于 2026-4-24 15:38
所以菊花没有自家大模型虽然是个问题但也不是很大的问题，大不了直接抱ds大腿，生态足够了

—— 来自 S1Fu ...

建议直接把小艺换成DS，小艺实在是有点蠢

绝地潜兵 · 发表于 2026-4-24 15:54

云卷花开发表于 2026-4-24 15:35
https://github.com/victorchen96/deepseek_v4_rolepaly_instruct/blob/main/README.md

感觉你楼可能不知 ...

PERSPECTIVE_NARRATOR: FIRST_PERSON .

跟我的指令有严重冲突，无法启动

脸宽 · 发表于 2026-4-24 15:55

想问问大家调api的手机app都用的哪家 Re:Source

半江瑟瑟半江红 · 发表于 2026-4-24 15:56

脸宽发表于 2026-4-24 15:55
想问问大家调api的手机app都用的哪家 Re:Source

手机就装了个chatbox和tavo

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

德尔惠净水器 · 发表于 2026-4-24 16:02

羊寢 · 发表于 2026-4-24 16:04

本帖最后由羊寢于 2026-4-24 16:54 编辑

现在没法玩，问下pro的max酒馆里面要怎么调？
嗷，会了，插头选自定义，附加参数填reasoning_effort: max

脸宽 · 发表于 2026-4-24 16:11

半江瑟瑟半江红发表于 2026-4-24 15:56
手机就装了个chatbox和tavo

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

感谢，用了下tavo感觉挺方便的 Re:Source

主人ハム子 · 发表于 2026-4-24 16:11

高粱河车神发表于 2026-4-24 15:52
建议直接把小艺换成DS，小艺实在是有点蠢

小艺不是早就接入ds了？

—— 来自 HUAWEI TET-AN00, Android 12, 鹅球 v3.5.99

蒜苗 · 发表于 2026-4-24 16:11

德尔惠净水器发表于 2026-4-24 16:02

直播已经开了？

德尔惠净水器 · 发表于 2026-4-24 16:13

本帖最后由德尔惠净水器于 2026-4-24 16:14 编辑

蒜苗发表于 2026-4-24 16:11
直播已经开了？

在播了

Geronimo · 发表于 2026-4-24 16:25

这个直播都是是昇腾的人？

ycjiang1337 · 发表于 2026-4-24 16:33

ff2077 发表于 2026-4-24 13:21
有没有试过写小说的，flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...

可以用，但是容易忘设定，另外需要调教Prompt
Pro好很多

ycjiang1337 · 发表于 2026-4-24 16:33

whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗，我拿来当外网豆包用的

以前2.5-Pro是唯一能用的1M上下文模型，结果3.x大开倒车

ycjiang1337 · 发表于 2026-4-24 16:35

高粱河车神发表于 2026-4-24 14:14
Gemini现在这么差吗，我记得半年前大家普遍还认为这是最好用的

Gemini的特点是刚发的时候很惊艳，然后随着时间推移逐渐烂完

ytrfegd · 发表于 2026-4-24 16:37

PRO的API写酒馆太奢侈了吧？写一篇可能大几十就出去了

ycjiang1337 · 发表于 2026-4-24 16:39

ayanamilin 发表于 2026-4-24 15:23
vLLM-ascend（昇腾）也 day-0 support 了，目前只支持 flash，A2 & A3 系列产品都能用：https://docs.vllm ...

昇腾950本身就是给DeepSeek设计的，其它家都没有使用混合精度训练，FP8和FP4算力基本上没卵用

绝地潜兵 · 发表于 2026-4-24 16:39

flash的注意力有问题，很容易出幻觉

—— 来自鹅球 v3.5.99

ayanamilin · 发表于 2026-4-24 16:39

ytrfegd 发表于 2026-4-24 16:37
PRO的API写酒馆太奢侈了吧？写一篇可能大几十就出去了

还有集美拿Opus 4.7玩酒馆（是不是中转站不清楚），每月开销几千人民币的呢

Litccc · 发表于 2026-4-24 16:42

ytrfegd 发表于 2026-4-24 16:37
PRO的API写酒馆太奢侈了吧？写一篇可能大几十就出去了

不要小看鹿克啊

a4ac7 · 发表于 2026-4-24 16:43

1. 推理路径显著延长（深度思考能力）
模型在回答前会进行更长的内部推理链推演，类似 slow-thinking。背后是强化学习优化，模型在训练中获得了更强的多步逻辑验证和自我纠错能力。对算法题、数学证明、复杂 debug 场景帮助明显。

2. 上下文窗口扩至 1M tokens
支持超长上下文处理，一次可装入三体三部曲体量的文本。技术层面是位置编码和注意力机制的优化，长程依赖保持较好。你可以直接喂整个项目源码仓库、完整日志或长文档，定位具体问题。

3. 联网搜索改为按需触发
不再是自动检索，而是作为可选工具调用，通过界面开关激活。减少不必要的网络 I/O 和无关信息注入，同时也降低延迟。当需要实时数据时，你手动打开即可。

4. 多模态理解聚焦于文本提取
虽不支持端到端视觉像素理解，但对图片、PDF、Office 文档（Word/Excel/PPT）、txt 等进行了统一的文本抽取与结构化处理。本质上是将非纯文本输入转为 token 序列纳入上下文，适合处理报告、表格、合同、扫描件里的文字信息。

5. 工程基础保持不变

- 依旧无任何付费墙，API/Web 均可**
- 对话数据默认不用于训练（可设置）
- App 端支持语音输入（ASR 集成）

---

总结成一句：推理链更深、上下文更长、工具调用更可控。跑代码、审方案、读长文，现在更趁手。有具体场景想测，随时试。

好

—— 来自 HUAWEI PLA-AL10, Android 12, 鹅球 v3.5.99

stanzgy · 发表于 2026-4-24 16:47

瞄了眼 /r/localllama 全是ds v4和 qwen 3.6。ds啥都好就是模型太大了很难本地部署。

论坛助手,iPhone

炽十二翼 · 发表于 2026-4-24 16:48

华子要知耻啊，手机卖的贵就算了鸿蒙不支持很多app也忍了，ds的后腿再拖可不能忍啊

spck · 发表于 2026-4-24 16:50

高粱河车神发表于 2026-4-24 15:52
建议直接把小艺换成DS，小艺实在是有点蠢

小艺接的一直就是ds啊

—— 来自 S1Fun

Izunu_3 · 发表于 2026-4-24 16:53

pro和claude opus的api价格差多少啊？
之前用过一阵opus 4.5玩酒馆，打的是真爽，可惜后面没羊毛就停了。

发呆的龙虾 · 发表于 2026-4-24 16:54

试了一下，flash不太行，状态栏都生成不出来。pro还行，就是文笔不够涩，估计得提示词去调。之前用kimi不用提示词都能写得很涩。

ayanamilin · 发表于 2026-4-24 16:56

Izunu_3 发表于 2026-4-24 16:53
pro和claude opus的api价格差多少啊？
之前用过一阵opus 4.5玩酒馆，打的是真爽，可惜后面没羊毛就停了。 ...

价格差约等于中美汇率差，DSV4 pro 乘以汇率就是 opus 的价格

Sza · 发表于 2026-4-24 16:59

本帖最后由 Sza 于 2026-4-24 17:54 编辑

我刚看昇腾cann直播第一部分好像ppt显示了部署v4需要的显存占用，我只瞄到一眼没截到图，可能是错觉。有楼友截图了吗？如果没有的话得等他们上传ppt和直播录像了。

==更新
昇腾b站号上传了直播录像【DeepSeek-V4昇腾首发：基于CANN的训推优化实践-哔哩哔哩】 https://www.bilibili.com/video/BV1KLo5BfEdG

24分28秒开始的ppt内容

Rowen233 · 发表于 2026-4-24 17:01

高粱河车神发表于 2026-4-24 15:52
建议直接把小艺换成DS，小艺实在是有点蠢

小艺应该能切换DS吧

千千千千鸟 · 发表于 2026-4-24 17:03

发呆的龙虾发表于 2026-4-24 16:54
试了一下，flash不太行，状态栏都生成不出来。pro还行，就是文笔不够涩，估计得提示词去调。之前用kimi不用 ...

等高手预设完善喽，才出来几个小时啊

ymm1030 · 发表于 2026-4-24 17:03

脸宽发表于 2026-4-24 15:55
想问问大家调api的手机app都用的哪家 Re:Source

chatbox，我觉得挺好用的

发呆的龙虾 · 发表于 2026-4-24 17:07

千千千千鸟发表于 2026-4-24 17:03
等高手预设完善喽，才出来几个小时啊

我都是自己写的提示词，没用酒馆预设。

—— 来自 HUAWEI BRA-AL00, Android 12, 鹅球 v3.5.99

卡普空 · 发表于 2026-4-24 17:08

ayanamilin 发表于 2026-4-24 15:15
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间，很大一部分原因就是要跟华子做适配 ...

这个国家任务了，国产大模型适配国产算力卡是硬性任务，希望华子不要拖梁总后腿

		自动登录	找回密码
密码			立即注册

[科技] FT：DeepSeek下周发｜已发，转为v4讨论楼

本帖子中包含更多资源

评分

评分

本帖子中包含更多资源

本帖子中包含更多资源