FT：DeepSeek下周发｜已发，转为v4讨论楼

秦南心 · 发表于 2026-4-24 14:09

whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗，我拿来当外网豆包用的

上传个小说让它总结大纲它只能读个26章，多的直接拒绝，还是pro会员呢，纯垃圾玩意

novem · 发表于 2026-4-24 14:10

网页端不知道是不是V4
但明显回答变详细了
比之前敷衍的两三段话好太多了

泰坦失足 · 发表于 2026-4-24 14:12

仁义礼智信, Gemini占一个免费送会员的忠.

高粱河车神 · 发表于 2026-4-24 14:14

Gemini现在这么差吗，我记得半年前大家普遍还认为这是最好用的

弗里德里希大帝 · 发表于 2026-4-24 14:14

gemini文生图还是可以的吧

绝地潜兵 · 发表于 2026-4-24 14:16

gemini是分析我的TASK里面的提示词,被DS放大了,这就说明1M上下文的准确度确实有提升的缘故?
这些模型升级prompt要重新优化了

findpkq · 发表于 2026-4-24 14:18

好像有反馈部分Skill调用效果和国产御三家还有些差距，是要等后训练优化的正式版吗

gemini 主要发布后一路降智吧，自己当大号豆包用解决日常还是够的，上次写浏览器小插件还有处理表格脚本，最终结果还行，但是过程都稍微有些磕绊

—— 来自 Xiaomi 24129PN74C, Android 16, 鹅球 v3.5.99

燕山雪 · 发表于 2026-4-24 14:19

发现写小说是特别能体现大小模型能力差异的地方，27/31b的模型就真的只会几个关键词和动作来回复读，完全理解不了人物心理和互动

燕山雪 · 发表于 2026-4-24 14:20

高粱河车神发表于 2026-4-24 14:14
Gemini现在这么差吗，我记得半年前大家普遍还认为这是最好用的

看怎么比，同样免费版还是比ChatGPT 好用的

zris · 发表于 2026-4-24 14:20

高粱河车神发表于 2026-4-24 14:14
Gemini现在这么差吗，我记得半年前大家普遍还认为这是最好用的

刚出gemini3pro，确实无敌

现在智商降太多了

多方面原因

neptunehs · 发表于 2026-4-24 14:20

弗里德里希大帝发表于 2026-4-24 14:14
gemini文生图还是可以的吧

只能说姿势确认跟需求分析实现强
画风实在是。。。。

相比之下gptimage2就没那么单调的画风

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99

有鱼 · 发表于 2026-4-24 14:22

gpt的免费模型拉完了

论坛助手,iPhone

qz66618 · 发表于 2026-4-24 14:23

看技术报告这次没有用到engram啊，技术不成熟还是什么原因

—— 来自鹅球 v3.5.99

德尔惠净水器 · 发表于 2026-4-24 14:24

qz66618 发表于 2026-4-24 14:23
看技术报告这次没有用到engram啊，技术不成熟还是什么原因

—— 来自鹅球 v3.5.99 ...

后面版本更新的时候会用

德尔惠净水器 · 发表于 2026-4-24 14:29

基于DeepSeek V4-Pro模型，在8K输入场景，昇腾950超节点可实现TPOT约20ms时单卡Decode 吞吐4700TPS。DeepSeek V4-Flash模型，8K长序列输入场景下可实现TPOT约10ms时单卡Decode 吞吐1600TPS

奈落的孤火花 · 发表于 2026-4-24 14:29

现在deepseek是不分R1和V3了吗？V4就自己有开和关思考的方式，用的都是V4？

培根芝士蛋堡XD · 发表于 2026-4-24 14:30

qz66618 发表于 2026-4-24 14:23
看技术报告这次没有用到engram啊，技术不成熟还是什么原因

—— 来自鹅球 v3.5.99 ...

这种跨CPU的通信对推理和训练的AI Infra压力都是极大的，贸然上风险极高

有鱼 · 发表于 2026-4-24 14:30

奈落的孤火花发表于 2026-4-24 14:29
现在deepseek是不分R1和V3了吗？V4就自己有开和关思考的方式，用的都是V4？

v3.2的时候就把两个模型合并了

论坛助手,iPhone

goranger · 发表于 2026-4-24 14:31

ml1642879 发表于 2026-4-24 12:09
感谢大A，感谢标普，感谢纳指，感谢道指

Re:Source · Xiaomi 15

歪一下，梁文峰开理想也不好好停车吗

Azcarlo · 发表于 2026-4-24 14:33

engram我觉得不好说，知乎上看到有人在小模型上复现结果不是太好，只是一个模型提点trick，没有想象中那么有用

— from Xiaomi 23127PN0CC, Android 16, S1 Next Goose v3.5.99

杀人鲸 · 发表于 2026-4-24 14:34

Promeus 发表于 2026-4-24 13:53

可悲的循环又来了是吧？刚刚贴吧那边还说大的要来了，玩不了了呀。没关系，永远都还有下一个可以玩的版本。

—— 来自 S1Fun

andychen · 发表于 2026-4-24 14:35

ds一如既往的大幅提升了效率。价格上目前1.6t的pro模型和友商大致相当，不过下半年会大幅降价。推理速度上目前官方api提供的v4 flash最快能到100-200 token/s

要注意这个模型已经针对angetic优化了，需要更详细的提示对模型做出指令

目前还是preview版，个人觉得后续应该会先把spciale的超长推理链加进来。engram属于重大技术跨越了，可能还要等一段时间

杀人鲸 · 发表于 2026-4-24 14:35

高粱河车神发表于 2026-4-24 14:14
Gemini现在这么差吗，我记得半年前大家普遍还认为这是最好用的

你也说了，那是半年前，现在的信息时代变化可太快了。

—— 来自 S1Fun

羊寢 · 发表于 2026-4-24 14:37

findpkq 发表于 2026-4-24 14:18
好像有反馈部分Skill调用效果和国产御三家还有些差距，是要等后训练优化的正式版吗

gemini 主要发布后一路 ...

应该是，现在v4p普遍反应就是后训练不足

勿徊哉 · 发表于 2026-4-24 14:38

后训练不足是算力问题？
底模是和高质量数据有关？ Re:Source

无尽的牙刷 · 发表于 2026-4-24 14:39

无缓存的输入有点贵啊，其他家基本都是输出的四分之一价钱

羊寢 · 发表于 2026-4-24 14:41

本帖最后由羊寢于 2026-4-24 14:42 编辑

奈落的孤火花发表于 2026-4-24 14:29
现在deepseek是不分R1和V3了吗？V4就自己有开和关思考的方式，用的都是V4？

官方r1在去年夏天v3.1出来后就不存在了啊……

现在官网api的原本reasoner/chat接口还保留着，得自行调用才有，7月底会撤掉，如果是直接用的话就是只有v4了

Su7 · 发表于 2026-4-24 14:49

提示: 作者被禁止或删除内容自动屏蔽

冤枉呐 · 发表于 2026-4-24 15:01

Su7 发表于 2026-4-24 14:49

美股开盘就砸是吧

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99

Chenlh · 发表于 2026-4-24 15:01

cloudinsky 发表于 2026-4-24 13:48
小说得按照大型工程来吧。先给整体框架约束。提前规划好啊，每一章节精炼后给到上下文。

完全全文扔进去谁 ...

用ds带着我读了读v4的技术文档，好像整个第二章都是在说是怎么实现超大上下文注意力的，很复杂

兔灾2号 · 发表于 2026-4-24 15:09

试着给了段梗概让v4写小说，虽然还是那个熟悉的味，但是味轻了不少

蒜苗 · 发表于 2026-4-24 15:14

德尔惠净水器发表于 2026-4-24 14:29
基于DeepSeek V4-Pro模型，在8K输入场景，昇腾950超节点可实现TPOT约20ms时单卡Decode 吞吐4700TPS。DeepSe ...

怎么PRO比Flash速度还快？

ayanamilin · 发表于 2026-4-24 15:15

下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间，很大一部分原因就是要跟华子做适配

赤星ビスコ · 发表于 2026-4-24 15:16

秦南心发表于 2026-4-24 14:09
上传个小说让它总结大纲它只能读个26章，多的直接拒绝，还是pro会员呢，纯垃圾玩意
...

你用notebooklm吧，这个读小说还蛮好用的

ayanamilin · 发表于 2026-4-24 15:19

蒜苗发表于 2026-4-24 15:14
怎么PRO比Flash速度还快？

TPS 是吞吐量。

目标 TPOT 不一样，所以 Pro 的吞吐要大一些。“TPOT为XXms时”，意思是给定 TPOT 来看 TPS

ayanamilin · 发表于 2026-4-24 15:23

本帖最后由 ayanamilin 于 2026-4-24 15:27 编辑

vLLM-ascend（昇腾）也 day-0 support 了，目前只支持 flash，A2 & A3 系列产品都能用：https://docs.vllm.ai/projects/as ... ls/DeepSeek-V4.html

DS 这波真可以算是半个国家队了，国内除了 DS 没有哪家模型和华子合作得如此密切，顶多搞点卡做训推。

zaozaoxx · 发表于 2026-4-24 15:26

体验确实超大杯

—— 来自 HUAWEI LMR-AL10, Android 12, 鹅球 v3.5.99

chuchoselph · 发表于 2026-4-24 15:33

ayanamilin 发表于 2026-4-24 15:15
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间，很大一部分原因就是要跟华子做适配 ...

不是晚上7点么

云卷花开 · 发表于 2026-4-24 15:35

https://github.com/victorchen96/deepseek_v4_rolepaly_instruct/blob/main/README.md

感觉你楼可能不知道，就发一下：ds 做 v4 训练的时候专门加了俩角色扮演和创意写作专用的指令，赞美梁圣和小礼亚圣吧

Re:Source

StrangerJ · 发表于 2026-4-24 15:35

chuchoselph 发表于 2026-4-24 15:33
不是晚上7点么

删了重新发，改时间了

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99

		自动登录	找回密码
密码			立即注册

[科技] FT：DeepSeek下周发｜已发，转为v4讨论楼

本帖子中包含更多资源

评分

评分

评分

Su7 Su7 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2025-3-12 头像被屏蔽	发表于 2026-4-24 14:49 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报