秦南心 发表于 2026-4-24 14:09

whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的

上传个小说让它总结大纲它只能读个26章,多的直接拒绝,还是pro会员呢,纯垃圾玩意

novem 发表于 2026-4-24 14:10

网页端不知道是不是V4
但明显回答变详细了
比之前敷衍的两三段话好太多了

泰坦失足 发表于 2026-4-24 14:12

仁义礼智信, Gemini占一个免费送会员的忠.

高粱河车神 发表于 2026-4-24 14:14

Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的

弗里德里希大帝 发表于 2026-4-24 14:14

gemini文生图还是可以的吧

绝地潜兵 发表于 2026-4-24 14:16

gemini是分析我的TASK里面的提示词,被DS放大了,这就说明1M上下文的准确度确实有提升的缘故?
这些模型升级prompt要重新优化了

findpkq 发表于 2026-4-24 14:18

好像有反馈部分Skill调用效果和国产御三家还有些差距,是要等后训练优化的正式版吗

gemini 主要发布后一路降智吧,自己当大号豆包用解决日常还是够的,上次写浏览器小插件还有处理表格脚本,最终结果还行,但是过程都稍微有些磕绊

—— 来自 Xiaomi 24129PN74C, Android 16, 鹅球 v3.5.99

燕山雪 发表于 2026-4-24 14:19

发现写小说是特别能体现大小模型能力差异的地方,27/31b的模型就真的只会几个关键词和动作来回复读,完全理解不了人物心理和互动

燕山雪 发表于 2026-4-24 14:20

高粱河车神 发表于 2026-4-24 14:14
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的

看怎么比,同样免费版还是比ChatGPT 好用的

zris 发表于 2026-4-24 14:20

高粱河车神 发表于 2026-4-24 14:14
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的

刚出gemini3pro,确实无敌

现在智商降太多了

多方面原因

neptunehs 发表于 2026-4-24 14:20

弗里德里希大帝 发表于 2026-4-24 14:14
gemini文生图还是可以的吧

只能说姿势确认跟需求分析实现强
画风实在是。。。。

相比之下gptimage2就没那么单调的画风

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99

有鱼 发表于 2026-4-24 14:22

qz66618 发表于 2026-4-24 14:23

看技术报告这次没有用到engram啊,技术不成熟还是什么原因

—— 来自 鹅球 v3.5.99

德尔惠净水器 发表于 2026-4-24 14:24

qz66618 发表于 2026-4-24 14:23
看技术报告这次没有用到engram啊,技术不成熟还是什么原因

—— 来自 鹅球 v3.5.99 ...

后面版本更新的时候会用

德尔惠净水器 发表于 2026-4-24 14:29

基于DeepSeek V4-Pro模型,在8K输入场景,昇腾950超节点可实现TPOT约20ms时单卡Decode 吞吐4700TPS。DeepSeek V4-Flash模型,8K长序列输入场景下可实现TPOT约10ms时单卡Decode 吞吐1600TPS

奈落的孤火花 发表于 2026-4-24 14:29

现在deepseek是不分R1和V3了吗?V4就自己有开和关思考的方式,用的都是V4?

培根芝士蛋堡XD 发表于 2026-4-24 14:30

qz66618 发表于 2026-4-24 14:23
看技术报告这次没有用到engram啊,技术不成熟还是什么原因

—— 来自 鹅球 v3.5.99 ...

这种跨CPU的通信对推理和训练的AI Infra压力都是极大的,贸然上风险极高

有鱼 发表于 2026-4-24 14:30

goranger 发表于 2026-4-24 14:31

ml1642879 发表于 2026-4-24 12:09
感谢大A,感谢标普,感谢纳指,感谢道指

Re:Source · Xiaomi 15

歪一下,梁文峰开理想也不好好停车吗

Azcarlo 发表于 2026-4-24 14:33

engram我觉得不好说,知乎上看到有人在小模型上复现结果不是太好,只是一个模型提点trick,没有想象中那么有用

— from Xiaomi 23127PN0CC, Android 16, S1 Next Goose v3.5.99

杀人鲸 发表于 2026-4-24 14:34

Promeus 发表于 2026-4-24 13:53


可悲的循环又来了是吧?刚刚贴吧那边还说大的要来了,玩不了了呀。没关系,永远都还有下一个可以玩的版本。

—— 来自 S1Fun

andychen 发表于 2026-4-24 14:35

ds一如既往的大幅提升了效率。价格上目前1.6t的pro模型和友商大致相当,不过下半年会大幅降价。推理速度上目前官方api提供的v4 flash最快能到100-200 token/s

要注意这个模型已经针对angetic优化了,需要更详细的提示对模型做出指令

目前还是preview版,个人觉得后续应该会先把spciale的超长推理链加进来。engram属于重大技术跨越了,可能还要等一段时间

杀人鲸 发表于 2026-4-24 14:35

高粱河车神 发表于 2026-4-24 14:14
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的

你也说了,那是半年前,现在的信息时代变化可太快了。

—— 来自 S1Fun

羊寢 发表于 2026-4-24 14:37

findpkq 发表于 2026-4-24 14:18
好像有反馈部分Skill调用效果和国产御三家还有些差距,是要等后训练优化的正式版吗

gemini 主要发布后一路 ...

应该是,现在v4p普遍反应就是后训练不足

勿徊哉 发表于 2026-4-24 14:38

后训练不足是算力问题?
底模是和高质量数据有关?    Re:Source

无尽的牙刷 发表于 2026-4-24 14:39

无缓存的输入有点贵啊,其他家基本都是输出的四分之一价钱

羊寢 发表于 2026-4-24 14:41

本帖最后由 羊寢 于 2026-4-24 14:42 编辑

奈落的孤火花 发表于 2026-4-24 14:29
现在deepseek是不分R1和V3了吗?V4就自己有开和关思考的方式,用的都是V4?

官方r1在去年夏天v3.1出来后就不存在了啊……
现在官网api的原本reasoner/chat接口还保留着,得自行调用才有,7月底会撤掉,如果是直接用的话就是只有v4了

Su7 发表于 2026-4-24 14:49


冤枉呐 发表于 2026-4-24 15:01

Su7 发表于 2026-4-24 14:49


美股开盘就砸是吧

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99

Chenlh 发表于 2026-4-24 15:01

cloudinsky 发表于 2026-4-24 13:48
小说得按照大型工程来吧。先给整体框架约束。提前规划好啊,每一章节精炼后给到上下文。

完全全文扔进去谁 ...

用ds带着我读了读v4的技术文档,好像整个第二章都是在说是怎么实现超大上下文注意力的,很复杂

兔灾2号 发表于 2026-4-24 15:09

试着给了段梗概让v4写小说,虽然还是那个熟悉的味,但是味轻了不少

蒜苗 发表于 2026-4-24 15:14

德尔惠净水器 发表于 2026-4-24 14:29
基于DeepSeek V4-Pro模型,在8K输入场景,昇腾950超节点可实现TPOT约20ms时单卡Decode 吞吐4700TPS。DeepSe ...

怎么PRO比Flash速度还快?

ayanamilin 发表于 2026-4-24 15:15

下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间,很大一部分原因就是要跟华子做适配

赤星ビスコ 发表于 2026-4-24 15:16

秦南心 发表于 2026-4-24 14:09
上传个小说让它总结大纲它只能读个26章,多的直接拒绝,还是pro会员呢,纯垃圾玩意
...

你用notebooklm吧,这个读小说还蛮好用的

ayanamilin 发表于 2026-4-24 15:19

蒜苗 发表于 2026-4-24 15:14
怎么PRO比Flash速度还快?

TPS 是吞吐量。

目标 TPOT 不一样,所以 Pro 的吞吐要大一些。“TPOT为XXms时”,意思是给定 TPOT 来看 TPS

ayanamilin 发表于 2026-4-24 15:23

本帖最后由 ayanamilin 于 2026-4-24 15:27 编辑

vLLM-ascend(昇腾) 也 day-0 support 了,目前只支持 flash,A2 & A3 系列产品都能用:https://docs.vllm.ai/projects/as ... ls/DeepSeek-V4.html

DS 这波真可以算是半个国家队了,国内除了 DS 没有哪家模型和华子合作得如此密切,顶多搞点卡做训推。

zaozaoxx 发表于 2026-4-24 15:26

体验确实超大杯

—— 来自 HUAWEI LMR-AL10, Android 12, 鹅球 v3.5.99

chuchoselph 发表于 2026-4-24 15:33

ayanamilin 发表于 2026-4-24 15:15
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间,很大一部分原因就是要跟华子做适配 ...

不是晚上7点么

云卷花开 发表于 2026-4-24 15:35

https://github.com/victorchen96/deepseek_v4_rolepaly_instruct/blob/main/README.md

感觉你楼可能不知道,就发一下:ds 做 v4 训练的时候专门加了俩角色扮演和创意写作专用的指令,赞美梁圣和小礼亚圣吧

Re:Source

StrangerJ 发表于 2026-4-24 15:35

chuchoselph 发表于 2026-4-24 15:33
不是晚上7点么

删了重新发,改时间了

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99
页: 12 13 14 15 16 17 18 19 20 21 [22] 23 24 25 26 27 28 29 30 31
查看完整版本: FT:DeepSeek下周发|已发,转为v4讨论楼