找回密码
 立即注册
搜索
楼主: 绕指流光

[科技] FT:DeepSeek下周发|已发,转为v4讨论楼

  [复制链接]
     
发表于 2026-4-24 14:09 | 显示全部楼层
whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的

上传个小说让它总结大纲它只能读个26章,多的直接拒绝,还是pro会员呢,纯垃圾玩意
回复

使用道具 举报

     
发表于 2026-4-24 14:10 来自手机 | 显示全部楼层
网页端不知道是不是V4
但明显回答变详细了
比之前敷衍的两三段话好太多了
回复

使用道具 举报

     
发表于 2026-4-24 14:12 | 显示全部楼层
仁义礼智信, Gemini占一个免费送会员的忠.
回复

使用道具 举报

发表于 2026-4-24 14:14 | 显示全部楼层
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的
回复

使用道具 举报

     
发表于 2026-4-24 14:14 | 显示全部楼层
gemini文生图还是可以的吧
回复

使用道具 举报

发表于 2026-4-24 14:16 | 显示全部楼层
gemini是分析我的TASK里面的提示词,被DS放大了,这就说明1M上下文的准确度确实有提升的缘故?
这些模型升级prompt要重新优化了
回复

使用道具 举报

     
发表于 2026-4-24 14:18 来自手机 | 显示全部楼层
好像有反馈部分Skill调用效果和国产御三家还有些差距,是要等后训练优化的正式版吗

gemini 主要发布后一路降智吧,自己当大号豆包用解决日常还是够的,上次写浏览器小插件还有处理表格脚本,最终结果还行,但是过程都稍微有些磕绊

—— 来自 Xiaomi 24129PN74C, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 14:19 来自手机 | 显示全部楼层
发现写小说是特别能体现大小模型能力差异的地方,27/31b的模型就真的只会几个关键词和动作来回复读,完全理解不了人物心理和互动
回复

使用道具 举报

     
发表于 2026-4-24 14:20 来自手机 | 显示全部楼层
高粱河车神 发表于 2026-4-24 14:14
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的

看怎么比,同样免费版还是比ChatGPT 好用的
回复

使用道具 举报

     
发表于 2026-4-24 14:20 | 显示全部楼层
高粱河车神 发表于 2026-4-24 14:14
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的

刚出gemini3pro,确实无敌

现在智商降太多了

多方面原因
回复

使用道具 举报

     
发表于 2026-4-24 14:20 来自手机 | 显示全部楼层
弗里德里希大帝 发表于 2026-4-24 14:14
gemini文生图还是可以的吧

只能说姿势确认跟需求分析实现强
画风实在是。。。。

相比之下gptimage2就没那么单调的画风

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-4-24 14:22 | 显示全部楼层
gpt的免费模型拉完了

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-24 14:23 来自手机 | 显示全部楼层
看技术报告这次没有用到engram啊,技术不成熟还是什么原因

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-4-24 14:24 来自手机 | 显示全部楼层
qz66618 发表于 2026-4-24 14:23
看技术报告这次没有用到engram啊,技术不成熟还是什么原因

—— 来自 鹅球 v3.5.99 ...

后面版本更新的时候会用
回复

使用道具 举报

发表于 2026-4-24 14:29 来自手机 | 显示全部楼层
基于DeepSeek V4-Pro模型,在8K输入场景,昇腾950超节点可实现TPOT约20ms时单卡Decode 吞吐4700TPS。DeepSeek V4-Flash模型,8K长序列输入场景下可实现TPOT约10ms时单卡Decode 吞吐1600TPS

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-4-24 14:29 | 显示全部楼层
现在deepseek是不分R1和V3了吗?V4就自己有开和关思考的方式,用的都是V4?
回复

使用道具 举报

     
发表于 2026-4-24 14:30 | 显示全部楼层
qz66618 发表于 2026-4-24 14:23
看技术报告这次没有用到engram啊,技术不成熟还是什么原因

—— 来自 鹅球 v3.5.99 ...

这种跨CPU的通信对推理和训练的AI Infra压力都是极大的,贸然上风险极高
回复

使用道具 举报

发表于 2026-4-24 14:30 | 显示全部楼层
奈落的孤火花 发表于 2026-4-24 14:29
现在deepseek是不分R1和V3了吗?V4就自己有开和关思考的方式,用的都是V4?

v3.2的时候就把两个模型合并了

论坛助手,iPhone

评分

参与人数 1战斗力 +1 收起 理由
奈落的孤火花 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2026-4-24 14:31 | 显示全部楼层
ml1642879 发表于 2026-4-24 12:09
感谢大A,感谢标普,感谢纳指,感谢道指

Re:Source · Xiaomi 15

歪一下,梁文峰开理想也不好好停车吗
回复

使用道具 举报

     
发表于 2026-4-24 14:33 来自手机 | 显示全部楼层
engram我觉得不好说,知乎上看到有人在小模型上复现结果不是太好,只是一个模型提点trick,没有想象中那么有用

— from Xiaomi 23127PN0CC, Android 16, S1 Next Goose v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 14:34 | 显示全部楼层

可悲的循环又来了是吧?刚刚贴吧那边还说大的要来了,玩不了了呀。没关系,永远都还有下一个可以玩的版本。

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-4-24 14:35 来自手机 | 显示全部楼层
ds一如既往的大幅提升了效率。价格上目前1.6t的pro模型和友商大致相当,不过下半年会大幅降价。推理速度上目前官方api提供的v4 flash最快能到100-200 token/s

要注意这个模型已经针对angetic优化了,需要更详细的提示对模型做出指令

目前还是preview版,个人觉得后续应该会先把spciale的超长推理链加进来。engram属于重大技术跨越了,可能还要等一段时间
回复

使用道具 举报

     
发表于 2026-4-24 14:35 | 显示全部楼层
高粱河车神 发表于 2026-4-24 14:14
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的

你也说了,那是半年前,现在的信息时代变化可太快了。

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-4-24 14:37 来自手机 | 显示全部楼层
findpkq 发表于 2026-4-24 14:18
好像有反馈部分Skill调用效果和国产御三家还有些差距,是要等后训练优化的正式版吗

gemini 主要发布后一路 ...

应该是,现在v4p普遍反应就是后训练不足
回复

使用道具 举报

     
发表于 2026-4-24 14:38 | 显示全部楼层
后训练不足是算力问题?
底模是和高质量数据有关?    Re:Source
回复

使用道具 举报

     
发表于 2026-4-24 14:39 | 显示全部楼层
无缓存的输入有点贵啊,其他家基本都是输出的四分之一价钱
回复

使用道具 举报

     
发表于 2026-4-24 14:41 来自手机 | 显示全部楼层
本帖最后由 羊寢 于 2026-4-24 14:42 编辑
奈落的孤火花 发表于 2026-4-24 14:29
现在deepseek是不分R1和V3了吗?V4就自己有开和关思考的方式,用的都是V4?

官方r1在去年夏天v3.1出来后就不存在了啊……
现在官网api的原本reasoner/chat接口还保留着,得自行调用才有,7月底会撤掉,如果是直接用的话就是只有v4了

评分

参与人数 1战斗力 +1 收起 理由
奈落的孤火花 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

头像被屏蔽
发表于 2026-4-24 14:49 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-4-24 15:01 来自手机 | 显示全部楼层

美股开盘就砸是吧

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 15:01 来自手机 | 显示全部楼层
cloudinsky 发表于 2026-4-24 13:48
小说得按照大型工程来吧。先给整体框架约束。提前规划好啊,每一章节精炼后给到上下文。

完全全文扔进去谁 ...

用ds带着我读了读v4的技术文档,好像整个第二章都是在说是怎么实现超大上下文注意力的,很复杂
回复

使用道具 举报

发表于 2026-4-24 15:09 | 显示全部楼层
试着给了段梗概让v4写小说,虽然还是那个熟悉的味,但是味轻了不少
回复

使用道具 举报

     
发表于 2026-4-24 15:14 来自手机 | 显示全部楼层
德尔惠净水器 发表于 2026-4-24 14:29
基于DeepSeek V4-Pro模型,在8K输入场景,昇腾950超节点可实现TPOT约20ms时单卡Decode 吞吐4700TPS。DeepSe ...

怎么PRO比Flash速度还快?
回复

使用道具 举报

     
发表于 2026-4-24 15:15 | 显示全部楼层
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间,很大一部分原因就是要跟华子做适配
回复

使用道具 举报

     
发表于 2026-4-24 15:16 来自手机 | 显示全部楼层
秦南心 发表于 2026-4-24 14:09
上传个小说让它总结大纲它只能读个26章,多的直接拒绝,还是pro会员呢,纯垃圾玩意
...

你用notebooklm吧,这个读小说还蛮好用的
回复

使用道具 举报

     
发表于 2026-4-24 15:19 | 显示全部楼层
蒜苗 发表于 2026-4-24 15:14
怎么PRO比Flash速度还快?

TPS 是吞吐量。

目标 TPOT 不一样,所以 Pro 的吞吐要大一些。“TPOT为XXms时”,意思是给定 TPOT 来看 TPS
回复

使用道具 举报

     
发表于 2026-4-24 15:23 | 显示全部楼层
本帖最后由 ayanamilin 于 2026-4-24 15:27 编辑

vLLM-ascend(昇腾) 也 day-0 support 了,目前只支持 flash,A2 & A3 系列产品都能用:https://docs.vllm.ai/projects/as ... ls/DeepSeek-V4.html

DS 这波真可以算是半个国家队了,国内除了 DS 没有哪家模型和华子合作得如此密切,顶多搞点卡做训推。
回复

使用道具 举报

     
发表于 2026-4-24 15:26 来自手机 | 显示全部楼层
体验确实超大杯

—— 来自 HUAWEI LMR-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 15:33 | 显示全部楼层
ayanamilin 发表于 2026-4-24 15:15
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间,很大一部分原因就是要跟华子做适配 ...

不是晚上7点么
回复

使用道具 举报

     
发表于 2026-4-24 15:35 | 显示全部楼层
https://github.com/victorchen96/deepseek_v4_rolepaly_instruct/blob/main/README.md

感觉你楼可能不知道,就发一下:ds 做 v4 训练的时候专门加了俩角色扮演和创意写作专用的指令,赞美梁圣和小礼亚圣吧

Re:Source

评分

参与人数 5战斗力 +8 收起 理由
zero23333 + 2 卧槽,谢谢提供
便当爱 + 2 好评加鹅
御姐贾 + 1 那还说啥了,梁圣万岁吧
ymm1030 + 1 赞美梁圣
秦南心 + 2

查看全部评分

回复

使用道具 举报

     
发表于 2026-4-24 15:35 来自手机 | 显示全部楼层

删了重新发,改时间了

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-18 23:19 , Processed in 0.164623 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表