找回密码
 立即注册
搜索
楼主: 绕指流光

[科技] FT:DeepSeek下周发|已发,转为v4讨论楼

  [复制链接]
     
发表于 2026-4-24 15:36 | 显示全部楼层
Azcarlo 发表于 2026-4-24 14:33
engram我觉得不好说,知乎上看到有人在小模型上复现结果不是太好,只是一个模型提点trick,没有想象中那么 ...

感觉Engram还是得配合类似HBF这类极度优化读取带宽的新型硬件,目前硬件上Engram优势不大
回复

使用道具 举报

发表于 2026-4-24 15:38 | 显示全部楼层
所以菊花没有自家大模型虽然是个问题但也不是很大的问题,大不了直接抱ds大腿,生态足够了

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-4-24 15:39 | 显示全部楼层
最近人员变动比较大,希望不要影响DS后续研发
回复

使用道具 举报

     
发表于 2026-4-24 15:39 来自手机 | 显示全部楼层
回过头看,如果真的是因为算力导致训练拖延,原计划春节期间发布,那ds目前仍然保持着第一梯队的科研实力啊

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 15:39 | 显示全部楼层



问他怎么分橘子他会一直思考怎么才能一刀砍死多个小朋友

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 2战斗力 +3 收起 理由
a4ac7 + 2 一刀砍死两个同时把🍊切成两半,天才!.
戴里克·伯格 + 1 ai太邪恶了!

查看全部评分

回复

使用道具 举报

     
发表于 2026-4-24 15:41 | 显示全部楼层
qz66618 发表于 2026-4-24 14:23
看技术报告这次没有用到engram啊,技术不成熟还是什么原因

—— 来自 鹅球 v3.5.99 ...

预览版,等更新吧
回复

使用道具 举报

     
发表于 2026-4-24 15:47 | 显示全部楼层

评分

参与人数 1战斗力 +1 收起 理由
秦南心 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2026-4-24 15:49 | 显示全部楼层
qwased 发表于 2026-4-24 15:39
问他怎么分橘子他会一直思考怎么才能一刀砍死多个小朋友

网络上显然有这种讨论就自然收录进去了。
回复

使用道具 举报

发表于 2026-4-24 15:52 | 显示全部楼层
spck 发表于 2026-4-24 15:38
所以菊花没有自家大模型虽然是个问题但也不是很大的问题,大不了直接抱ds大腿,生态足够了

—— 来自 S1Fu ...

建议直接把小艺换成DS,小艺实在是有点蠢
回复

使用道具 举报

发表于 2026-4-24 15:54 | 显示全部楼层
云卷花开 发表于 2026-4-24 15:35
https://github.com/victorchen96/deepseek_v4_rolepaly_instruct/blob/main/README.md

感觉你楼可能不知 ...
PERSPECTIVE_NARRATOR: FIRST_PERSON .

跟我的指令有严重冲突,无法启动
回复

使用道具 举报

     
发表于 2026-4-24 15:55 | 显示全部楼层
想问问大家调api的手机app都用的哪家    Re:Source
回复

使用道具 举报

     
发表于 2026-4-24 15:56 来自手机 | 显示全部楼层
脸宽 发表于 2026-4-24 15:55
想问问大家调api的手机app都用的哪家    Re:Source

手机就装了个chatbox和tavo

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-4-24 16:02 来自手机 | 显示全部楼层

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-4-24 16:04 来自手机 | 显示全部楼层
本帖最后由 羊寢 于 2026-4-24 16:54 编辑

现在没法玩,问下pro的max酒馆里面要怎么调?
嗷,会了,插头选自定义,附加参数填reasoning_effort: max
回复

使用道具 举报

     
发表于 2026-4-24 16:11 | 显示全部楼层
半江瑟瑟半江红 发表于 2026-4-24 15:56
手机就装了个chatbox和tavo

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99

感谢,用了下tavo感觉挺方便的    Re:Source
回复

使用道具 举报

     
发表于 2026-4-24 16:11 来自手机 | 显示全部楼层
高粱河车神 发表于 2026-4-24 15:52
建议直接把小艺换成DS,小艺实在是有点蠢

小艺不是早就接入ds了?

—— 来自 HUAWEI TET-AN00, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 16:11 来自手机 | 显示全部楼层
回复

使用道具 举报

发表于 2026-4-24 16:13 来自手机 | 显示全部楼层
本帖最后由 德尔惠净水器 于 2026-4-24 16:14 编辑
蒜苗 发表于 2026-4-24 16:11
直播已经开了?


在播了         
回复

使用道具 举报

发表于 2026-4-24 16:25 | 显示全部楼层
这个直播都是是昇腾的人?
回复

使用道具 举报

     
发表于 2026-4-24 16:33 | 显示全部楼层
ff2077 发表于 2026-4-24 13:21
有没有试过写小说的,flash能用吗

—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...

可以用,但是容易忘设定,另外需要调教Prompt
Pro好很多
回复

使用道具 举报

     
发表于 2026-4-24 16:33 | 显示全部楼层
whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的

以前2.5-Pro是唯一能用的1M上下文模型,结果3.x大开倒车
回复

使用道具 举报

     
发表于 2026-4-24 16:35 | 显示全部楼层
高粱河车神 发表于 2026-4-24 14:14
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的

Gemini的特点是刚发的时候很惊艳,然后随着时间推移逐渐烂完
回复

使用道具 举报

     
发表于 2026-4-24 16:37 | 显示全部楼层
PRO的API写酒馆太奢侈了吧?写一篇可能大几十就出去了
回复

使用道具 举报

     
发表于 2026-4-24 16:39 | 显示全部楼层
ayanamilin 发表于 2026-4-24 15:23
vLLM-ascend(昇腾) 也 day-0 support 了,目前只支持 flash,A2 & A3 系列产品都能用:https://docs.vllm ...

昇腾950本身就是给DeepSeek设计的,其它家都没有使用混合精度训练,FP8和FP4算力基本上没卵用
回复

使用道具 举报

发表于 2026-4-24 16:39 来自手机 | 显示全部楼层
flash的注意力有问题,很容易出幻觉

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 16:39 | 显示全部楼层
ytrfegd 发表于 2026-4-24 16:37
PRO的API写酒馆太奢侈了吧?写一篇可能大几十就出去了

还有集美拿Opus 4.7玩酒馆(是不是中转站不清楚),每月开销几千人民币的呢
回复

使用道具 举报

     
发表于 2026-4-24 16:42 | 显示全部楼层
ytrfegd 发表于 2026-4-24 16:37
PRO的API写酒馆太奢侈了吧?写一篇可能大几十就出去了

不要小看鹿克啊

回复

使用道具 举报

     
发表于 2026-4-24 16:43 来自手机 | 显示全部楼层
1. 推理路径显著延长(深度思考能力)
   模型在回答前会进行更长的内部推理链推演,类似 slow-thinking。背后是强化学习优化,模型在训练中获得了更强的多步逻辑验证和自我纠错能力。对算法题、数学证明、复杂 debug 场景帮助明显。

2. 上下文窗口扩至 1M tokens
支持超长上下文处理,一次可装入三体三部曲体量的文本。技术层面是位置编码和注意力机制的优化,长程依赖保持较好。你可以直接喂整个项目源码仓库、完整日志或长文档,定位具体问题。

3. 联网搜索改为按需触发
不再是自动检索,而是作为可选工具调用,通过界面开关激活。减少不必要的网络 I/O 和无关信息注入,同时也降低延迟。当需要实时数据时,你手动打开即可。

4. 多模态理解聚焦于文本提取
虽不支持端到端视觉像素理解,但对图片、PDF、Office 文档(Word/Excel/PPT)、txt 等进行了统一的文本抽取与结构化处理。本质上是将非纯文本输入转为 token 序列纳入上下文,适合处理报告、表格、合同、扫描件里的文字信息。

5. 工程基础保持不变

- 依旧无任何付费墙,API/Web 均可**
- 对话数据默认不用于训练(可设置)
- App 端支持语音输入(ASR 集成)

---

总结成一句:推理链更深、上下文更长、工具调用更可控。跑代码、审方案、读长文,现在更趁手。有具体场景想测,随时试。



—— 来自 HUAWEI PLA-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 16:47 | 显示全部楼层
瞄了眼 /r/localllama 全是ds v4和 qwen 3.6。ds啥都好就是模型太大了很难本地部署。

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-24 16:48 | 显示全部楼层
华子要知耻啊,手机卖的贵就算了鸿蒙不支持很多app也忍了,ds的后腿再拖可不能忍啊
回复

使用道具 举报

发表于 2026-4-24 16:50 | 显示全部楼层
高粱河车神 发表于 2026-4-24 15:52
建议直接把小艺换成DS,小艺实在是有点蠢

小艺接的一直就是ds啊

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-4-24 16:53 | 显示全部楼层
pro和claude opus的api价格差多少啊?
之前用过一阵opus 4.5玩酒馆,打的是真爽,可惜后面没羊毛就停了。
回复

使用道具 举报

发表于 2026-4-24 16:54 | 显示全部楼层
试了一下,flash不太行,状态栏都生成不出来。pro还行,就是文笔不够涩,估计得提示词去调。之前用kimi不用提示词都能写得很涩。
回复

使用道具 举报

     
发表于 2026-4-24 16:56 | 显示全部楼层
Izunu_3 发表于 2026-4-24 16:53
pro和claude opus的api价格差多少啊?
之前用过一阵opus 4.5玩酒馆,打的是真爽,可惜后面没羊毛就停了。 ...

价格差约等于中美汇率差,DSV4 pro 乘以汇率就是 opus 的价格
回复

使用道具 举报

     
发表于 2026-4-24 16:59 | 显示全部楼层
本帖最后由 Sza 于 2026-4-24 17:54 编辑

我刚看昇腾cann直播第一部分好像ppt显示了部署v4需要的显存占用,我只瞄到一眼没截到图,可能是错觉。有楼友截图了吗?如果没有的话得等他们上传ppt和直播录像了。

==更新
昇腾b站号上传了直播录像【DeepSeek-V4昇腾首发:基于CANN的训推优化实践-哔哩哔哩】 https://www.bilibili.com/video/BV1KLo5BfEdG

24分28秒开始的ppt内容

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-4-24 17:01 | 显示全部楼层
高粱河车神 发表于 2026-4-24 15:52
建议直接把小艺换成DS,小艺实在是有点蠢

小艺应该能切换DS吧
回复

使用道具 举报

     
发表于 2026-4-24 17:03 | 显示全部楼层
发呆的龙虾 发表于 2026-4-24 16:54
试了一下,flash不太行,状态栏都生成不出来。pro还行,就是文笔不够涩,估计得提示词去调。之前用kimi不用 ...

等高手预设完善喽,才出来几个小时啊
回复

使用道具 举报

     
发表于 2026-4-24 17:03 | 显示全部楼层
脸宽 发表于 2026-4-24 15:55
想问问大家调api的手机app都用的哪家    Re:Source

chatbox,我觉得挺好用的
回复

使用道具 举报

发表于 2026-4-24 17:07 来自手机 | 显示全部楼层
千千千千鸟 发表于 2026-4-24 17:03
等高手预设完善喽,才出来几个小时啊

我都是自己写的提示词,没用酒馆预设。

—— 来自 HUAWEI BRA-AL00, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-4-24 17:08 | 显示全部楼层
ayanamilin 发表于 2026-4-24 15:15
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间,很大一部分原因就是要跟华子做适配 ...

这个国家任务了,国产大模型适配国产算力卡是硬性任务,希望华子不要拖梁总后腿
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-18 23:15 , Processed in 0.177021 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表