Azcarlo 发表于 2026-4-24 14:33
engram我觉得不好说,知乎上看到有人在小模型上复现结果不是太好,只是一个模型提点trick,没有想象中那么 ...
感觉Engram还是得配合类似HBF这类极度优化读取带宽的新型硬件,目前硬件上Engram优势不大
所以菊花没有自家大模型虽然是个问题但也不是很大的问题,大不了直接抱ds大腿,生态足够了
—— 来自 S1Fun
最近人员变动比较大,希望不要影响DS后续研发
回过头看,如果真的是因为算力导致训练拖延,原计划春节期间发布,那ds目前仍然保持着第一梯队的科研实力啊
—— 来自 鹅球 v3.5.99
问他怎么分橘子他会一直思考怎么才能一刀砍死多个小朋友
qz66618 发表于 2026-4-24 14:23
看技术报告这次没有用到engram啊,技术不成熟还是什么原因
—— 来自 鹅球 v3.5.99 ...
预览版,等更新吧
玩酒馆的可以参考下这个
https://github.com/victorchen96/deepseek_v4_rolepaly_instruct
qwased 发表于 2026-4-24 15:39
问他怎么分橘子他会一直思考怎么才能一刀砍死多个小朋友
网络上显然有这种讨论就自然收录进去了。
spck 发表于 2026-4-24 15:38
所以菊花没有自家大模型虽然是个问题但也不是很大的问题,大不了直接抱ds大腿,生态足够了
—— 来自 S1Fu ...
建议直接把小艺换成DS,小艺实在是有点蠢
云卷花开 发表于 2026-4-24 15:35
https://github.com/victorchen96/deepseek_v4_rolepaly_instruct/blob/main/README.md
感觉你楼可能不知 ...
PERSPECTIVE_NARRATOR: FIRST_PERSON .
跟我的指令有严重冲突,无法启动
想问问大家调api的手机app都用的哪家 Re:Source
脸宽 发表于 2026-4-24 15:55
想问问大家调api的手机app都用的哪家 Re:Source
手机就装了个chatbox和tavo
—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
本帖最后由 羊寢 于 2026-4-24 16:54 编辑
现在没法玩,问下pro的max酒馆里面要怎么调?
嗷,会了,插头选自定义,附加参数填reasoning_effort: max
半江瑟瑟半江红 发表于 2026-4-24 15:56
手机就装了个chatbox和tavo
—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
感谢,用了下tavo感觉挺方便的 Re:Source
高粱河车神 发表于 2026-4-24 15:52
建议直接把小艺换成DS,小艺实在是有点蠢
小艺不是早就接入ds了?
—— 来自 HUAWEI TET-AN00, Android 12, 鹅球 v3.5.99
德尔惠净水器 发表于 2026-4-24 16:02
直播已经开了?
本帖最后由 德尔惠净水器 于 2026-4-24 16:14 编辑
蒜苗 发表于 2026-4-24 16:11
直播已经开了?
在播了
这个直播都是是昇腾的人?
ff2077 发表于 2026-4-24 13:21
有没有试过写小说的,flash能用吗
—— 来自 Xiaomi 24122RKC7C, Android 16, 鹅球 v3.5.99-alpha ...
可以用,但是容易忘设定,另外需要调教Prompt
Pro好很多
whzfjd 发表于 2026-4-24 13:16
gemini 已经这么人嫌狗厌了吗,我拿来当外网豆包用的
以前2.5-Pro是唯一能用的1M上下文模型,结果3.x大开倒车
高粱河车神 发表于 2026-4-24 14:14
Gemini现在这么差吗,我记得半年前大家普遍还认为这是最好用的
Gemini的特点是刚发的时候很惊艳,然后随着时间推移逐渐烂完
PRO的API写酒馆太奢侈了吧?写一篇可能大几十就出去了
ayanamilin 发表于 2026-4-24 15:23
vLLM-ascend(昇腾) 也 day-0 support 了,目前只支持 flash,A2 & A3 系列产品都能用:https://docs.vllm ...
昇腾950本身就是给DeepSeek设计的,其它家都没有使用混合精度训练,FP8和FP4算力基本上没卵用
flash的注意力有问题,很容易出幻觉
—— 来自 鹅球 v3.5.99
ytrfegd 发表于 2026-4-24 16:37
PRO的API写酒馆太奢侈了吧?写一篇可能大几十就出去了
还有集美拿Opus 4.7玩酒馆(是不是中转站不清楚),每月开销几千人民币的呢
ytrfegd 发表于 2026-4-24 16:37
PRO的API写酒馆太奢侈了吧?写一篇可能大几十就出去了
不要小看鹿克啊
1. 推理路径显著延长(深度思考能力)
模型在回答前会进行更长的内部推理链推演,类似 slow-thinking。背后是强化学习优化,模型在训练中获得了更强的多步逻辑验证和自我纠错能力。对算法题、数学证明、复杂 debug 场景帮助明显。
2. 上下文窗口扩至 1M tokens
支持超长上下文处理,一次可装入三体三部曲体量的文本。技术层面是位置编码和注意力机制的优化,长程依赖保持较好。你可以直接喂整个项目源码仓库、完整日志或长文档,定位具体问题。
3. 联网搜索改为按需触发
不再是自动检索,而是作为可选工具调用,通过界面开关激活。减少不必要的网络 I/O 和无关信息注入,同时也降低延迟。当需要实时数据时,你手动打开即可。
4. 多模态理解聚焦于文本提取
虽不支持端到端视觉像素理解,但对图片、PDF、Office 文档(Word/Excel/PPT)、txt 等进行了统一的文本抽取与结构化处理。本质上是将非纯文本输入转为 token 序列纳入上下文,适合处理报告、表格、合同、扫描件里的文字信息。
5. 工程基础保持不变
- 依旧无任何付费墙,API/Web 均可**
- 对话数据默认不用于训练(可设置)
- App 端支持语音输入(ASR 集成)
---
总结成一句:推理链更深、上下文更长、工具调用更可控。跑代码、审方案、读长文,现在更趁手。有具体场景想测,随时试。
好
—— 来自 HUAWEI PLA-AL10, Android 12, 鹅球 v3.5.99
瞄了眼 /r/localllama 全是ds v4和 qwen 3.6。ds啥都好就是模型太大了很难本地部署。
论坛助手,iPhone
华子要知耻啊,手机卖的贵就算了鸿蒙不支持很多app也忍了,ds的后腿再拖可不能忍啊
高粱河车神 发表于 2026-4-24 15:52
建议直接把小艺换成DS,小艺实在是有点蠢
小艺接的一直就是ds啊
—— 来自 S1Fun
pro和claude opus的api价格差多少啊?
之前用过一阵opus 4.5玩酒馆,打的是真爽,可惜后面没羊毛就停了。
试了一下,flash不太行,状态栏都生成不出来。pro还行,就是文笔不够涩,估计得提示词去调。之前用kimi不用提示词都能写得很涩。
Izunu_3 发表于 2026-4-24 16:53
pro和claude opus的api价格差多少啊?
之前用过一阵opus 4.5玩酒馆,打的是真爽,可惜后面没羊毛就停了。 ...
价格差约等于中美汇率差,DSV4 pro 乘以汇率就是 opus 的价格
本帖最后由 Sza 于 2026-4-24 17:54 编辑
我刚看昇腾cann直播第一部分好像ppt显示了部署v4需要的显存占用,我只瞄到一眼没截到图,可能是错觉。有楼友截图了吗?如果没有的话得等他们上传ppt和直播录像了。
==更新
昇腾b站号上传了直播录像【DeepSeek-V4昇腾首发:基于CANN的训推优化实践-哔哩哔哩】 https://www.bilibili.com/video/BV1KLo5BfEdG
24分28秒开始的ppt内容
高粱河车神 发表于 2026-4-24 15:52
建议直接把小艺换成DS,小艺实在是有点蠢
小艺应该能切换DS吧
发呆的龙虾 发表于 2026-4-24 16:54
试了一下,flash不太行,状态栏都生成不出来。pro还行,就是文笔不够涩,估计得提示词去调。之前用kimi不用 ...
等高手预设完善喽,才出来几个小时啊
脸宽 发表于 2026-4-24 15:55
想问问大家调api的手机app都用的哪家 Re:Source
chatbox,我觉得挺好用的
千千千千鸟 发表于 2026-4-24 17:03
等高手预设完善喽,才出来几个小时啊
我都是自己写的提示词,没用酒馆预设。
—— 来自 HUAWEI BRA-AL00, Android 12, 鹅球 v3.5.99
ayanamilin 发表于 2026-4-24 15:15
下午四点昇腾要进行直播。DSV4 从训好到发布拖了这么长时间,很大一部分原因就是要跟华子做适配 ...
这个国家任务了,国产大模型适配国产算力卡是硬性任务,希望华子不要拖梁总后腿