DeepSeek 深夜悄悄更新 3.1 版本，已更新官方公告

万恶淫猥手 · 发表于 2025-8-20 07:43

提示: 作者被禁止或删除内容自动屏蔽

泰坦失足 · 发表于 2025-8-20 07:53

Qwen第一个说推理模型和普通模式可以二合一, 然后又说走不通. GPT5用了个Router模型来判断. 我猜二合一这路子短时间内不如单独两个模型.

你说是就是 · 发表于 2025-8-20 07:55

秋风未动蝉先觉，果然稍有风吹草动，深夜蹭折扣深耕刘备文的奇志儿女们最先受到波及

星花 · 发表于 2025-8-20 08:16

？游戏更新后mod出问题？

上神乘光 · 发表于 2025-8-20 08:30

提示: 作者被禁止或删除内容自动屏蔽

バーチャルS1er · 发表于 2025-8-20 08:32

幻觉减少，指令遵循提高，之前一个问题让他分析直接搞成PPT发癫，现在同一个问题像个正常AI了
同一个问题它的思考模式发生变化，旧版想的更多更加发散，新版更加偏向实用性思考，思考字数变少了

写黄写小说、故事好像寄了或者说出bug了

gammatau · 发表于 2025-8-20 08:45

更服从指令，不听话变少，但创作写作变差了？

zypyong · 发表于 2025-8-20 08:45

Agent能力有提升吗

overflowal · 发表于 2025-8-20 08:51

deepseek非常讨厌要维护多个model，2.5也是把chat和coder合并了。

—— 来自鹅球 v3.4.97

2sunur · 发表于 2025-8-20 08:55

体验下来，写小说服从指令比之前强，写的内容不如以前

—— 来自 Xiaomi 24129PN74C, Android 15, 鹅球 v3.5.99

bixinhaner · 发表于 2025-8-20 09:02

claude今年靠编程大杀四方后，各大厂路线貌似都转向指令遵从方面了

overflowal · 发表于 2025-8-20 09:12

bixinhaner 发表于 2025-8-20 09:02
claude今年靠编程大杀四方后，各大厂路线貌似都转向指令遵从方面了

因为做coding是最能消耗token的，特别是在agentic的形式下，并且真的有客户愿意烧。

—— 来自鹅球 v3.4.97

勿徊哉 · 发表于 2025-8-20 09:14

zsbd

回复@会飞的绿豆汤:我只测写代码。结论是可以。大家反馈不满意好像集中在DeepSeek连声都不吭就把API换了，导致好多人的业务炸了。这个操作的确抽象，按说应该让大家换模型名称，而不是直接偷着换接口内的模型。搁我我也生气。//@会飞的绿豆汤:所以这模型到底咋样，前面看用户很不满意，博主测试结果又还不错

FeteFrumoase · 发表于 2025-8-20 09:20

发论文了么？去知乎看一眼

万恶淫猥手 · 发表于 2025-8-20 09:21

提示: 作者被禁止或删除内容自动屏蔽

哈利谢顿 · 发表于 2025-8-20 09:25

一图了解 DeepSeek-V3.1-Base 都更新了啥！

几个小时前 DeepSeek 正式发布了 DeepSeek-V3.1-Base，模型卡目前还没上传，所以看不到性能数据，我直接查看了模型配置文件和词汇表等数据，给大家做了个深度解析~ 让大家一图看懂这次DeepSeek-V3.1-Base 都更新了啥！

文字总结这次 DeepSeek-V3.1-Base 更新的4个要点：

- 这是一个 Hybrid-Model, 可以开关思考模式, 不知道 DeepSeek 是怎么考虑的, Qwen 通过社区验证已经放弃了 Hybrid-Model, Qwen3 的数据显示, 混合模型在非推理任务上的性能损失非常严重. 而 DeepSeek 则推出了 Hybrid-Model. 会不会 DeepSeek 找到了一种方法, 让 Hybrid-Model 更强?

- 另外新增了原生 search token 的支持, 这意味着搜索的支持更好. 我特意去看了下, R1 也没有这个 token, 所以应该是为了原生支持搜索而新启用的 token. 而不是为了统一 V3 和 R1 的词汇表. 目前社区返回搜索触发率特别高, 除非明确提示它不要搜索. 不过我估计应该有开关, 因为目前模型卡还没放出来, 我这个报告写于 2025-08-20 04:50, 估计没准等到10点 DeepSeek上班了他们就上传模型卡告诉大家怎么关闭了. 如果真的没有关闭的选项, 这可能非常糟糕...

- 编程能力可能特别强, 从社区中拿 Aider 来测的数据看, 直接就开放权重模型第一名了.

- 上下文长度其实没变, 旧版 DeepSeek-V3-Base 也是 128K.

#ai创造营##ai生活指南##DeepSeek#
https://weibo.com/2169039837/5201599645090348

万恶淫猥手 · 发表于 2025-8-20 09:31

提示: 作者被禁止或删除内容自动屏蔽

jojog · 发表于 2025-8-20 09:37

gpt5也是这套，感觉看来混合模型糊弄事nerf是大势所趋

是钱不够烧了还是怎的

overflowal · 发表于 2025-8-20 09:55

jojog 发表于 2025-8-20 09:37
gpt5也是这套，感觉看来混合模型糊弄事nerf是大势所趋

是钱不够烧了还是怎的 ...

gpt5是好几个模型，不是混合的，加了个router，效果其实一般。
deepseek喜欢合并模型，只维护一个，v2就合了coder和chat，现在合了reasoner和chat

—— 来自鹅球 v3.4.97

木水风铃 · 发表于 2025-8-20 09:56

勿徊哉发表于 2025-8-20 09:14
zsbd

还真有用ds官网api做业务的吗？

官网不是不稳吗？

—— 来自鹅球 v3.3.96

阿萨辛艾沃尔 · 发表于 2025-8-20 09:58

你说是就是发表于 2025-8-20 07:55
秋风未动蝉先觉，果然稍有风吹草动，深夜蹭折扣深耕刘备文的奇志儿女们最先受到波及 ...

md给我整笑了，深夜api确实更便宜

阿萨辛艾沃尔 · 发表于 2025-8-20 09:59

木水风铃发表于 2025-8-20 09:56
还真有用ds官网api做业务的吗？官网不是不稳吗？

—— 来自鹅球 v3.3.96

过年火的时候不稳，现在没问题，我一直用官网买的api跑团

万恶淫猥手 · 发表于 2025-8-20 10:07

提示: 作者被禁止或删除内容自动屏蔽

我特么吹爆 · 发表于 2025-8-20 10:24

我说怎么聊着聊着发现思考字数变少了

无事忙 · 发表于 2025-8-20 10:31

我听到的奇志儿女说的是更听话了，发癫少了，这对刘备文互动就好多了
至于写作能力下降的没听到
因为第一条的反馈太好了

随风来去 · 发表于 2025-8-20 10:32

最近用 ds改代码，发现他偶尔会说修正了一个拼写错误，但是实际上源代码里面是正确的，比如 minutes，他说修改Mintues为minutes，也不知道怎么出现的。

随风来去 · 发表于 2025-8-20 10:33

木水风铃发表于 2025-8-20 09:56
还真有用ds官网api做业务的吗？官网不是不稳吗？

—— 来自鹅球 v3.3.96

给钱的API还是比较稳定的

mintslime · 发表于 2025-8-20 10:40

奇志儿女表示一般货色，可能是需要磨合期，但是v3当时上手就很好用
第一个回答就会中文夹英文，发癫堪比老r1，也是第一个回答就开始颠，不发癫的时候和老v3没感觉出明显差别。但是我用v3的原因就是它不发癫和一开始做引导，现在只好多刷几条了。
文本处理和推理能力稍有上升，在v3和r1之间。

バーチャルS1er · 发表于 2025-8-20 10:43

希望以后能分模型吧，其实现在的3.1在构筑角色人设这方面反而是提升了的，因为理解能力变强（但思考范围变窄）了

overflowal · 发表于 2025-8-20 11:07

バーチャルS1er 发表于 2025-8-20 10:43
希望以后能分模型吧，其实现在的3.1在构筑角色人设这方面反而是提升了的，因为理解能力变强（但思考范围 ...

这个一看就不是deepseek的，deepseek从来不放lmarena，估计是那个狂蒸馏出来的模型

—— 来自鹅球 v3.4.97

ww-tsl · 发表于 2025-8-20 11:25

不过改进也是存在的。
至少无处不在的“铁锈味”总算消失了。

万恶淫猥手 · 发表于 2025-8-20 11:57

提示: 作者被禁止或删除内容自动屏蔽

7776169 · 发表于 2025-8-20 12:01

所以，还能拿来写皇叔吗

—— 来自鹅球 v3.3.96

日参省乎己 · 发表于 2025-8-20 12:12

提示: 作者被禁止或删除内容自动屏蔽

万恶淫猥手 · 发表于 2025-8-20 12:29

提示: 作者被禁止或删除内容自动屏蔽

ww-tsl · 发表于 2025-8-20 12:37

万恶淫猥手发表于 2025-8-20 12:29
答案当然是可以，换句话说要是在酒馆里用，应该是加强了的

对AI不熟，你们老说的酒馆是什么？

万恶淫猥手 · 发表于 2025-8-20 12:51

提示: 作者被禁止或删除内容自动屏蔽

バーチャルS1er · 发表于 2025-8-20 12:59

ww-tsl 发表于 2025-8-20 12:37
对AI不熟，你们老说的酒馆是什么？

一个专门AI角色扮演的对话辅助软件，安装和入门稍微有些麻烦，你要先连接AI大模型API，再安装通过各类社区里找的各类预设、人物卡、世界书才算正常用

kouym · 发表于 2025-8-20 13:42

勿徊哉发表于 2025-8-20 09:14
zsbd

就之前官方api的承压能力真有人用官方的做业务吗
官方我就自己用用前司做业务用的ds都是走火山

cmdycj0732 · 发表于 2025-8-20 13:54

万恶淫猥手发表于 2025-8-20 09:31
D 指导老传统，先给你换了再发公告。理论上，严肃业务慎用官方 API...

官方一直不承诺提供商用级服务，生产业务还是要用正经云厂商的托管API

		自动登录	找回密码
密码			立即注册

[科技] DeepSeek 深夜悄悄更新 3.1 版本，已更新官方公告

本帖子中包含更多资源

本帖子中包含更多资源

万恶淫猥手万恶淫猥手当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2011-6-9 头像被屏蔽	发表于 2025-8-20 07:43 \| 显示全部楼层 \|阅读模式提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

上神乘光上神乘光当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2025-7-26 头像被屏蔽	发表于 2025-8-20 08:30 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

万恶淫猥手万恶淫猥手当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2011-6-9 头像被屏蔽	楼主\| 发表于 2025-8-20 09:21 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

万恶淫猥手万恶淫猥手当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2011-6-9 头像被屏蔽	楼主\| 发表于 2025-8-20 09:31 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

万恶淫猥手万恶淫猥手当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2011-6-9 头像被屏蔽	楼主\| 发表于 2025-8-20 10:07 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

万恶淫猥手万恶淫猥手当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2011-6-9 头像被屏蔽	楼主\| 发表于 2025-8-20 11:57 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

日参省乎己日参省乎己当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2021-4-11 头像被屏蔽	发表于 2025-8-20 12:12 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

万恶淫猥手万恶淫猥手当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2011-6-9 头像被屏蔽	楼主\| 发表于 2025-8-20 12:29 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

万恶淫猥手万恶淫猥手当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2011-6-9 头像被屏蔽	楼主\| 发表于 2025-8-20 12:51 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报