找回密码
 立即注册
搜索
查看: 28260|回复: 146

[科技] DeepSeek 深夜悄悄更新 3.1 版本,已更新官方公告

[复制链接]
头像被屏蔽
     
发表于 2025-8-20 07:43 | 显示全部楼层 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-8-20 07:53 | 显示全部楼层
Qwen第一个说推理模型和普通模式可以二合一, 然后又说走不通. GPT5用了个Router模型来判断. 我猜二合一这路子短时间内不如单独两个模型.
回复

使用道具 举报

发表于 2025-8-20 07:55 | 显示全部楼层
秋风未动蝉先觉,果然稍有风吹草动,深夜蹭折扣深耕刘备文的奇志儿女们最先受到波及
回复

使用道具 举报

     
发表于 2025-8-20 08:16 | 显示全部楼层
?游戏更新后mod出问题?
回复

使用道具 举报

头像被屏蔽
发表于 2025-8-20 08:30 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-8-20 08:32 | 显示全部楼层
幻觉减少,指令遵循提高,之前一个问题让他分析直接搞成PPT发癫,现在同一个问题像个正常AI了
同一个问题它的思考模式发生变化,旧版想的更多更加发散,新版更加偏向实用性思考,思考字数变少了

写黄写小说、故事好像寄了或者说出bug了
回复

使用道具 举报

     
发表于 2025-8-20 08:45 来自手机 | 显示全部楼层
更服从指令,不听话变少,但创作写作变差了?
回复

使用道具 举报

     
发表于 2025-8-20 08:45 | 显示全部楼层
Agent能力有提升吗
回复

使用道具 举报

发表于 2025-8-20 08:51 来自手机 | 显示全部楼层
deepseek非常讨厌要维护多个model,2.5也是把chat和coder合并了。

—— 来自 鹅球 v3.4.97
回复

使用道具 举报

     
发表于 2025-8-20 08:55 来自手机 | 显示全部楼层
体验下来,写小说服从指令比之前强,写的内容不如以前

—— 来自 Xiaomi 24129PN74C, Android 15, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2025-8-20 09:02 | 显示全部楼层
claude今年靠编程大杀四方后,各大厂路线貌似都转向指令遵从方面了
回复

使用道具 举报

发表于 2025-8-20 09:12 来自手机 | 显示全部楼层
bixinhaner 发表于 2025-8-20 09:02
claude今年靠编程大杀四方后,各大厂路线貌似都转向指令遵从方面了

因为做coding是最能消耗token的,特别是在agentic的形式下,并且真的有客户愿意烧。

—— 来自 鹅球 v3.4.97
回复

使用道具 举报

     
发表于 2025-8-20 09:14 来自手机 | 显示全部楼层


zsbd
回复@会飞的绿豆汤:我只测写代码。结论是可以。大家反馈不满意好像集中在DeepSeek连声都不吭就把API换了,导致好多人的业务炸了。这个操作的确抽象,按说应该让大家换模型名称,而不是直接偷着换接口内的模型。搁我我也生气。//@会飞的绿豆汤:所以这模型到底咋样,前面看用户很不满意,博主测试结果又还不错
回复

使用道具 举报

     
发表于 2025-8-20 09:20 来自手机 | 显示全部楼层
发论文了么?去知乎看一眼
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2025-8-20 09:21 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2025-8-20 09:25 来自手机 | 显示全部楼层
一图了解 DeepSeek-V3.1-Base 都更新了啥!

几个小时前 DeepSeek 正式发布了 DeepSeek-V3.1-Base,模型卡目前还没上传,所以看不到性能数据,我直接查看了模型配置文件和词汇表等数据,给大家做了个深度解析~ 让大家一图看懂这次DeepSeek-V3.1-Base 都更新了啥!

文字总结这次 DeepSeek-V3.1-Base 更新的4个要点:

- 这是一个 Hybrid-Model, 可以开关思考模式, 不知道 DeepSeek 是怎么考虑的, Qwen 通过社区验证已经放弃了 Hybrid-Model, Qwen3 的数据显示, 混合模型在非推理任务上的性能损失非常严重. 而 DeepSeek 则推出了 Hybrid-Model. 会不会 DeepSeek 找到了一种方法, 让 Hybrid-Model 更强?

- 另外新增了原生 search token 的支持, 这意味着搜索的支持更好. 我特意去看了下, R1 也没有这个 token, 所以应该是为了原生支持搜索而新启用的 token. 而不是为了统一 V3 和 R1 的词汇表. 目前社区返回搜索触发率特别高, 除非明确提示它不要搜索. 不过我估计应该有开关, 因为目前模型卡还没放出来, 我这个报告写于 2025-08-20 04:50, 估计没准等到10点 DeepSeek上班了他们就上传模型卡告诉大家怎么关闭了. 如果真的没有关闭的选项, 这可能非常糟糕...

- 编程能力可能特别强, 从社区中拿 Aider 来测的数据看, 直接就开放权重模型第一名了.

- 上下文长度其实没变, 旧版 DeepSeek-V3-Base 也是 128K.

#ai创造营##ai生活指南##DeepSeek#
https://weibo.com/2169039837/5201599645090348




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2025-8-20 09:31 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-8-20 09:37 | 显示全部楼层
gpt5也是这套,感觉看来混合模型糊弄事nerf是大势所趋

是钱不够烧了还是怎的
回复

使用道具 举报

发表于 2025-8-20 09:55 来自手机 | 显示全部楼层
jojog 发表于 2025-8-20 09:37
gpt5也是这套,感觉看来混合模型糊弄事nerf是大势所趋

是钱不够烧了还是怎的 ...

gpt5是好几个模型,不是混合的,加了个router,效果其实一般。
deepseek喜欢合并模型,只维护一个,v2就合了coder和chat,现在合了reasoner和chat

—— 来自 鹅球 v3.4.97
回复

使用道具 举报

     
发表于 2025-8-20 09:56 来自手机 | 显示全部楼层

还真有用ds官网api做业务的吗?官网不是不稳吗?

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-8-20 09:58 | 显示全部楼层
你说是就是 发表于 2025-8-20 07:55
秋风未动蝉先觉,果然稍有风吹草动,深夜蹭折扣深耕刘备文的奇志儿女们最先受到波及 ...

md给我整笑了,深夜api确实更便宜
回复

使用道具 举报

     
发表于 2025-8-20 09:59 | 显示全部楼层
木水风铃 发表于 2025-8-20 09:56
还真有用ds官网api做业务的吗?官网不是不稳吗?

—— 来自 鹅球 v3.3.96

过年火的时候不稳,现在没问题,我一直用官网买的api跑团
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2025-8-20 10:07 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-8-20 10:24 来自手机 | 显示全部楼层
我说怎么聊着聊着发现思考字数变少了
回复

使用道具 举报

     
发表于 2025-8-20 10:31 | 显示全部楼层
我听到的奇志儿女说的是更听话了,发癫少了,这对刘备文互动就好多了
至于写作能力下降的没听到
因为第一条的反馈太好了
回复

使用道具 举报

     
发表于 2025-8-20 10:32 | 显示全部楼层
最近用 ds改代码,发现他偶尔会说修正了一个拼写错误,但是实际上源代码里面是正确的,比如  minutes,他说修改Mintues为minutes,也不知道怎么出现的。
回复

使用道具 举报

     
发表于 2025-8-20 10:33 | 显示全部楼层
木水风铃 发表于 2025-8-20 09:56
还真有用ds官网api做业务的吗?官网不是不稳吗?

—— 来自 鹅球 v3.3.96

给钱的API还是比较稳定的
回复

使用道具 举报

     
发表于 2025-8-20 10:40 来自手机 | 显示全部楼层
奇志儿女表示一般货色,可能是需要磨合期,但是v3当时上手就很好用
第一个回答就会中文夹英文,发癫堪比老r1,也是第一个回答就开始颠,不发癫的时候和老v3没感觉出明显差别。但是我用v3的原因就是它不发癫和一开始做引导,现在只好多刷几条了。
文本处理和推理能力稍有上升,在v3和r1之间。
回复

使用道具 举报

     
发表于 2025-8-20 10:43 | 显示全部楼层


希望以后能分模型吧,其实现在的3.1在构筑角色人设这方面反而是提升了的,因为理解能力变强(但思考范围变窄)了


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

发表于 2025-8-20 11:07 来自手机 | 显示全部楼层
バーチャルS1er 发表于 2025-8-20 10:43
希望以后能分模型吧,其实现在的3.1在构筑角色人设这方面反而是提升了的,因为理解能力变强(但思考范围 ...

这个一看就不是deepseek的,deepseek从来不放lmarena,估计是那个狂蒸馏出来的模型

—— 来自 鹅球 v3.4.97
回复

使用道具 举报

     
发表于 2025-8-20 11:25 | 显示全部楼层
不过改进也是存在的。
至少无处不在的“铁锈味”总算消失了。
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2025-8-20 11:57 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-8-20 12:01 来自手机 | 显示全部楼层
所以,还能拿来写皇叔吗

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-8-20 12:12 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2025-8-20 12:29 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-8-20 12:37 | 显示全部楼层
万恶淫猥手 发表于 2025-8-20 12:29
答案当然是可以,换句话说要是在酒馆里用,应该是加强了的

对AI不熟,你们老说的酒馆是什么?
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2025-8-20 12:51 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-8-20 12:59 | 显示全部楼层
ww-tsl 发表于 2025-8-20 12:37
对AI不熟,你们老说的酒馆是什么?

一个专门AI角色扮演的对话辅助软件,安装和入门稍微有些麻烦,你要先连接AI大模型API,再安装通过各类社区里找的各类预设、人物卡、世界书才算正常用
回复

使用道具 举报

     
发表于 2025-8-20 13:42 | 显示全部楼层

就之前官方api的承压能力 真有人用官方的做业务吗
官方我就自己用用 前司做业务用的ds都是走火山
回复

使用道具 举报

发表于 2025-8-20 13:54 | 显示全部楼层
万恶淫猥手 发表于 2025-8-20 09:31
D 指导老传统,先给你换了再发公告。理论上,严肃业务慎用官方 API...

官方一直不承诺提供商用级服务,生产业务还是要用正经云厂商的托管API
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-21 04:57 , Processed in 0.175509 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表