overflowal 发表于 2025-5-28 18:22

Deepseek小版本更新R1了

本帖最后由 overflowal 于 2025-5-28 18:23 编辑

见微信通知,说是“小更新”。(鉴于v3 0324的水平,Deepseek对小的定义和别家不太一样。。。)
网页和官方api都更新了。权重可能还在上传,更新日志还没出来

zerona 发表于 2025-5-28 19:12

哪位能测测有啥变化么? 不是搞程序的,只是我之前用它编文一直在机械飞升的状态出不来。

Litccc 发表于 2025-5-28 19:13

上下文长度变成128k了

UNICORN00 发表于 2025-5-28 19:14

jamboo 发表于 2025-5-28 19:25

还没收到通知推送

overflowal 发表于 2025-5-28 19:32

zerona 发表于 2025-5-28 19:12
哪位能测测有啥变化么? 不是搞程序的,只是我之前用它编文一直在机械飞升的状态出不来。 ...

目前看来是编程能力大幅提升,指令跟随能力也变得更强。具体提升多少还要看技术报告

—— 来自 鹅球 v3.4.97

zerona 发表于 2025-5-28 19:43

overflowal 发表于 2025-5-28 19:32
目前看来是编程能力大幅提升,指令跟随能力也变得更强。具体提升多少还要看技术报告

—— 来自 鹅球 v3. ...

bat 或者脚本编起来没啥大问题了?

overflowal 发表于 2025-5-29 11:33

zerona 发表于 2025-5-28 19:43
bat 或者脚本编起来没啥大问题了?

岂止是没问题,强化到gemini2.5 pro opus4 o3这种水平了。
可以一次性吐上千行没bug的代码。

zerona 发表于 2025-5-29 16:32

overflowal 发表于 2025-5-29 11:33
岂止是没问题,强化到gemini2.5 pro opus4 o3这种水平了。
可以一次性吐上千行没bug的代码。 ...

谢了。我去试试了。这简直……

andychen 发表于 2025-5-29 16:43

推理token增加了不少,质量提高成本上升

无尽的牙刷 发表于 2025-5-29 17:16

能用日语思考了

德尔惠净水器 发表于 2025-5-29 20:34

ds团队发文了https://mp.weixin.qq.com/s/U5fnTRW4cGvXYJER__YBiw

卖哥 发表于 2025-5-29 20:42

脸宽 发表于 2025-5-29 20:58

等着各家跟进了,还是第三方128上下文

我特么吹爆 发表于 2025-5-30 02:40

硅基流动的上下文标称9万8000token ,经测试的确是这个长度。这么扣的吗?还不如用openrouter的免费模型。
可惜了,我给官网冲的钱是彻底花不掉了。64k上下文太短。

奶香花卷 发表于 2025-5-30 07:13

我特么吹爆 发表于 2025-5-30 02:40
硅基流动的上下文标称9万8000token ,经测试的确是这个长度。这么扣的吗?还不如用openrouter的免费模型。
...

我实在不知道国内这些大厂怎么想的清一色64k上下文8k输出

万恶淫猥手 发表于 2025-5-30 07:55

奶香花卷 发表于 2025-5-30 07:13
我实在不知道国内这些大厂怎么想的清一色64k上下文8k输出

因为省钱啊

overflowal 发表于 2025-5-30 09:02

奶香花卷 发表于 2025-5-30 07:13
我实在不知道国内这些大厂怎么想的清一色64k上下文8k输出

对标官方呗,省钱呗。国外基本都是开满的

—— 来自 鹅球 v3.4.97

奶香花卷 发表于 2025-5-30 12:30

overflowal 发表于 2025-5-30 09:02
对标官方呗,省钱呗。国外基本都是开满的

—— 来自 鹅球 v3.4.97

现在官方输出r1是64k了

kouym 发表于 2025-5-30 14:10

确实强很多 上个版生成出来的网页 很多图表数据 位置都会有小问题 还要丢给v3改一下
这个版直接出来就很完美

德尔惠净水器 发表于 2025-5-30 15:53

比之前的版本好用很多,很多答案都能有更详细正确的总结

qratosones1337 发表于 2025-5-30 21:25

拿来写刘备文,效果有质的飞跃

zerona 发表于 2025-5-31 17:16

qratosones1337 发表于 2025-5-30 21:25
拿来写刘备文,效果有质的飞跃

不那么机械飞升了?

neptunehs 发表于 2025-5-31 22:42

qratosones1337 发表于 2025-5-30 21:25
拿来写刘备文,效果有质的飞跃

可以求一下写刘备文的酒馆卡么
指引下去哪搞也可以

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99

Realplayer 发表于 2025-5-31 22:57

离线玩怎么搞?ollama有模型了吗

diohanmilton 发表于 2025-5-31 23:17

Realplayer 发表于 2025-5-31 22:57
离线玩怎么搞?ollama有模型了吗

刚看ollama才更新了8B蒸馏

精钢魔像 发表于 2025-6-1 00:25

8b蒸馏能用吗

diohanmilton 发表于 2025-6-1 01:19

精钢魔像 发表于 2025-6-1 00:25
8b蒸馏能用吗

下完了,让他给我做一个旅行建议,景点还都是虚构的。

我明天再试试写代码吧

—— 来自 鹅球 v3.3.96-alpha
页: [1]
查看完整版本: Deepseek小版本更新R1了