Deepseek小版本更新R1了
本帖最后由 overflowal 于 2025-5-28 18:23 编辑见微信通知,说是“小更新”。(鉴于v3 0324的水平,Deepseek对小的定义和别家不太一样。。。)
网页和官方api都更新了。权重可能还在上传,更新日志还没出来
哪位能测测有啥变化么? 不是搞程序的,只是我之前用它编文一直在机械飞升的状态出不来。 上下文长度变成128k了 还没收到通知推送 zerona 发表于 2025-5-28 19:12
哪位能测测有啥变化么? 不是搞程序的,只是我之前用它编文一直在机械飞升的状态出不来。 ...
目前看来是编程能力大幅提升,指令跟随能力也变得更强。具体提升多少还要看技术报告
—— 来自 鹅球 v3.4.97 overflowal 发表于 2025-5-28 19:32
目前看来是编程能力大幅提升,指令跟随能力也变得更强。具体提升多少还要看技术报告
—— 来自 鹅球 v3. ...
bat 或者脚本编起来没啥大问题了? zerona 发表于 2025-5-28 19:43
bat 或者脚本编起来没啥大问题了?
岂止是没问题,强化到gemini2.5 pro opus4 o3这种水平了。
可以一次性吐上千行没bug的代码。 overflowal 发表于 2025-5-29 11:33
岂止是没问题,强化到gemini2.5 pro opus4 o3这种水平了。
可以一次性吐上千行没bug的代码。 ...
谢了。我去试试了。这简直…… 推理token增加了不少,质量提高成本上升 能用日语思考了 ds团队发文了https://mp.weixin.qq.com/s/U5fnTRW4cGvXYJER__YBiw 等着各家跟进了,还是第三方128上下文 硅基流动的上下文标称9万8000token ,经测试的确是这个长度。这么扣的吗?还不如用openrouter的免费模型。
可惜了,我给官网冲的钱是彻底花不掉了。64k上下文太短。 我特么吹爆 发表于 2025-5-30 02:40
硅基流动的上下文标称9万8000token ,经测试的确是这个长度。这么扣的吗?还不如用openrouter的免费模型。
...
我实在不知道国内这些大厂怎么想的清一色64k上下文8k输出 奶香花卷 发表于 2025-5-30 07:13
我实在不知道国内这些大厂怎么想的清一色64k上下文8k输出
因为省钱啊 奶香花卷 发表于 2025-5-30 07:13
我实在不知道国内这些大厂怎么想的清一色64k上下文8k输出
对标官方呗,省钱呗。国外基本都是开满的
—— 来自 鹅球 v3.4.97 overflowal 发表于 2025-5-30 09:02
对标官方呗,省钱呗。国外基本都是开满的
—— 来自 鹅球 v3.4.97
现在官方输出r1是64k了 确实强很多 上个版生成出来的网页 很多图表数据 位置都会有小问题 还要丢给v3改一下
这个版直接出来就很完美 比之前的版本好用很多,很多答案都能有更详细正确的总结 拿来写刘备文,效果有质的飞跃 qratosones1337 发表于 2025-5-30 21:25
拿来写刘备文,效果有质的飞跃
不那么机械飞升了? qratosones1337 发表于 2025-5-30 21:25
拿来写刘备文,效果有质的飞跃
可以求一下写刘备文的酒馆卡么
指引下去哪搞也可以
—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99 离线玩怎么搞?ollama有模型了吗 Realplayer 发表于 2025-5-31 22:57
离线玩怎么搞?ollama有模型了吗
刚看ollama才更新了8B蒸馏 8b蒸馏能用吗 精钢魔像 发表于 2025-6-1 00:25
8b蒸馏能用吗
下完了,让他给我做一个旅行建议,景点还都是虚构的。
我明天再试试写代码吧
—— 来自 鹅球 v3.3.96-alpha
页:
[1]