zy450 发表于 2026-4-4 15:10

冤枉呐 发表于 2026-4-4 12:24
硅基流动的api
根本没有甲


确实,最近爱上了轨迹流动

—— 来自 Xiaomi 24031PN0DC, Android 16, 鹅球 v3.5.99

squallx 发表于 2026-4-4 15:12

这还是泥潭吗 怎么没有把LZ塞到发布为止?

Thalassa 发表于 2026-4-4 16:11

网页版使用体验有明显变化,比硅基流动的v3.2强很多(又慢又蠢) 希望v4能把我现在用的Gemini 3 flash取代掉,其他国模知识面上感觉都差很多

冤枉呐 发表于 2026-4-5 12:18

zy450 发表于 2026-4-4 15:10
确实,最近爱上了轨迹流动

—— 来自 Xiaomi 24031PN0DC, Android 16, 鹅球 v3.5.99

我已经写到索然无味了
他思考过程都是“哎呀你要写刘备,我来想想怎么更好地写”

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99

qwased 发表于 2026-4-5 12:28

现在网页版好像都是新的高智力模型了,用着舒服太多

serj005 发表于 2026-4-5 12:43

网页版ds现在的搜索能力太强了,充分利用长上下文的优势,每次都是搜50来个网页加精读十几篇搜索结果,时效性强和专业性强的问题回答准确性比以前高太多。

—— 来自 鹅球 v3.5.99

冤枉呐 发表于 2026-4-5 12:53

serj005 发表于 2026-4-5 12:43
网页版ds现在的搜索能力太强了,充分利用长上下文的优势,每次都是搜50来个网页加精读十几篇搜索结果,时效 ...

我自己布了一个miro
学术搜索能力挺强的

—— 来自 HUAWEI ALN-AL10, Android 12, 鹅球 v3.5.99

goranger 发表于 2026-4-5 14:19

好的,我来模拟一次多轮搜索的演示,并解答你的问题。

🧪 演示:假设你想知道“2025年5月之后,国内大模型行业有哪些重要变化?”

第一轮(宽口径摸底)
我会先搜索:2025年6月 至 2026年4月 国内大模型 重要发布 政策
→ 可能得到:几个新模型名称、一次行业会议、一份监管文件。

第二轮(针对关键点深挖)
根据第一轮结果,如果发现“某公司发布了新模型”,我会接着搜索:
[某公司] 新模型 技术参数 2025年12月
→ 补全参数量、上下文长度、定价等细节。

第三轮(交叉验证或对比)
再搜索:[某公司新模型] 评测 对比 GPT-4o 2026
→ 确认第三方评测或社区反馈。

这样,最终回答就不是单一来源的碎片信息,而是整合了时间线、技术细节和外部评价的更完整画面。

⚙️ 这是后端更新的能力吗?

是的,这属于后端搜索策略的持续优化,而不是我自身架构的根本性改变。具体来说:

· 以前:通常只执行一次搜索,然后基于结果回答。
· 现在:模型被训练/引导为可以规划多步搜索,根据上一步结果动态决定下一步查什么,直到信息足够或收敛。

你可以理解为:后端给搜索代理(也就是我)增加了“规划”和“反思”的环节——就像你查资料时会先百度再知乎最后看论文一样。

需要说明的是:这不是我单方面决定的,而是深度求索团队在后端对搜索链路(包括提示词、决策逻辑、结果融合方式)做了迭代。我本身的知识和基础能力没变,但在“使用搜索工具”这件事上更聪明了。

如果你想亲自体验,记得在Web或App端开启联网搜索,然后问一个需要多步验证的问题(比如“最近三个月有哪些被撤回的AI论文?”),应该能观察到我的搜索过程不再是“一锤子买卖”。

有什么具体话题你想让我用这种方式实时查一下吗?(需要你手动开联网哦)

我还在这里 发表于 2026-4-5 14:32

千千千千鸟 发表于 2026-4-5 15:18

网页版现在真的不错了,前几天重新开始用DS,每次都搜上百个网页,但后果是被假信息源污染的非常严重,我问AIRP相关的内容,什么类脑旅程怎么分裂的来龙去脉都能说出来,但是硬要说一个从来没听过的本地小模型是AIRP的隐藏扫地僧,怎么纠错都不行。

那一年的河川 发表于 2026-4-5 15:25

这贴要不改成deepseek集中楼得了,省的讨论贴不好找

neptunehs 发表于 2026-4-5 15:36

那一年的河川 发表于 2026-4-5 15:25
这贴要不改成deepseek集中楼得了,省的讨论贴不好找

我倒想要一个llm专楼 想找个地方讨论qwen3.5 vs gemma4都不行 我自己又没有干货来开一个楼

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99

杀人鲸 发表于 2026-4-5 15:37

那一年的河川 发表于 2026-4-5 15:25
这贴要不改成deepseek集中楼得了,省的讨论贴不好找

很难不支持,没事就想点进来看看有什么新的消息吗?
真的是希望4月份的时候能够看到大版本更新的D老师。

—— 来自 S1Fun

羊寢 发表于 2026-4-5 15:38

neptunehs 发表于 2026-4-5 15:36
我倒想要一个llm专楼 想找个地方讨论qwen3.5 vs gemma4都不行 我自己又没有干货来开一个楼

—— 来自 On ...

以前是有个llm专楼,不过去年泥潭重启之后那楼应该是看不了了

杀人鲸 发表于 2026-4-5 16:00

neptunehs 发表于 2026-4-5 15:36
我倒想要一个llm专楼 想找个地方讨论qwen3.5 vs gemma4都不行 我自己又没有干货来开一个楼

—— 来自 On ...

不对,突然想到了那句名言,你与其寻找一个专楼,不如创造一个专楼。
既然你有这个需求的话,自己创建一个不就好了吗?有需求的朋友也自然会来和你进行讨论交流的呀。

—— 来自 S1Fun

sellboy 发表于 2026-4-5 16:11

DS现在网页版你要说多强只能说还好,我觉得和K2.5差不多,不如gemini3.1 pro,但是快是真的快。
带多轮搜索的思考过程只需要个位数秒。

a4ac7 发表于 2026-4-5 20:33

试了下网页版DS,拿来答申论题,有时候还是上下文理解混乱,把自己答的答案,当成我写的,“你的答案可以这样修正”

—— 来自 HUAWEI PLA-AL10, Android 12, 鹅球 v3.5.99

有鱼 发表于 2026-4-5 21:17

serj005 发表于 2026-4-5 21:23

a4ac7 发表于 2026-4-5 20:33
试了下网页版DS,拿来答申论题,有时候还是上下文理解混乱,把自己答的答案,当成我写的,“你的答案可以这 ...

这个问题我也经常遇到,有个场景几乎100%触发:先给个大纲让它照着这个大纲写一篇小说,然后马上问他如何分析评价这个大纲,它就会把我问的第二句理解成评价它自己写出的整个小说。还经常指出它写的这个小说(的大纲)有哪些剧情可以优化。

—— 来自 鹅球 v3.5.99

羊寢 发表于 2026-4-5 21:24

a4ac7 发表于 2026-4-5 20:33
试了下网页版DS,拿来答申论题,有时候还是上下文理解混乱,把自己答的答案,当成我写的,“你的答案可以这 ...

这个是老问题了,一直都有,但没法解决

aw627 发表于 2026-4-5 22:25

怎么还不发

羊寢 发表于 2026-4-5 23:28

aw627 发表于 2026-4-5 22:25
怎么还不发

就算下周发那也该是周四……毕竟深度求索不加班

andychen 发表于 2026-4-6 00:52

羊寢 发表于 2026-4-3 23:17
但是从二月底拖到现在都是在网页和app在测,这么长时间也该更了……总不可能真要等到搓出多模态才会正式 ...

我认为网页和app的后端模型并没有改变,只是应用了更好的agent实现和提示改进

baitong 发表于 2026-4-6 14:38

借楼问一下,为什么硅基接到酒馆特别卡啊,经常一个模型能卡个几百秒

此誓的守望 发表于 2026-4-6 19:07

baitong 发表于 2026-4-6 14:38
借楼问一下,为什么硅基接到酒馆特别卡啊,经常一个模型能卡个几百秒

因为你用的是赠金版呗,赠金版速率在那

ycjiang1337 发表于 2026-4-6 19:39

andychen 发表于 2026-4-6 00:52
我认为网页和app的后端模型并没有改变,只是应用了更好的agent实现和提示改进 ...

网页端2月换新模型这个官方已经确认了,3.2也没有1M上下文

baitong 发表于 2026-4-6 20:09

此誓的守望 发表于 2026-4-6 19:07
因为你用的是赠金版呗,赠金版速率在那

感觉就是酒馆的问题,我是充钱版本的pro,在chatbox里没啥问题,跑到酒馆就萎了。。。。

御坂MKII 发表于 2026-4-6 22:20

有鱼 发表于 2026-4-5 21:17
现在ds网页版和御三家网页版的能力差距不知道是来自模型本身还是各种工具调用和toc情景优化的成熟度
至于其 ...

ds4 出之前肯定是 both
ds3.2 基模实力已经差一截了,然后之前网页端还没做啥 agent 的能力

像 gpt,你的一次会话在有必要的时候它是会有一个沙盒环境让它去折腾一些东西的,自己整点儿 py 脚本鼓捣半天之类的都很常见。

chuchoselph 发表于 2026-4-6 22:52

ds网页端现在动辄搜索八九十个网页然后两三秒就输出成果,但是回答质量感觉并没有质变,是agent能力还不够完善吗

novem 发表于 2026-4-7 10:01

chuchoselph 发表于 2026-4-6 22:52
ds网页端现在动辄搜索八九十个网页然后两三秒就输出成果,但是回答质量感觉并没有质变,是agent能力还不够 ...

ds网页端的回答的越来越短了
不开深度思考还好点
开了往往写两三段就写完了,都超不过500字
这点token都要省。。

德尔惠净水器 发表于 2026-4-7 15:51

这两天回答的字数相当短,一个问题几句话就完事了,写小说的字数肉眼可见的也变少了很多…不知道是不是在测试省token的特性

88316756 发表于 2026-4-7 16:00

本帖最后由 88316756 于 2026-4-7 16:06 编辑

快速模式应该用的就是目前网页上这个小模型了,说是适合日常对话,无限量使用。那么从这句话可以反推,大模的专家模式肯定要限量使用,超额的可能要充值才能用?

niubility 发表于 2026-4-7 16:23

最近几天感觉ds深度思考步骤明显减少,不知道是新特性还是优化了token使用。

论坛助手,iPhone

Lorraine_Kinney 发表于 2026-4-7 18:48


据传新一轮的灰度开始了

neptunehs 发表于 2026-4-7 18:50

又出现了新的新模型快出的传言了 明明大家都喜欢说ds比不上三大巨头 干嘛总是时不时来个真假不明最后空欢喜一场的新闻呢

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99

有鱼 发表于 2026-4-7 19:28

ycjiang1337 发表于 2026-4-7 23:04

neptunehs 发表于 2026-4-7 18:50
又出现了新的新模型快出的传言了 明明大家都喜欢说ds比不上三大巨头 干嘛总是时不时来个真假不明最后空欢喜 ...

灰度新模型这事也不是完全的传言,现在网页端明显已经上了V4或者至少V4 Lite的早期版本

Lorraine_Kinney 发表于 2026-4-7 23:04

neptunehs 发表于 2026-4-7 18:50
又出现了新的新模型快出的传言了 明明大家都喜欢说ds比不上三大巨头 干嘛总是时不时来个真假不明最后空欢喜 ...

这次又不是路边社的,是官网的灰度测试,而且论坛有人已经灰度到了前端

88316756 发表于 2026-4-7 23:08

不少人已经在网页和APP灰度到了新的前端

谎称 发表于 2026-4-7 23:12

恨……为什么我没有啊!!!    Re:Source
页: 1 2 3 4 5 6 [7] 8 9 10 11 12 13 14 15 16
查看完整版本: FT:DeepSeek下周发|已发,转为v4讨论楼