找回密码
 立即注册
搜索
楼主: 绕指流光

[科技] FT:DeepSeek下周发|已发,转为v4讨论楼

  [复制链接]
     
发表于 2026-6-13 23:51 来自手机 | 显示全部楼层
千千千千鸟 发表于 2026-6-13 22:43
认真请教下,因为Pi返回来的那些思考几乎全是英文的,只有正文回复是中文的看得我非常难受,我今天瞎几把尝 ...

原始prompt改成中文的,思考就成中文的了。当然如果皮裤套棉裤,中间还是有层英文prompt的话,最终输出的思考还是有可能变成英文的。
回复

使用道具 举报

     
发表于 2026-6-13 23:52 来自手机 | 显示全部楼层
Language Policy: Communicate exclusively in Chinese. All explanations, logic analysis, and responses must be in Chinese, while keeping technical terms, code snippets, and file paths in their original form.
我在codex用的提示词,仅供参考。

评分

参与人数 1战斗力 +1 收起 理由
千千千千鸟 + 1 我学我学

查看全部评分

回复

使用道具 举报

     
发表于 2026-6-13 23:54 | 显示全部楼层
GJRstone 发表于 2026-6-13 23:51
原始prompt改成中文的,思考就成中文的了。当然如果皮裤套棉裤,中间还是有层英文prompt的话,最终输出的 ...

是的,今天写的拓展就是干这个的,也加上了自动更新,自动检查啥的功能,不过实际执行上还是遇到各种问题,毕竟自己还是纯外行,就在想说难道就没有专业人士有这种需求嘛
回复

使用道具 举报

     
发表于 2026-6-13 23:54 | 显示全部楼层
deepseek太便宜了,可惜不支持多模态,坛友有什么性价比高的稳定多模态模型推荐么?

—— 来自 S1Fun
回复

使用道具 举报

发表于 2026-6-13 23:56 来自手机 | 显示全部楼层
千千千千鸟 发表于 2026-6-13 23:54
是的,今天写的拓展就是干这个的,也加上了自动更新,自动检查啥的功能,不过实际执行上还是遇到各种问题 ...

可能还真没有
毕竟说的英文去掉专有名词估计需要的水平和懂王差不多

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-6-13 23:57 来自手机 | 显示全部楼层
徐老师 发表于 2026-6-13 23:54
deepseek太便宜了,可惜不支持多模态,坛友有什么性价比高的稳定多模态模型推荐么?

—— 来自 S1Fun ...

免费的智谱 或者opencode带的免费的那几个
收费的小米MIMO 2.5  挺便宜的

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-14 00:13 | 显示全部楼层
徐老师 发表于 2026-6-13 23:54
deepseek太便宜了,可惜不支持多模态,坛友有什么性价比高的稳定多模态模型推荐么?

—— 来自 S1Fun ...

opencode go订阅首月5美元以后10美元一个月,能用多模态的KIMI2.7 千问3.7 MINIMAX M3
我觉得比火山coding plan划算
回复

使用道具 举报

     
发表于 2026-6-14 00:24 | 显示全部楼层
千千千千鸟 发表于 2026-6-13 23:54
是的,今天写的拓展就是干这个的,也加上了自动更新,自动检查啥的功能,不过实际执行上还是遇到各种问题 ...

中文思维链是dsv4的一个难题,已经有很多案例反馈说ds对“请用中文进行思考”这种指令的遵循度非常差。

我用起来感觉这好像确实是ds特有的问题,同样的初始提示词只加“请使用中文进行思考”这种相对简单的提示,mimo能做到全程中文,但是ds要么是第一句话就开始用英语思考,要么是只遵循了前两轮就变回英文思维链。

有两种解决方法,一种是修改agent的所有工具调用提示词和系统提示词,都加上用中文的表述,这时候自然是全程中文,但是修改程度太大很麻烦。

第二种是后面有人发现的,dsv4对“请怎么怎么做”这类指令的遵循度差,但是对“请扮演xx”或“你是一个xx”这类的遵循度会变强,不知道是不是被酒馆角色扮演特训过的原因。我自己试过把这种提示词加到系统提示词里:“你是一个中文思维的Agent,你的语言行为内化在思考之中,使用中文进行思考。”效果就会好很多,最起码是能连续几十回工具调用没再出现英语思考了,不过有时候也还是会变回英文思考。

评分

参与人数 1战斗力 +2 收起 理由
千千千千鸟 + 2 牛逼

查看全部评分

回复

使用道具 举报

     
发表于 2026-6-14 00:30 | 显示全部楼层
徐老师 发表于 2026-6-13 23:54
deepseek太便宜了,可惜不支持多模态,坛友有什么性价比高的稳定多模态模型推荐么?

—— 来自 S1Fun ...

ds的页面视图模式抓个服装特征到是没问题。就是不知道该如何让它能在pi下走起来
回复

使用道具 举报

     
发表于 2026-6-14 00:30 | 显示全部楼层
serj005 发表于 2026-6-14 00:24
中文思维链是dsv4的一个难题,已经有很多案例反馈说ds对“请用中文进行思考”这种指令的遵循度非常差。

...

居然是这样,这个扮演模式我看某脑的人说是ds的人根据小红书集美用网页的瘸腿扮演需求专项训练的,用来玩复杂的扮演一点都不好用,没想到还影响到代码的能力了吗。
回复

使用道具 举报

发表于 2026-6-14 00:32 | 显示全部楼层
codex的上下文就272k,不爽😡
回复

使用道具 举报

     
发表于 2026-6-14 00:48 | 显示全部楼层
千千千千鸟 发表于 2026-6-14 00:30
居然是这样,这个扮演模式我看某脑的人说是ds的人根据小红书集美用网页的瘸腿扮演需求专项训练的,用来玩 ...

到不至于什么都怪集美,这个就是没做好,连基本的rp都没做好,缺乏后训练    Re:Source
回复

使用道具 举报

     
发表于 2026-6-14 00:54 来自手机 | 显示全部楼层
serj005 发表于 2026-6-14 00:24
中文思维链是dsv4的一个难题,已经有很多案例反馈说ds对“请用中文进行思考”这种指令的遵循度非常差。

...

原来是这样怪不得在酒馆里无论我是在提示词里还是在对话里让他用中文展示思考链他永远不会听话,白天我要试下第二种方法,原来都甚至想把预设的提示词全翻新一遍弄成中文看看效果了,但自己又不会写怕失去或减弱原来的效果
回复

使用道具 举报

     
发表于 2026-6-14 01:10 | 显示全部楼层
梁圣感觉还是更看重预训练“创造智能”的过程,不太看重后训练“拴小孩”的过程,可能觉得这方面对于真正的agi意义不大?
但是缺乏后训练现在真的挺影响ds的表现的
看这轮扩张之后能不能有更充足的资源做了,既然要认真做产品的话,后训练,harness,工具库都得做好,我能接受为此额外付费啊梁圣

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-6-14 02:23 | 显示全部楼层
L-JoeW 发表于 2026-6-14 00:54
原来是这样怪不得在酒馆里无论我是在提示词里还是在对话里让他用中文展示思考链他永远不会听话,白天我要 ...

Markdown+KEY: value格式
Markdown标题和KEY用英文,描述用中文没问题的啊
回复

使用道具 举报

     
发表于 2026-6-14 03:31 | 显示全部楼层
吐槽一下,omp默认edit用的hashline模式简直是天坑,LLM如果喜欢连续执行edit经常会出事,因为用了旧的文件tag很容易把文件结构给改坏,然后LLM发现问题后只能把整个文件重写,到这一步就只能听天由命了
本来想着自己折腾一下搞个读写文件锁,突然想起来多问它一句,能切换回pi传统的文本匹配模式么,果然是能配置的,而且算法看上去做得也挺完善的
所以就是为了推他们独有的特性才把hashline搞成默认配置么
回复

使用道具 举报

     
发表于 2026-6-14 08:07 | 显示全部楼层
关于d老师写代码用中文思考这个事,我也做了很多尝试,一个原因是想尝试减少token开销,另一个原因是迷信中文推理优势,但是最终还是失败告终。最好的情况是一个session前两三个turn他还能保持中文思考,之后随着代码阅读越多,基本就回不去了。就算是改文档的session,文档大部分都是中文,半途中他也会开始英文思考,不知道跟编程领域的训练数据是否相关。

hashline edit看着是很美好,实际效果确实不敢恭维,没有谁做的好。如果想彻底解决edit调用失败可能强制edit前read更有效,但是这也会导致大量浪费,其实edit失败的出现频率并不是那么高,而且总觉得只靠工具是没什么好办法解决的。antirez也说过他在DwarfStar里尝试了hashline edit,这个可能效果会更好,毕竟和调用API不一样,DwarfStar是agent和inference一体的东西,能做的事更多。

个人遇到的麻烦的问题是做react或者emacs相关东西时,edit时llm会搞错缩进或者括号,然后开始在思考中数缩进和括号,数不清楚就开始写各种脚本算第几行到底有几个缩进,或者看括号到底哪里不匹配,两者都会浪费大量token。不知道AST based edit是不是能解决这问题。
回复

使用道具 举报

发表于 2026-6-14 08:56 来自手机 | 显示全部楼层
本帖最后由 lowezack 于 2026-6-14 09:01 编辑
LeoDT 发表于 2026-6-14 08:07
关于d老师写代码用中文思考这个事,我也做了很多尝试,一个原因是想尝试减少token开销,另一个原因是迷信中 ...

先读后改不是浪费token,是为了消除幻觉,不这样做改错的可能很大,特别是长时间任务。结果是更浪费token。

方向错了,数数是llm最大的弱点。这个你直接在agents.md里配置让llm用格式化工具,不要手动维护,你想想,人也不会手动维护代码格式的,都是用format工具
回复

使用道具 举报

     
发表于 2026-6-14 08:59 来自手机 | 显示全部楼层
大家1m的上下文是用到多少就开新窗口?

—— 来自 HONOR AAP-AN00, Android 16, 鹅球 v4.0.100-alpha
回复

使用道具 举报

     
发表于 2026-6-14 09:12 | 显示全部楼层
lowezack 发表于 2026-6-14 08:56
先读后改不是浪费token,是为了消除幻觉,不这样做改错的可能很大,特别是长时间任务。结果是更浪费token ...

个人不认同长时间独立运行的agent是有意义的方向,任何资源都不应该被随意浪费。我更偏向于pair programming的模式,所以edit偶尔失败导致的浪费暂时是可以接受的,尤其是D老师缓存强大的前提下。先读后改的浪费在我的场景中是比其收益更不能接受的。

我提的数数问题不是要做format,而是当他搞错缩进时会导致edit失败,react经常会写出复杂缩进的代码。emacs这边当然就是代码都跑不起来了,解决办法应该就是ast based edit了。
回复

使用道具 举报

发表于 2026-6-14 09:32 来自手机 | 显示全部楼层
LeoDT 发表于 2026-6-14 09:12
个人不认同长时间独立运行的agent是有意义的方向,任何资源都不应该被随意浪费。我更偏向于pair programm ...

最简单的方式,自己fork一份代码去掉先读后改试试就知道了。
回复

使用道具 举报

     
发表于 2026-6-14 12:17 | 显示全部楼层
本帖最后由 hugosol 于 2026-6-14 12:30 编辑
LeoDT 发表于 2026-6-14 08:07
关于d老师写代码用中文思考这个事,我也做了很多尝试,一个原因是想尝试减少token开销,另一个原因是迷信中 ...

草,果然不止我一个人觉得hashline坑么
其实我认为就算强制先读后写理论上也有可能会出问题,所以结论就是不要折腾这些有的没的,反正主流agent用的都是基于字符串匹配的方法,模型训练肯定也是往这个方向走的,用肉眼看代码这个行为怎么都比数代码行数更直观,更接近人类真实的行为
hashline的优势区间是别的subagent或者人手改过文件之后模型能通过tag发现,然后可以回到旧版本再merge回来,看上去很美好,但这种场景远少于LLM自己连续edit,为了适配极端场景把common flow都搞得提心吊胆的实在得不偿失
回复

使用道具 举报

发表于 2026-6-14 12:44 来自手机 | 显示全部楼层
请教下大家,gtp plus/pro大家都是怎么买的?不用中转

—— 来自 Xiaomi 24129PN74C, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-14 15:07 | 显示全部楼层
hugosol 发表于 2026-6-14 12:17
草,果然不止我一个人觉得hashline坑么
其实我认为就算强制先读后写理论上也有可能会出问题,所以结论就是 ...

hashline理想很美好,模型不用重新生成旧文本能减少出错概率,但是副作用太大了,模型对行号的理解和hashline的理解我觉得没有区别的,如果他不能正确的处理行号,那hashline就没有太大的意义。而且基于hashline的编辑我觉得对模型也是负担,只替换一行还好,如果是多行的,那出错概率可能还更大了。又是花了大价钱做小事了。
回复

使用道具 举报

发表于 2026-6-14 18:22 | 显示全部楼层
金轮法王 发表于 2026-6-14 12:44
请教下大家,gtp plus/pro大家都是怎么买的?不用中转

—— 来自 Xiaomi 24129PN74C, Android 16, 鹅球 v3 ...

ios外区订阅
回复

使用道具 举报

     
发表于 2026-6-14 18:30 | 显示全部楼层
LeoDT 发表于 2026-6-14 15:07
hashline理想很美好,模型不用重新生成旧文本能减少出错概率,但是副作用太大了,模型对行号的理解和hash ...

直接改文件确实不安全,像 codex 内置的也是 diff 格式的 apply attach,不是直接改
回复

使用道具 举报

     
发表于 2026-6-14 20:03 来自手机 | 显示全部楼层
纯新人请教一个问题:关于DeepSeek v4,在网页端或者手机app界面下,如果选择专家模式,则无法启用搜索,只有在快速模式下才能使用搜索功能
这就导致在使用专家模式时,会担心其生成的回答无法充分对齐时效性信息
假如购买Deepseek的API的话,是否有可能使得v4 Pro模型(专家模式)可以基于联网搜索得到的最新资料进行回答呢?

这个问题我问了DeepSeek v4本体(快速模式,深度思考+联网搜索)
它要我购买“deepseek-v4-pro-thinking-search”模型
但是我看了一下官网的模型定价页,好像没有这么一个模型,应该是幻觉出来的
回复

使用道具 举报

     
发表于 2026-6-14 20:13 来自手机 | 显示全部楼层
pure_liquid 发表于 2026-6-14 20:03
纯新人请教一个问题:关于DeepSeek v4,在网页端或者手机app界面下,如果选择专家模式,则无法启用搜索,只 ...

联网要配插件

比如找支持 Tavily 的,有免费额度,个人用应该够了
提示词可以明确要求使用插件 xxx 进行联网搜索

—— 来自 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-6-14 20:13 来自手机 | 显示全部楼层
pure_liquid 发表于 2026-6-14 20:03
纯新人请教一个问题:关于DeepSeek v4,在网页端或者手机app界面下,如果选择专家模式,则无法启用搜索,只 ...

因为有人拿网页反代,幻方把网页端pro的联网搜索关了
如果连api,只要自己配置搜索工具就可以了
最简单的就是chatbox
我手机上用的是rikkahub

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-14 20:20 来自手机 | 显示全部楼层
这肯定是个严肃问题,ds自己在网页端配置的搜索是远强于第三方外挂的搜索功能的。现在搞学术写作ds基本处于不可用状态,除非你的要求是flash就能达到的。临时性情况大家都能接受,长期解决不了那还不如开会员用专家模式了。
回复

使用道具 举报

     
发表于 2026-6-14 20:28 来自手机 | 显示全部楼层
tillnight 发表于 2026-6-14 20:20
这肯定是个严肃问题,ds自己在网页端配置的搜索是远强于第三方外挂的搜索功能的。现在搞学术写作ds基本处于 ...

d指导自己挂的搜索很垃圾好吧,还不如kimi自己挂的搜索。再说哪有什么会员专家模式?bro云呢搁这?

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-14 20:31 来自手机 | 显示全部楼层
会员专家模式什么鬼,ds就只有个api是收费的啊
回复

使用道具 举报

发表于 2026-6-14 20:35 | 显示全部楼层
本帖最后由 mitzvah 于 2026-6-14 20:36 编辑
pure_liquid 发表于 2026-6-14 20:03
纯新人请教一个问题:关于DeepSeek v4,在网页端或者手机app界面下,如果选择专家模式,则无法启用搜索,只 ...

最好的的解法就是到魔塔买个30多块一个月的会员然后本地写个mcp服务接进去搜索信息,读取网页一把抓,当然glm的plan的搜索mcp也是个好东西,这个甚至不需要你自己写
回复

使用道具 举报

     
发表于 2026-6-14 20:45 来自手机 | 显示全部楼层
pure_liquid 发表于 2026-6-14 20:03
纯新人请教一个问题:关于DeepSeek v4,在网页端或者手机app界面下,如果选择专家模式,则无法启用搜索,只 ...

现在api就可以,算是程序员福利,你低声些不要声张就行
claude code接ds就可以用
回复

使用道具 举报

     
发表于 2026-6-14 21:35 | 显示全部楼层
半江瑟瑟半江红 发表于 2026-6-14 20:28
d指导自己挂的搜索很垃圾好吧,还不如kimi自己挂的搜索。再说哪有什么会员专家模式?bro云呢搁这?

—— ...

要是专家模式现在能付费用搜索还是问题吗?这句话交给ai都能轻松理解出意思是解决不了反代问题还不如把专家模式放到付费墙后解锁目前的限制。云哥你好云哥再见。
回复

使用道具 举报

     
发表于 2026-6-14 21:44 来自手机 | 显示全部楼层
本帖最后由 半江瑟瑟半江红 于 2026-6-14 21:47 编辑
tillnight 发表于 2026-6-14 21:35
要是专家模式现在能付费用搜索还是问题吗?这句话交给ai都能轻松理解出意思是解决不了反代问题还不如把专 ...

申请个api充点钱,手机上用chatbox或者rikkahub,电脑上要么cherry studio或者直接上agent,要么用免费的必应搜索要么花点钱买个搜索api,不就解决了?实在想花钱,买个kimi最便宜的一档会员,一个月49,敞开用,还可以在kimi code里配置agent

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-14 21:50 | 显示全部楼层
pure_liquid 发表于 2026-6-14 20:03
纯新人请教一个问题:关于DeepSeek v4,在网页端或者手机app界面下,如果选择专家模式,则无法启用搜索,只 ...

下个trae work呗,有完整的agent能力,**多种模型。就是高峰期免费用户得排队。无论是免费等着用,还是低频需求冲个订阅,还是接入api不排队,就用他的agent能力,对小白用户还是很舒服的。
回复

使用道具 举报

     
发表于 2026-6-14 21:53 | 显示全部楼层
本帖最后由 tillnight 于 2026-6-14 21:57 编辑
半江瑟瑟半江红 发表于 2026-6-14 21:44
申请个api充点钱,手机上用chatbox或者rikkahub,电脑上要么cherry studio或者直接上agent,要么用免费的 ...

云哥你活在自己世界里是你的自由。但是请不要云哥云别人然后自以为是的趾高气扬。
第一,原话是解决不了网页版被反代的问题,不如就给专家模式开付费墙让正常用户能用正常功能。如果你第一遍没看懂还能理解成原文有歧义,第二遍解释完还看不懂还在那里趾高气扬的“哪里有什么会员专家”,只能说语言理解能力确实需要ai辅助。
第二,我当然用api,我不需要你教我用。但是我的体验就是ds网页版自带的搜索更好用,尤其是你还有脸提chatbox的免费Bing搜索,一用一个不吱声,不愧是云哥。你觉得ds自己的搜索垃圾是你的事,我不认同谢谢。
第三,即使抛开你随意云其他人然后自以为是的在那里api、api,也不影响我本来话语的意思。就是有很多人不会用api,但是愿意付费,解决不了反代不如直接开付费会员,起码让用户有选择满血服务。
第四,这只是我的吐槽,我自己知道ds不会考虑付费墙这个解决方法,宁可拖到算力资源缓解。但是不代表我可以接受你随意云别人的观点然后在那里趾高气扬的指鹿为马。
回复

使用道具 举报

     
发表于 2026-6-14 22:03 来自手机 | 显示全部楼层
tillnight 发表于 2026-6-14 21:53
云哥你活在自己世界里是你的自由。但是请不要云哥云别人然后自以为是的趾高气扬。
第一,原话是解决不了网 ...

懒得花钱买个搜索api直接买个kimi会员不就得了,搜索能力不比d指导的强多了

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-14 22:09 | 显示全部楼层
本帖最后由 jyj256 于 2026-6-14 22:11 编辑

网上不是有专门配大语言模型的搜索吗  还是免费的

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-18 18:17 , Processed in 0.149313 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表