找回密码
 立即注册
搜索
楼主: 绕指流光

[科技] FT:DeepSeek下周发|已发,转为v4讨论楼

  [复制链接]
发表于 2026-6-2 13:46 来自手机 | 显示全部楼层
serj005 发表于 2026-6-2 12:59
关于让llm学习特定文风,感觉很多时候效果非常差,不知道怎么解决。

我自己经常遇到的情况是喂给llm一些语 ...

思维拓展下 一个agent按照你的需求来写文,因为要剧情 所以塞了上下文、设定等等,负责输出情节文本
另一个agent根据这个情节文本来改写,它的提示词就只有文风没有那些设定来挤占注意力。
我现在设计的结构简化下就是这样。

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-2 13:54 来自手机 | 显示全部楼层
梁总什么时候把多模态搬出来,不能识图还是太不方便了
回复

使用道具 举报

发表于 2026-6-2 13:57 | 显示全部楼层
半江瑟瑟半江红 发表于 2026-6-2 13:31
novelagent是全自动出书的,其实我觉得不太好

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99 ...

Tavo搭配官方通用模型,加上风格校正,同样消耗精力,本来就不是精细干这活的
得问问类脑社区的老哥具体哪个微调模型比较好
回复

使用道具 举报

     
发表于 2026-6-2 14:01 | 显示全部楼层
pi + ds4 flash
回复

使用道具 举报

     
发表于 2026-6-2 14:36 | 显示全部楼层
PI写代码好用吗
回复

使用道具 举报

     
发表于 2026-6-2 15:00 | 显示全部楼层
zy450 发表于 2026-6-2 14:36
PI写代码好用吗

好用这个东西看个人。

pi对我来说最好的点是让它自己给自己写扩展,加上d老师flash超高速写代码,每天都能获得一个新的pi扩展,专注且高效。

另外,比起其它工具,pi几乎是透明的,基本上从里到外全都可以自定义,这比起其它那些黑盒一样的工具更好理解。已经对着llm这么个黑盒在祈祷了,中间再经过一个黑盒传话岂不是更令人不安了。
回复

使用道具 举报

     
发表于 2026-6-2 16:51 | 显示全部楼层
LeoDT 发表于 2026-6-2 15:00
好用这个东西看个人。

pi对我来说最好的点是让它自己给自己写扩展,加上d老师flash超高速写代码,每天都 ...

艹,下载试了下,写代码还没尝试,这速度比Claude Code也快太多了
回复

使用道具 举报

     
发表于 2026-6-2 17:29 | 显示全部楼层
zy450 发表于 2026-6-2 16:51
艹,下载试了下,写代码还没尝试,这速度比Claude Code也快太多了

我现在大概有11个扩展,2个社区的,9个自己的,速度依然很快。选择社区扩展的标准是必要且它只做自己应该做的事,所以选了pi-permission-system和pi-mcp-adapter。

其他的所有我觉得必要的功能都是让pi自己写,简单的比如索引代码库所有symbol让写prompt的时候可以有补全,write/edit tool call结束后自动format & lint,工作完成给手机和桌面发通知之类,虽然社区都有实现,但是那些方案都想做大而全,跟pi聊天聊出来小而精的方案更高效,而且自己做的扩展自己也知道该改什么,怎么改,掌控工具才能用好工具。而且ds4 flash写起来也不心疼不是。

换到pi后是真后悔在opencode上花的那几十块的学费,耗token不说,一堆华而不实的东西,破写代码的要什么华丽的工具,朴实的符合unix哲学的工具它不香嘛。
回复

使用道具 举报

     
发表于 2026-6-2 17:39 | 显示全部楼层
Pi 的好处在于可以完全掌握 Context,你可以 100% 确定一次调用是否会命中缓存
回复

使用道具 举报

     
发表于 2026-6-2 18:09 | 显示全部楼层
pi确实好,喜欢它的极简哲学,还不要钱。
回复

使用道具 举报

     
发表于 2026-6-2 19:19 来自手机 | 显示全部楼层
这又是谁买的热搜“deepseek降价”,还以为又降价了,点进去是腾讯api平台的deepseek降价到官网一样
回复

使用道具 举报

     
发表于 2026-6-2 21:50 | 显示全部楼层
LeoDT 发表于 2026-6-2 17:29
我现在大概有11个扩展,2个社区的,9个自己的,速度依然很快。选择社区扩展的标准是必要且它只做自己应该 ...

pi.dev 这个吗?
回复

使用道具 举报

     
发表于 2026-6-2 21:52 | 显示全部楼层
很久就在那边l 发表于 2026-6-2 19:19
这又是谁买的热搜“deepseek降价”,还以为又降价了,点进去是腾讯api平台的deepseek降价到官网一样 ...

我曹 怎么降到一半的?速度咋样?
回复

使用道具 举报

发表于 2026-6-2 22:21 来自手机 | 显示全部楼层
一样不是一半

— from S1 Next Goose v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-6-3 11:46 | 显示全部楼层
在昨天晚上进行的 OpenAI Intelligence at Work 直播活动上,OpenAI 宣布了一项重大决定:未来几周内,将 Codex 的核心能力直接整合进 ChatGPT 应用中。

Re:Source · Xiaomi 15
回复

使用道具 举报

     
发表于 2026-6-3 12:00 来自手机 | 显示全部楼层
唉,我操,怎么在coding能力这方面,国模还是差了这么多。
今天我让DeepSeek和Glm5.1分别修复同一个TTS插件的脚本问题。这两位分别忙了1个小时和1个半小时,什么都没解决
我把相应的问题直接给gpt5.5thinking描述了一下,它立马给出来方案,认为是github上给这个插件贡献中文时候译者不小心搞坏了脚本格式,让我直接把英文脚本覆盖到中文人格下,然后只汉化格式以外的自然语言
把这个方案再扔给DeepSeek,没用5分钟就解决了。
我不接受,怎么差距这么大

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-3 12:03 来自手机 | 显示全部楼层
半江瑟瑟半江红 发表于 2026-6-3 12:00
唉,我操,怎么在coding能力这方面,国模还是差了这么多。
今天我让DeepSeek和Glm5.1分别修复同一个TTS插件 ...

个例而已

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-3 12:14 | 显示全部楼层
半江瑟瑟半江红 发表于 2026-6-3 12:00
唉,我操,怎么在coding能力这方面,国模还是差了这么多。
今天我让DeepSeek和Glm5.1分别修复同一个TTS插件 ...

实际上的确就是有3个月的差距啊一个大版本

回复

使用道具 举报

     
发表于 2026-6-3 12:18 来自手机 | 显示全部楼层
omnitoken 发表于 2026-6-3 12:14
实际上的确就是有3个月的差距啊一个大版本

差距能大到一个根本没头绪解决问题,一个只要听了问题描述就能点出来根源在哪?

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-6-3 12:23 | 显示全部楼层
半江瑟瑟半江红 发表于 2026-6-3 12:18
差距能大到一个根本没头绪解决问题,一个只要听了问题描述就能点出来根源在哪?

—— 来自 HUAWEI SGU-A ...

是啊,一个比v4参数量大好几圈,训练更加完善的模型的能力就是更强啊。。这种长尾任务的能力是很难被各种benchmark体现的    Re:Source
回复

使用道具 举报

     
发表于 2026-6-3 12:28 来自手机 | 显示全部楼层
本帖最后由 半江瑟瑟半江红 于 2026-6-3 12:30 编辑
overflowal 发表于 2026-6-3 12:23
是啊,一个比v4参数量大好几圈,训练更加完善的模型的能力就是更强啊。。这种长尾任务的能力是很难被各种 ...

那也太夸张了,deepseek跟GLM5.1真的是束手无策,一直从那鬼打墙打了一个多小时,尤其是GLM5.1一开始连插件脚本位置在哪里都不知道,都没注意到这个是安装在voiceattack下面的,得我去提醒它。GPT-5.5Thinking我还是在APP上跟它说的这个事,它直接把该怎么解决的方案都告诉我了。
GPT这感觉真有点以前读者故事讲的画一条线一美元知道在哪画线9999美元那味儿

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-3 12:35 | 显示全部楼层
半江瑟瑟半江红 发表于 2026-6-3 12:18
差距能大到一个根本没头绪解决问题,一个只要听了问题描述就能点出来根源在哪?

—— 来自 HUAWEI SGU-A ...

你这问题听着也不是coding能力而是知识问题吧,dsv4的发布的时候也说了自己在知识方面跟别人还有差距,再说5.5现在可是现阶段传说中最牛逼的了,你一个开源1T参数怎么跟别人顶尖至少10T的比知识。

我自己用d老师的经验也是,知识问题,比如想用业界成熟方案,那就先去问google,然后跟d老师说你看这个方案怎么样,d老师惊叹方案漂亮,之后实现的依然很不错啊。

d老师这很多知识都挺落后,需要给它配上最新文档才能好好干活,有些项目文档混乱那就更难为d老师了,又不想随便给agent搜索能力,总觉得搜索是token黑洞,索性自己用工具整理一些文档给老师备着。
回复

使用道具 举报

     
发表于 2026-6-3 12:38 | 显示全部楼层
LeoDT 发表于 2026-6-3 12:35
你这问题听着也不是coding能力而是知识问题吧,dsv4的发布的时候也说了自己在知识方面跟别人还有差距,再 ...

但实际上脚本格式错误,按理说修复也不算多难吧,GPT5.5给的方案就是取巧罢了,我觉得让它硬修它也能修,因为也给出来了修复的思路
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-6-3 12:43 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-6-3 12:49 来自手机 | 显示全部楼层
忧郁的杰哥 发表于 2026-6-3 12:43
说实话这个从过程看上去就是有人问过同样问题并处理过  然后GPT5.5训练进去了 ...

应该没有,我让gemini搜了一下,玩家社区和github都没有人报这个错,毕竟这游戏本身活人就少,国内玩家更少了,这个错误只有中文版脚本才出现

—— 来自 HUAWEI WGRR-W19, Android 12, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-6-3 12:52 | 显示全部楼层
半江瑟瑟半江红 发表于 2026-6-3 12:38
但实际上脚本格式错误,按理说修复也不算多难吧,GPT5.5给的方案就是取巧罢了,我觉得让它硬修它也能修, ...

所以说是知识问题,5.5有这个知识,别人没有,那当然5.5就知道问题根源在哪。

昨天让d老师做了个pi扩展,用到worker_thread,结果有个依赖明明装了就是解析不到,他自己卡的我看不下去了,自己去查了一下发现是我用了pi的bun打包版本,依赖解析本来就有问题,换成npm版本后什么问题都没了。这不还是知识问题吗?如果它知道不同node运行时经常导致依赖解析问题那不就直接提出了?

这种问题你让他去钻,最后钻进本地的pi里我觉得他也能钻出来,但是,何必呢?他不知道就是不知道,花几毛钱干几块钱的活已经足够了,要什么自行车。
回复

使用道具 举报

     
发表于 2026-6-3 13:15 来自手机 | 显示全部楼层
半江瑟瑟半江红 发表于 2026-6-3 12:28
那也太夸张了,deepseek跟GLM5.1真的是束手无策,一直从那鬼打墙打了一个多小时,尤其是GLM5.1一开始连插 ...

这个问题会不会是gpt用的github和stackoverflow的训练数据更多,不知道deepseek这些国内模型,这些数据获取的怎么样

—— 来自 vivo V2405A, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-6-3 13:22 | 显示全部楼层
最终空想 发表于 2026-6-3 13:15
这个问题会不会是gpt用的github和stackoverflow的训练数据更多,不知道deepseek这些国内模型,这些数据获 ...

就是推理方向错了,越继续越错。

两年前的claude也有这种问题,只要你指出它的错误,一般都能解决。
回复

使用道具 举报

     
发表于 2026-6-3 13:25 | 显示全部楼层
最终空想 发表于 2026-6-3 13:15
这个问题会不会是gpt用的github和stackoverflow的训练数据更多,不知道deepseek这些国内模型,这些数据获 ...

公开数据早就扒完了,ds 的RL能力显然和前沿实验室差距不小

应该说只有infra是挺强的,其他方面都是短板
回复

使用道具 举报

发表于 2026-6-3 13:35 | 显示全部楼层
Gemini本身就绑定Google,现在又关联了Gmail、网盘、文档、YTB等一系列应用,还死皮赖脸鼓励你上传别家LLM的对话数据
这个就不是技术问题
回复

使用道具 举报

     
发表于 2026-6-3 14:00 来自手机 | 显示全部楼层
我这边ds也老鬼打墙 但架不住opencode免费用ds4f 只要不是生产用有足够时间 让他慢慢打墙 差不多了我给个其他方向 也能解决问题

作为玩具能力是完全足够的

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-3 14:10 来自手机 | 显示全部楼层
精钢魔像 发表于 2026-6-3 13:22
就是推理方向错了,越继续越错。

两年前的claude也有这种问题,只要你指出它的错误,一般都能解决。 ...

美国这三家是怎么解决这个问题的?大模型在推理时候还会自我评析吗?

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-3 14:20 | 显示全部楼层
国外模型就是不要脸的爬数据(gpt背后的微软、Gemini背后的谷歌等),巴不得把全世界一切电子化的内容都喂给ai。而国内ai连各大搜索引擎、社交和学术库入口都拿不全,别说外面的了。泥潭不是有问题,一个华擎主板的pcie切分问题,问国内ai就不对,问国外的就一下子指出来。这是ai能力吗...不,这单纯库里没有而已
回复

使用道具 举报

     
发表于 2026-6-3 14:25 来自手机 | 显示全部楼层
fsckamui 发表于 2026-6-3 14:20
国外模型就是不要脸的爬数据(gpt背后的微软、Gemini背后的谷歌等),巴不得把全世界一切电子化的内容都喂 ...

但我这个问题挺小众的,一个现在全球日活也就五六千的十多年前的网游的tts插件的中文脚本问题,国内活跃玩家(AFK两年内都算活跃了)可能就两千人,就挤在几个QQ群里,不能说都认识也差不多了,互联网上都没有人问过类似的事,这种犄角旮旯的信息现在都能被炼进去?

—— 来自 HUAWEI SGU-AL10, Android 12, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-3 14:28 | 显示全部楼层
dsv4pro是一个1.6t的模型,gpt5.5和opus一般认为起码是大几t乃至上10t的模型
长尾任务和边角料知识这块是差不少。
而且ds现在所依赖的搜索之类的工具质量也不太行,和御三家第一方配套的harness不能比
回复

使用道具 举报

     
发表于 2026-6-3 14:33 | 显示全部楼层
半江瑟瑟半江红 发表于 2026-6-3 14:25
但我这个问题挺小众的,一个现在全球日活也就五六千的十多年前的网游的tts插件的中文脚本问题,国内活跃 ...

甚至可能连你昨天吃了啥都炼进去,只要你在平台分享...
回复

使用道具 举报

     
发表于 2026-6-3 14:34 | 显示全部楼层
另外后训练和对齐也是很重要的,这方面其实基本就是取决于资源量了,gpt明显是进行了严格充分的后训练来保证它完成任务的能力的。
“一件事情该怎么做”往往不是源于模型的智力,是源自于有没有好好学过。
回复

使用道具 举报

发表于 2026-6-3 15:03 | 显示全部楼层
话说有没有人知道ds为啥把专家模式的网页搜索给锁了,现在专家模式的数据都回滚到24年了,我问他金价是多少它说是560……
而且感觉它弱智了不少,有点豆包的感觉了,就是那种明着和你瞎扯的味。快速模式已经是弱智了。
回复

使用道具 举报

发表于 2026-6-3 15:08 | 显示全部楼层
兔灾2号 发表于 2026-6-3 15:03
话说有没有人知道ds为啥把专家模式的网页搜索给锁了,现在专家模式的数据都回滚到24年了,我问他金价是多少 ...

某些搞反代的搞了些神奇的操作。占用了大量资源。结果就是这样。    Re:Source

评分

参与人数 1战斗力 +1 收起 理由
兔灾2号 + 1 感谢

查看全部评分

回复

使用道具 举报

     
发表于 2026-6-3 15:09 | 显示全部楼层
兔灾2号 发表于 2026-6-3 15:03
话说有没有人知道ds为啥把专家模式的网页搜索给锁了,现在专家模式的数据都回滚到24年了,我问他金价是多少 ...

那帮反代和薅羊毛的太变态了 用api吧
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-18 18:16 , Processed in 0.154309 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表