GLM就算买了,高峰期不是很慢就是降智吧
本帖最后由 neptunehs 于 2026-4-9 15:43 编辑
opencode 的qwen3.6要钱了
nemotron花式断网
minimax的上下文感觉略短
果然这不是免费能玩的吗
不过cline一碰到非文本立刻抛出不能读取 opencode还是可以的 挺好的
—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99
neptunehs 发表于 2026-4-9 15:41
opencode 的qwen3.6要钱了
nemotron花式断网
minimax的上下文感觉略短
算力没有软件的零成本复制特性,必然是不可能免费获取的,它以后必然是和能源价格挂钩的
今天突然听说harness已经过时了
最新最in的概念叫Managed Agents
Pi 不错,同时就读代码来说,不需要特别好的模型也没问题
Jet.Black 发表于 2026-4-9 20:23
今天突然听说harness已经过时了
最新最in的概念叫Managed Agents
这是搞前端的去搞智能体了吗
精钢魔像 发表于 2026-4-9 20:31
这是搞前端的去搞智能体了吗
不懂了,人类学官方放的话
https://www.anthropic.com/engineering/managed-agents
我想在Macmini里面搞个本地开源模型玩玩openclaw,有没有推荐的?
api的玩法还是挺烧钱的跑了几个流程就不见50块了
本帖最后由 pf67 于 2026-4-9 20:55 编辑
Jet.Black 发表于 2026-4-9 07:39
真有用的东西最后都会直接做到模型里的。
你所谓的做到模型,其实也是这些大模型公司围绕自己的模型构建的agent,你调用api的时候已经是agent的出口了
masonknight 发表于 2026-4-9 20:33
我想在Macmini里面搞个本地开源模型玩玩openclaw,有没有推荐的?
api的玩法还是挺烧钱的跑了几个流程就不 ...
一般4090 24G,可以部署qwen3.5 27B和 gemma 31B的q4量化版, 是目前本地能玩的最强的两个模型
本帖最后由 Jet.Black 于 2026-4-9 21:03 编辑
pf67 发表于 2026-4-9 20:54
你所谓的做到模型,其实也是这些大模型公司围绕自己的模型构建的agent,你调用api的时候已经是agent的出口了 ...
对啊,那普通人搞这个不是和模型对着干是啥,一个更新全都歇菜。
人类学今天说开始卖managed agent,我看这harness也要遭。
除非像c语言这种,先搞个iso标准委员会,不然分分钟完蛋。
本帖最后由 pf67 于 2026-4-9 21:39 编辑
Jet.Black 发表于 2026-4-9 20:59
对啊,那普通人搞这个不是和模型对着干是啥,一个更新全都歇菜。
人类学今天说开始卖managed agent,我看 ...
和你的用途有关啊,如果你只是用来写代码,那本来就不需要关心这些, 人家框架早就弄得很好了(当然仅限于那几个顶级的AI公司, 国内的这些agent框架的还是很屎)
如果你是做基于AI的应用开发(哪怕只是跟风搞龙虾),那你还是得看这些,不可能永远等下一个模型更新.至于是不是会完蛋,这不一定,只能说越是通用的场景越容易被替代. 而且就算是被替代了,你完全可以学国内芯片厂的套路,别人更新了啥我就抄上去,毕竟在国内环境天然就已经制造了门槛和信息差
pf67 发表于 2026-4-9 21:33
和你的用途有关啊,如果你只是用来写代码,那本来就不需要关心这些, 人家框架早就弄得很好了(当然仅限于那几 ...
ai时代,学的慢结果就是就不用学了,harness 才出来几天,人类学就已经在宣布harness玩蛋了。
以后需要的时候随便用用,平时看看热闹算了
Jet.Black 发表于 2026-4-9 21:50
ai时代,学的慢结果就是就不用学了,harness 才出来几天,人类学就已经在宣布harness玩蛋了。
以后需要 ...
我读了下文章,这个说的是应该把LLM和harness与实际执行分离吧,意思是harness的编排和执行应该做成可替换
赤星ビスコ 发表于 2026-4-9 23:26
我读了下文章,这个说的是应该把LLM和harness与实际执行分离吧,意思是harness的编排和执行应该做成可替 ...
“Harnesses encode assumptions that go stale as models improve. Managed Agents—our hosted service for long-horizon agent work—is built around interfaces that stay stable as harnesses change.”
标题下面大字写的,你们自己搞得harness不靠谱,跪着求我A大爷赏你们的managed agent吧。
蛋疼,codex plus被屠龙刀了,虽然知道肯定会有这一天但也砍的太狠了
harness的故事果然讲不下去了,我是把superpower,gstack,包括最近的compound engineering用了一遍,只能说提升很难感知,看似写了一堆spec和plan,输出的代码质量依旧非常依赖模型能力 现在已经化繁为简用回原生的plan mode了
AEmpire 发表于 2026-4-10 08:44
harness的故事果然讲不下去了,我是把superpower,gstack,包括最近的compound engineering用了一遍,只能 ...
我觉得最关键两点吧,一个是plan前需要做调查,搜索代码库,一个是写完后的需要能让AI自己验证写的对不对
Spec相当于被压缩了的代码库,AI也相当于刚入职的新人,总归给文档比让AI自己去翻代码库方便点,也更好控制
有s1 ai编程群吗?
yamanka 发表于 2026-4-8 16:17
想起来以前大学刚毕业的时候了解spring这种框架的结构还是硬啃源码
现在vibecoding这么方便,是不是可以反 ...
不能, 最多三天AI就改不动自己写的代码了, 修了旧问题出来新问题那种。
可恶的智谱,真是没马的东西
明天再战,抢个3-5天先试试
Claude能用的国内code plan有推荐吗?阿里云的抢了2天抢不到
Saikou 发表于 2026-4-10 06:53
蛋疼,codex plus被屠龙刀了,虽然知道肯定会有这一天但也砍的太狠了
帐号被封了? 用了多久?代充模式吗?
hanfze 发表于 2026-4-11 10:31
Claude能用的国内code plan有推荐吗?阿里云的抢了2天抢不到
火山也有个 200一个月,看介绍好像比智谱的流量高不用抢
支持的模型
Doubao-Seed-2.0-pro/lite/Code、Doubao-Seed-Code、MiniMax-M2.5、Kimi-K2.5、GLM-4.7、Deepseek-V3.2
我智谱的max 4月27日到期不打算用了,动不动就降智实在遭不住
viperasi 发表于 2026-4-10 20:37
帐号被封了? 用了多久?代充模式吗?
不是plus额度被大砍了,不到之前的1/4
Saikou 发表于 2026-4-11 11:35
不是plus额度被大砍了,不到之前的1/4
啊,我说昨天,今天怎么动不动就5小时limit了,原来是被砍了!!!蛋疼了
viperasi 发表于 2026-4-10 21:40
啊,我说昨天,今天怎么动不动就5小时limit了,原来是被砍了!!!蛋疼了 ...
用5.4mini就和之前差不多,但是5.4mini用起来挺一言难尽的
Saikou 发表于 2026-4-11 11:51
用5.4mini就和之前差不多,但是5.4mini用起来挺一言难尽的
临时用claude + glm5 输出plan 然后古法开发
突然想到harness engineering是不是可以翻成羁糜工程。
—— 来自 HUAWEI VYG-AL30, Android 12, 鹅球 v3.5.99