claude opus 4.6更新了,还整了个大活
本帖最后由 omnitoken 于 2026-2-6 11:19 编辑反人类学公司这次整了个大活,让16个opus 4.6 agent合作,用rust写一个c编译器,花费2周时间和20000刀后
编译成功Linux 内核6.9 x86,ARM,riscv
内核可以运行,可以在这个内核之上运行doom
全程无人接管
blog更新了更多技术细节: clean room实现, 期间没有连接外网查询, 没有使用任何其他库, 只依赖了rust std
除了linux kernel, 还可以编译QEMU, FFmpeg, SQlite, postgres, redis
码农的护城河看来是真没有了 有点让人害怕了……这种项目都能生成, 就是说编码完全可以交给ai了…… 整个固定ip的代理就能用了 chibicc 大概 1 万行代码,可以编译 sqlite
tcc 大概 6.5 万行代码,可以编译linux内核 blog链接请求一下 有点强
被封了2个号了 havoc_cc 发表于 2026-2-6 11:07
blog链接请求一下
https://www.anthropic.com/engineering/building-c-compiler 这是真学透了 这已经超越99%的程序员了 我可手搓不出来C编译器 claude 国内该用什么方式打开比较好呢
另外我想问问claude 对于erp数据库设计怎么样,我们这边编程的痛点在于各种客户的需求相互冲突或者不好扩展,不知道claude 能否给出更通用化的设计方案 结构设计目前还得人来,具体的功能点可以让AI去填充。 重复造轮子无人接管,很骄傲? HellMaster 发表于 2026-2-6 11:30
重复造轮子无人接管,很骄傲?
一般码农难道不是吗 luodang007 发表于 2026-2-6 11:20
claude 国内该用什么方式打开比较好呢
另外我想问问claude 对于erp数据库设计怎么样,我们这边编程的痛点 ...
我的经验是最好别让ai干连你自己也干不了的事,ai可以提升效率,但不要指望全给ai做 国外码农基本都是恶评破防
“你用偷来的书本学习了一个暑假,然后闭卷考试60分有啥了不起的,居然还敢吹嘘净室实验,真不要脸”
“给我2万刀,我直接复制gcc代码给你,为什么要消耗如此多电力去发明不需要发明的东西”
—— 来自 鹅球 v3.3.96 感觉有点问题,ai能写编译器是因为人类已经把编译器打磨得差不多了,而且大公司愿意养人造轮子是为了获得随叫随到的know how人员,内部需求方便适配改造,用ai直接造感觉有点微妙。 主要是训练的库里不可能没有编译器代码,某种程度上确实是开卷考试,大部分人要ai做的也确实是其他人做过的东西
—— 来自 鹅球 v3.5.99 HellMaster 发表于 2026-2-6 11:30
重复造轮子无人接管,很骄傲?
也不算重复造轮子吧
有一定复杂度的rust写的c 编译器互联网上的确是没有参考的
—— 来自 鹅球 v3.3.96 下一步是不是应该让ai用rust重新实现一套linux内核了? MAX用户用上了。。 omnitoken 发表于 2026-2-6 11:47
也不算重复造轮子吧
有一定复杂度的rust写的c 编译器互联网上的确是没有参考的
做翻译活和写 rust 都是它该擅长的 御坂MKII 发表于 2026-2-6 11:59
做翻译活和写 rust 都是它该擅长的
无限轮次让cargo check然后改代码当然是llm擅长的
从某种角度来说选rust就是取巧
—— 来自 鹅球 v3.3.96 赤星ビスコ 发表于 2026-2-6 11:32
我的经验是最好别让ai干连你自己也干不了的事,ai可以提升效率,但不要指望全给ai做 ...
是的,我只是想看看他的设计方案有没参考意义 人类自己都是群复读机,为啥要在意ai 那么以后人只要给个构思AI就能直接实现? Emcylla 发表于 2026-2-6 10:53
可惜克劳德不让我用啊,整天封号
https://zenmux.ai/invite/PRMXPV 啥都控星人 发表于 2026-2-6 12:04
人类自己都是群复读机,为啥要在意ai
人类应该是希望ai能完成自己无法完成的项目吧,开发新药,各种基础理论的完善,当然这是差不多最终目的了
—— 来自 OnePlus LE2100, Android 14, 鹅球 v3.5.99-alpha 感觉AI当粘合剂挺好,东西往那边一摆ai就串起来了 luodang007 发表于 2026-2-6 11:20
claude 国内该用什么方式打开比较好呢
另外我想问问claude 对于erp数据库设计怎么样,我们这边编程的痛点 ...
试试呗,没准他知道现在有什么工具或者方案你不知道的。
跟他提需求跟他头脑风暴,告诉他有问题或者建议讲出来就行了。 虽然claude一直很抠,但这波给了50$ extra usage,还给了agent-teams能力,今天不黑他。
当然kimi的agent-swarm只要199月订阅就能用 换语言重写的活我还真在干,至少有几十万行量级的重写
目前用下来无论是gemini flash/pro还是claude opus/sonnet还是gpt codex,其实都会出各种问题,需要人类根据翻译情况对提示词修修补补。静态类型语言可能好点,动态类型简直是折磨。还有泛型的处理也很苦手。
而且经常会忘掉你的要求,需要你提示二次检查甚至三次检查...有时候看他转圈还不如自己上手改
然后代码越长越容易出问题,两三千行基本上就是极限了。(已经按函数/行数限制一个个分了batch,但是在同一个上下文内。更长的得自己手动帮ai拆解了,agent目前还是太笨了,拆的不如人类。而且你也拦不住确实有人塞上千行💩进一个函数内)
语法这块也会有一些零零碎碎的问题,像引用和值类型的拷贝和传递啊,以及0 null 零长字符串之类的判空,不同语言不一样,ai会比较死板。
对代码库内其他文件的查找和引用也很苦手,经常出问题,或者引入的不对,或者命名冲突的情况完全没法解决混用一通。
目前总结下来ai大概只能帮我完成90%的工作,还有10%确实得是自己来的 本帖最后由 gammatau 于 2026-2-6 12:48 编辑
不要瞎说,blog上说的是:16个agent平行工作为了改bug会互相覆盖彼此写的代码,所以是用gcc编译器对比着agent自己写的编译器,分块编译内核代码看问题出在哪,才最终把编译器写好的 能clean room重写,岂不是可以方便地黑屋逆向私有软件了?开源软件的未来,来了吗 gammatau 发表于 2026-2-6 12:42
不要瞎说,blog上说的是:16个agent平行工作为了改bug会互相覆盖彼此写的代码,所以是用gcc编译器对比着age ...
那个适用gcc的输出做指导,不是直接抄gcc源码
—— 来自 鹅球 v3.3.96 这种超多agent合作的设计有没有什么教程。4-5个agent并行工作我就有点不会弄了 最近在用claude4.5写代码。
感觉还是得一部分一部分。让他写。然后拼起来。
而且也经常搞不好。然后只能重来,需要详细描述需求才行。
经常会改到不想让他改的地方。然后就整个项目崩。。。
所以说你只能自己懂你的设计,你才能指挥他工作。相当于一个比较熟练的马工,但是对需求理解不是很透彻。 rust这种编译器查得特别严的还真有点适合喜欢乱来的AI,不会rust最后是靠AI起飞的吧 omnitoken 发表于 2026-2-6 12:49
那个适用gcc的输出做指导,不是直接抄gcc源码
—— 来自 鹅球 v3.3.96
事实就是在有一个完美考核oracle的情况下,它终于大致在功能上复现了训练集里出现过的代码
页:
[1]
2