omnitoken 发表于 2026-2-6 10:38

claude opus 4.6更新了,还整了个大活

本帖最后由 omnitoken 于 2026-2-6 11:19 编辑

反人类学公司这次整了个大活,让16个opus 4.6 agent合作,用rust写一个c编译器,花费2周时间和20000刀后

编译成功Linux 内核6.9 x86,ARM,riscv

内核可以运行,可以在这个内核之上运行doom

全程无人接管

blog更新了更多技术细节: clean room实现, 期间没有连接外网查询, 没有使用任何其他库, 只依赖了rust std
除了linux kernel, 还可以编译QEMU, FFmpeg, SQlite, postgres, redis



码农的护城河看来是真没有了

Emcylla 发表于 2026-2-6 10:53

linhaolin1 发表于 2026-2-6 11:01

有点让人害怕了……这种项目都能生成, 就是说编码完全可以交给ai了……

啥都控星人 发表于 2026-2-6 11:02

整个固定ip的代理就能用了

小野賢章 发表于 2026-2-6 11:06

chibicc 大概 1 万行代码,可以编译 sqlite
tcc 大概 6.5 万行代码,可以编译linux内核

havoc_cc 发表于 2026-2-6 11:07

blog链接请求一下

雪影 发表于 2026-2-6 11:09

有点强
被封了2个号了

omnitoken 发表于 2026-2-6 11:09

havoc_cc 发表于 2026-2-6 11:07
blog链接请求一下

https://www.anthropic.com/engineering/building-c-compiler

scikirbypoke 发表于 2026-2-6 11:13

这是真学透了

CrayS1 发表于 2026-2-6 11:17

这已经超越99%的程序员了 我可手搓不出来C编译器

luodang007 发表于 2026-2-6 11:20

claude 国内该用什么方式打开比较好呢

另外我想问问claude 对于erp数据库设计怎么样,我们这边编程的痛点在于各种客户的需求相互冲突或者不好扩展,不知道claude 能否给出更通用化的设计方案

ymm1030 发表于 2026-2-6 11:26

结构设计目前还得人来,具体的功能点可以让AI去填充。

HellMaster 发表于 2026-2-6 11:30

重复造轮子无人接管,很骄傲?

Eric_方歌阙 发表于 2026-2-6 11:31

HellMaster 发表于 2026-2-6 11:30
重复造轮子无人接管,很骄傲?

一般码农难道不是吗

赤星ビスコ 发表于 2026-2-6 11:32

luodang007 发表于 2026-2-6 11:20
claude 国内该用什么方式打开比较好呢

另外我想问问claude 对于erp数据库设计怎么样,我们这边编程的痛点 ...

我的经验是最好别让ai干连你自己也干不了的事,ai可以提升效率,但不要指望全给ai做

omnitoken 发表于 2026-2-6 11:38

国外码农基本都是恶评破防

“你用偷来的书本学习了一个暑假,然后闭卷考试60分有啥了不起的,居然还敢吹嘘净室实验,真不要脸”

“给我2万刀,我直接复制gcc代码给你,为什么要消耗如此多电力去发明不需要发明的东西”

—— 来自 鹅球 v3.3.96

whzfjd 发表于 2026-2-6 11:40

感觉有点问题,ai能写编译器是因为人类已经把编译器打磨得差不多了,而且大公司愿意养人造轮子是为了获得随叫随到的know how人员,内部需求方便适配改造,用ai直接造感觉有点微妙。

simonouozy 发表于 2026-2-6 11:44

主要是训练的库里不可能没有编译器代码,某种程度上确实是开卷考试,大部分人要ai做的也确实是其他人做过的东西

—— 来自 鹅球 v3.5.99

omnitoken 发表于 2026-2-6 11:47

HellMaster 发表于 2026-2-6 11:30
重复造轮子无人接管,很骄傲?

也不算重复造轮子吧

有一定复杂度的rust写的c 编译器互联网上的确是没有参考的

—— 来自 鹅球 v3.3.96

二岩枫 发表于 2026-2-6 11:49

下一步是不是应该让ai用rust重新实现一套linux内核了?

大韩李明博 发表于 2026-2-6 11:57

MAX用户用上了。。

御坂MKII 发表于 2026-2-6 11:59

omnitoken 发表于 2026-2-6 11:47
也不算重复造轮子吧

有一定复杂度的rust写的c 编译器互联网上的确是没有参考的

做翻译活和写 rust 都是它该擅长的

omnitoken 发表于 2026-2-6 12:00

御坂MKII 发表于 2026-2-6 11:59
做翻译活和写 rust 都是它该擅长的

无限轮次让cargo check然后改代码当然是llm擅长的

从某种角度来说选rust就是取巧



—— 来自 鹅球 v3.3.96

luodang007 发表于 2026-2-6 12:01

赤星ビスコ 发表于 2026-2-6 11:32
我的经验是最好别让ai干连你自己也干不了的事,ai可以提升效率,但不要指望全给ai做 ...

是的,我只是想看看他的设计方案有没参考意义

啥都控星人 发表于 2026-2-6 12:04

人类自己都是群复读机,为啥要在意ai

fmchar 发表于 2026-2-6 12:06

那么以后人只要给个构思AI就能直接实现?

keamedes 发表于 2026-2-6 12:06

Emcylla 发表于 2026-2-6 10:53
可惜克劳德不让我用啊,整天封号

https://zenmux.ai/invite/PRMXPV

lvyuanqi 发表于 2026-2-6 12:07

啥都控星人 发表于 2026-2-6 12:04
人类自己都是群复读机,为啥要在意ai

人类应该是希望ai能完成自己无法完成的项目吧,开发新药,各种基础理论的完善,当然这是差不多最终目的了

—— 来自 OnePlus LE2100, Android 14, 鹅球 v3.5.99-alpha

Saikou 发表于 2026-2-6 12:15

感觉AI当粘合剂挺好,东西往那边一摆ai就串起来了

featherwit 发表于 2026-2-6 12:24

luodang007 发表于 2026-2-6 11:20
claude 国内该用什么方式打开比较好呢

另外我想问问claude 对于erp数据库设计怎么样,我们这边编程的痛点 ...

试试呗,没准他知道现在有什么工具或者方案你不知道的。
跟他提需求跟他头脑风暴,告诉他有问题或者建议讲出来就行了。

featherwit 发表于 2026-2-6 12:25

虽然claude一直很抠,但这波给了50$ extra usage,还给了agent-teams能力,今天不黑他。

当然kimi的agent-swarm只要199月订阅就能用

常陆茉子prpr 发表于 2026-2-6 12:27

换语言重写的活我还真在干,至少有几十万行量级的重写

目前用下来无论是gemini flash/pro还是claude opus/sonnet还是gpt codex,其实都会出各种问题,需要人类根据翻译情况对提示词修修补补。静态类型语言可能好点,动态类型简直是折磨。还有泛型的处理也很苦手。

而且经常会忘掉你的要求,需要你提示二次检查甚至三次检查...有时候看他转圈还不如自己上手改
然后代码越长越容易出问题,两三千行基本上就是极限了。(已经按函数/行数限制一个个分了batch,但是在同一个上下文内。更长的得自己手动帮ai拆解了,agent目前还是太笨了,拆的不如人类。而且你也拦不住确实有人塞上千行💩进一个函数内)

语法这块也会有一些零零碎碎的问题,像引用和值类型的拷贝和传递啊,以及0 null 零长字符串之类的判空,不同语言不一样,ai会比较死板。

对代码库内其他文件的查找和引用也很苦手,经常出问题,或者引入的不对,或者命名冲突的情况完全没法解决混用一通。

目前总结下来ai大概只能帮我完成90%的工作,还有10%确实得是自己来的

gammatau 发表于 2026-2-6 12:42

本帖最后由 gammatau 于 2026-2-6 12:48 编辑

不要瞎说,blog上说的是:16个agent平行工作为了改bug会互相覆盖彼此写的代码,所以是用gcc编译器对比着agent自己写的编译器,分块编译内核代码看问题出在哪,才最终把编译器写好的

Nanachi 发表于 2026-2-6 12:46

能clean room重写,岂不是可以方便地黑屋逆向私有软件了?开源软件的未来,来了吗

omnitoken 发表于 2026-2-6 12:49

gammatau 发表于 2026-2-6 12:42
不要瞎说,blog上说的是:16个agent平行工作为了改bug会互相覆盖彼此写的代码,所以是用gcc编译器对比着age ...

那个适用gcc的输出做指导,不是直接抄gcc源码

—— 来自 鹅球 v3.3.96

zypyong 发表于 2026-2-6 12:51

这种超多agent合作的设计有没有什么教程。4-5个agent并行工作我就有点不会弄了

larry1 发表于 2026-2-6 12:55

最近在用claude4.5写代码。
感觉还是得一部分一部分。让他写。然后拼起来。
而且也经常搞不好。然后只能重来,需要详细描述需求才行。
经常会改到不想让他改的地方。然后就整个项目崩。。。
所以说你只能自己懂你的设计,你才能指挥他工作。相当于一个比较熟练的马工,但是对需求理解不是很透彻。

tiro_finale 发表于 2026-2-6 12:59

rust这种编译器查得特别严的还真有点适合喜欢乱来的AI,不会rust最后是靠AI起飞的吧

xuanwu_lei 发表于 2026-2-6 13:14

gammatau 发表于 2026-2-6 13:20

omnitoken 发表于 2026-2-6 12:49
那个适用gcc的输出做指导,不是直接抄gcc源码

—— 来自 鹅球 v3.3.96

事实就是在有一个完美考核oracle的情况下,它终于大致在功能上复现了训练集里出现过的代码
页: [1] 2
查看完整版本: claude opus 4.6更新了,还整了个大活