claude opus 4.6更新了，还整了个大活

omnitoken 发表于 2026-2-6 10:38

本帖最后由 omnitoken 于 2026-2-6 11:19 编辑

反人类学公司这次整了个大活，让16个opus 4.6 agent合作，用rust写一个c编译器，花费2周时间和20000刀后

编译成功Linux 内核6.9 x86，ARM，riscv

内核可以运行，可以在这个内核之上运行doom

全程无人接管

blog更新了更多技术细节: clean room实现, 期间没有连接外网查询, 没有使用任何其他库, 只依赖了rust std
除了linux kernel, 还可以编译QEMU, FFmpeg, SQlite, postgres, redis

码农的护城河看来是真没有了

Emcylla 发表于 2026-2-6 10:53

linhaolin1 发表于 2026-2-6 11:01

有点让人害怕了……这种项目都能生成，就是说编码完全可以交给ai了……

啥都控星人 发表于 2026-2-6 11:02

整个固定ip的代理就能用了

小野賢章 发表于 2026-2-6 11:06

chibicc 大概 1 万行代码，可以编译 sqlite
tcc 大概 6.5 万行代码，可以编译linux内核

havoc_cc 发表于 2026-2-6 11:07

blog链接请求一下

雪影发表于 2026-2-6 11:09

有点强
被封了2个号了

omnitoken 发表于 2026-2-6 11:09

havoc_cc 发表于 2026-2-6 11:07
blog链接请求一下

https://www.anthropic.com/engineering/building-c-compiler

scikirbypoke 发表于 2026-2-6 11:13

这是真学透了

CrayS1 发表于 2026-2-6 11:17

这已经超越99%的程序员了我可手搓不出来C编译器

luodang007 发表于 2026-2-6 11:20

claude 国内该用什么方式打开比较好呢

另外我想问问claude 对于erp数据库设计怎么样，我们这边编程的痛点在于各种客户的需求相互冲突或者不好扩展，不知道claude 能否给出更通用化的设计方案

ymm1030 发表于 2026-2-6 11:26

结构设计目前还得人来，具体的功能点可以让AI去填充。

HellMaster 发表于 2026-2-6 11:30

重复造轮子无人接管，很骄傲？

Eric_方歌阙 发表于 2026-2-6 11:31

HellMaster 发表于 2026-2-6 11:30
重复造轮子无人接管，很骄傲？

一般码农难道不是吗

赤星ビスコ 发表于 2026-2-6 11:32

luodang007 发表于 2026-2-6 11:20
claude 国内该用什么方式打开比较好呢

另外我想问问claude 对于erp数据库设计怎么样，我们这边编程的痛点 ...

我的经验是最好别让ai干连你自己也干不了的事，ai可以提升效率，但不要指望全给ai做

omnitoken 发表于 2026-2-6 11:38

国外码农基本都是恶评破防

“你用偷来的书本学习了一个暑假，然后闭卷考试60分有啥了不起的，居然还敢吹嘘净室实验，真不要脸”

“给我2万刀，我直接复制gcc代码给你，为什么要消耗如此多电力去发明不需要发明的东西”

—— 来自鹅球 v3.3.96

whzfjd 发表于 2026-2-6 11:40

感觉有点问题，ai能写编译器是因为人类已经把编译器打磨得差不多了，而且大公司愿意养人造轮子是为了获得随叫随到的know how人员，内部需求方便适配改造，用ai直接造感觉有点微妙。

simonouozy 发表于 2026-2-6 11:44

主要是训练的库里不可能没有编译器代码，某种程度上确实是开卷考试，大部分人要ai做的也确实是其他人做过的东西

—— 来自鹅球 v3.5.99

omnitoken 发表于 2026-2-6 11:47

HellMaster 发表于 2026-2-6 11:30
重复造轮子无人接管，很骄傲？

也不算重复造轮子吧

有一定复杂度的rust写的c 编译器互联网上的确是没有参考的

—— 来自鹅球 v3.3.96

二岩枫 发表于 2026-2-6 11:49

下一步是不是应该让ai用rust重新实现一套linux内核了？

大韩李明博 发表于 2026-2-6 11:57

MAX用户用上了。。

御坂MKII 发表于 2026-2-6 11:59

omnitoken 发表于 2026-2-6 11:47
也不算重复造轮子吧

有一定复杂度的rust写的c 编译器互联网上的确是没有参考的

做翻译活和写 rust 都是它该擅长的

omnitoken 发表于 2026-2-6 12:00

御坂MKII 发表于 2026-2-6 11:59
做翻译活和写 rust 都是它该擅长的

无限轮次让cargo check然后改代码当然是llm擅长的

从某种角度来说选rust就是取巧

—— 来自鹅球 v3.3.96

luodang007 发表于 2026-2-6 12:01

赤星ビスコ发表于 2026-2-6 11:32
我的经验是最好别让ai干连你自己也干不了的事，ai可以提升效率，但不要指望全给ai做 ...

是的，我只是想看看他的设计方案有没参考意义

啥都控星人 发表于 2026-2-6 12:04

人类自己都是群复读机，为啥要在意ai

fmchar 发表于 2026-2-6 12:06

那么以后人只要给个构思AI就能直接实现？

keamedes 发表于 2026-2-6 12:06

Emcylla 发表于 2026-2-6 10:53
可惜克劳德不让我用啊，整天封号

https://zenmux.ai/invite/PRMXPV

lvyuanqi 发表于 2026-2-6 12:07

啥都控星人发表于 2026-2-6 12:04
人类自己都是群复读机，为啥要在意ai

人类应该是希望ai能完成自己无法完成的项目吧，开发新药，各种基础理论的完善，当然这是差不多最终目的了

—— 来自 OnePlus LE2100, Android 14, 鹅球 v3.5.99-alpha

Saikou 发表于 2026-2-6 12:15

感觉AI当粘合剂挺好，东西往那边一摆ai就串起来了

featherwit 发表于 2026-2-6 12:24

luodang007 发表于 2026-2-6 11:20
claude 国内该用什么方式打开比较好呢

另外我想问问claude 对于erp数据库设计怎么样，我们这边编程的痛点 ...

试试呗，没准他知道现在有什么工具或者方案你不知道的。
跟他提需求跟他头脑风暴，告诉他有问题或者建议讲出来就行了。

featherwit 发表于 2026-2-6 12:25

虽然claude一直很抠，但这波给了50$ extra usage，还给了agent-teams能力，今天不黑他。

当然kimi的agent-swarm只要199月订阅就能用

常陆茉子prpr 发表于 2026-2-6 12:27

换语言重写的活我还真在干，至少有几十万行量级的重写

目前用下来无论是gemini flash/pro还是claude opus/sonnet还是gpt codex，其实都会出各种问题，需要人类根据翻译情况对提示词修修补补。静态类型语言可能好点，动态类型简直是折磨。还有泛型的处理也很苦手。

而且经常会忘掉你的要求，需要你提示二次检查甚至三次检查...有时候看他转圈还不如自己上手改
然后代码越长越容易出问题，两三千行基本上就是极限了。（已经按函数/行数限制一个个分了batch，但是在同一个上下文内。更长的得自己手动帮ai拆解了，agent目前还是太笨了，拆的不如人类。而且你也拦不住确实有人塞上千行💩进一个函数内）

语法这块也会有一些零零碎碎的问题，像引用和值类型的拷贝和传递啊，以及0 null 零长字符串之类的判空，不同语言不一样，ai会比较死板。

对代码库内其他文件的查找和引用也很苦手，经常出问题，或者引入的不对，或者命名冲突的情况完全没法解决混用一通。

目前总结下来ai大概只能帮我完成90%的工作，还有10%确实得是自己来的

gammatau 发表于 2026-2-6 12:42

本帖最后由 gammatau 于 2026-2-6 12:48 编辑

不要瞎说，blog上说的是：16个agent平行工作为了改bug会互相覆盖彼此写的代码，所以是用gcc编译器对比着agent自己写的编译器，分块编译内核代码看问题出在哪，才最终把编译器写好的

Nanachi 发表于 2026-2-6 12:46

能clean room重写，岂不是可以方便地黑屋逆向私有软件了？开源软件的未来，来了吗

omnitoken 发表于 2026-2-6 12:49

gammatau 发表于 2026-2-6 12:42
不要瞎说，blog上说的是：16个agent平行工作为了改bug会互相覆盖彼此写的代码，所以是用gcc编译器对比着age ...

那个适用gcc的输出做指导，不是直接抄gcc源码

—— 来自鹅球 v3.3.96

zypyong 发表于 2026-2-6 12:51

这种超多agent合作的设计有没有什么教程。4-5个agent并行工作我就有点不会弄了

larry1 发表于 2026-2-6 12:55

最近在用claude4.5写代码。
感觉还是得一部分一部分。让他写。然后拼起来。
而且也经常搞不好。然后只能重来，需要详细描述需求才行。
经常会改到不想让他改的地方。然后就整个项目崩。。。
所以说你只能自己懂你的设计，你才能指挥他工作。相当于一个比较熟练的马工，但是对需求理解不是很透彻。

tiro_finale 发表于 2026-2-6 12:59

rust这种编译器查得特别严的还真有点适合喜欢乱来的AI，不会rust最后是靠AI起飞的吧

xuanwu_lei 发表于 2026-2-6 13:14

gammatau 发表于 2026-2-6 13:20

omnitoken 发表于 2026-2-6 12:49
那个适用gcc的输出做指导，不是直接抄gcc源码

—— 来自鹅球 v3.3.96

事实就是在有一个完美考核oracle的情况下，它终于大致在功能上复现了训练集里出现过的代码

页: [1] 2

Stage1st's Archiver

claude opus 4.6更新了，还整了个大活