用Agent评测思路管理AI Coding —— 31万行代码AI重构的实践
工程技术:在智能体优先的世界中利用 Codex
重构,然后5W 变31W ? 汤浅比吕美 发表于 2026-6-11 23:46
重构,然后5W 变31W ?
5w到31w是重构前读不懂可以让ai帮忙的 汤浅比吕美 发表于 2026-6-11 23:46
重构,然后5W 变31W ?
系统从 2025 年 6 月约不足 5 万行代码快速扩展至 31 万行……在这样一个高人员流动和跨技术栈的背景下,再叠加 90% 以上代码由 AI 辅助编写这一事实……2026年2月启动了重构。
—— 来自 鹅球 v3.5.99 henvelleng 发表于 2026-6-11 23:32
大模型的本质就是不守规矩的,验收审核也改变不了本质,它已经那么做了,唯一能补救的,只有git回溯然后 ...
? 边界约束生成测试
测试不过要改 已经在他流程里了
怎么还能到git那步的
—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99 本帖最后由 henvelleng 于 2026-6-12 09:01 编辑
qwjhb 发表于 2026-6-12 08:19
? 边界约束生成测试
测试不过要改 已经在他流程里了
怎么还能到git那步的
有时候是改不好的,甚至ai自己也会尝试git回溯。感觉是鸡同鸭讲,你说的是做错了怎么补救,我说的是它一开始就做错了,为什么会做错。这是第一个问题,第二个问题是不是什么错都能改回来的。
—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99 henvelleng 发表于 2026-6-12 08:59
有时候是改不好的,甚至ai自己也会尝试git回溯。感觉是鸡同鸭讲,你说的是做错了怎么补救,我说的是它一 ...
额 我没说补救啊
AI写代码都是加大量测试的和回归测试的 你要一个新需求他在实现过程中有测试不绿自然就开始重写了 不会到提交那不
发现过的问题测试加好 不改好永远通不过任务不会完成
改好了通过这个问题的测试 还要继续过回归 避免引入新问题
—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99 本帖最后由 hugosol 于 2026-6-12 11:46 编辑
是的,所以tdd现在又火起来了
其实我觉得tdd对ai之所以有用不是因为测试有用,而是因为tdd的前提是要做好垂直切片,垂直切片做得好了,每做一个小改动都让编译器来把关(相当于强制每写几句就让ai用lsp检查),那风险就降得很低了
还有就是能用tdd测试的代码本身架构上就有一定考量了,会倒逼ai的产出质量提高 模型负责模糊创造
程序负责精准校验
擅长什么就干什么
—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99 StrangerJ 发表于 2026-6-9 23:26
不要觉得自己有多特殊,你应该感谢工作环境足够简单和干净。
当项目context足够大,你对其他部门乱七八糟 ...
你们项目能比 chrome 和 Windows 复杂多少?
—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alpha qwjhb 发表于 2026-6-12 10:41
模型负责模糊创造
程序负责精准校验
擅长什么就干什么
正确流程就是让AI写脚本但是Sympy和Lean必须跑得起来。
盯着AI迭代到Lean没有sorry,自己再肉眼检查,就八九不离十了。 我最常用的指令就是“重新阅读源码,梳理逻辑”
—— 来自 vivo V2520A, Android 16, 鹅球 v3.5.99 qwjhb 发表于 2026-6-12 10:09
额 我没说补救啊
AI写代码都是加大量测试的和回归测试的 你要一个新需求他在实现过程中有测试不绿自然就 ...
有时候是改不好的。我举个极端例子,ai偷懒自己写了个正则表达式的脚本做批量替换,一下替换掉几千行代码,怎么改回来?不可能改回来了。这时候你仔细观察,ai首先会尝试git,发现agent没给git权限,然后会通过各种途径去找可能的备份。找不到备份,才会去硬改,如果你不介入,它很可能会陷入循环
—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99 lactone 发表于 2026-6-9 02:27
那你搞错了,现在在非cs领域,比如自然科学里面搞跨学科的,可能真不如CRUD boy
—— 来自 HONOR AAK-AN ...
比原来强就行了,本来搞学术的就不是万能,低水平学术多了去了,比如常凯申这个翻译就是某个历史教授搞出来的,好像也没身败名裂啥的 henvelleng 发表于 2026-6-12 12:28
有时候是改不好的。我举个极端例子,ai偷懒自己写了个正则表达式的脚本做批量替换,一下替换掉几千行代码 ...
ai犯错 -> 发现自己错了 -> 找办法补救
这是AI ReAct标准流程
收敛AI犯错可能,规范AI行为,提供Agent工作环境,为每个Agent制定标准和行为边界
这是标准harness工程
不做harness工程让AI瞎跑当然不行,现在谁家vibe coding都不是给个prompt就让它跑的,那是没工程经验当许愿机用呢
是你没有明白怎么从工程角度控制AI行为 ykrank 发表于 2026-6-12 10:54
你们项目能比 chrome 和 Windows 复杂多少?
—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alp ...
真是越回复越莫名其妙
这坛子里的ai狂信徒和反智反ai的也差不多了
要么你用的不够多,要么你的项目太小了
opus4.7根据名字判断用途完全是家常便饭,你不告诉他去看代码他立刻就会偷懒
这是我原来的回复,我每天都用codex和claude,所有项目都是用ai来做的,用ai来做不代表ai就像你们现在嘴巴里形容的万能机器一样了
你写了一堆doc,然后发现这东西因为context忘记了然后开始骗你都是经常的事
—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99 本帖最后由 henvelleng 于 2026-6-12 16:51 编辑
Anarkia 发表于 2026-6-12 15:27
ai犯错 -> 发现自己错了 -> 找办法补救
这是AI ReAct标准流程
你还是没理解我说的话。
1 你定的规则对ai来说并不会完全有效,比如你禁止ai写脚本用正则表达式无脑替代,ai就一定会听话吗?并不会。
2 过了测试的代码就是正确的了吗?外行都知道不是。
3 让另一个ai去review ai的代码,跟没有review裸奔没有任何区别,我把这话放这儿,就不怕被喷。
哎,怎么感觉跟你们说话也有点在循环绕圈子了,而且我看到harness这类不明所以的词就很反感了,和元宇宙一个味儿。
—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99 henvelleng 发表于 2026-6-12 16:44
你还是没理解我说的话。
1 你定的规则对ai来说并不会完全有效,比如你禁止ai写脚本用正则表达式无脑替代 ...
可以用hook自定义规则。。。 本帖最后由 henvelleng 于 2026-6-12 17:59 编辑
hugosol 发表于 2026-6-12 17:51
可以用hook自定义规则。。。
其实无论通过什么途径定规则,最终都是通过prompt给到大模型的,大模型之所以会无视规则,本质是因为专注力的问题,上下文太大了,控制好上下文就能有效避免无视规则的问题,反正上下文现在在agent里也都看得到。
现在几乎所有的所谓ai使用技巧,都在以非常快的速度融合进各大agent中,甚至我看到有些agent已经有了节点控制,可以回滚到某次对话,省的自己用git备份和回溯
—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99 老黄说ai能让每个人都成为程序员,但我看你们这讨论,用ai写程序比古法写代码还复杂啊 ceruleancard 发表于 2026-6-12 17:57
老黄说ai能让每个人都成为程序员,但我看你们这讨论,用ai写程序比古法写代码还复杂啊 ...
这东西不是让每个人都成为程序员,而是要求每个人都是架构师,架构师可比程序员要求高出不知道多少了。当然你就是写着玩不管代码质量那确实每个人都是程序员。
ai并不能改变一个人写代码的能力,原本的强者更强,原本的屎更屎。 ceruleancard 发表于 2026-6-12 17:57
老黄说ai能让每个人都成为程序员,但我看你们这讨论,用ai写程序比古法写代码还复杂啊 ...
每个人都能当程序员
但那是当业余爱好
你要把这当门手艺, 你就得从程序员进化成架构师+pm 最少.
本质上搞好几个agent写代码.和你带七八个十来个人的小团队开发项目没区别, 该有的那个都跑不了
只不过llm写得快,而且没有活人的主观能动性,还经常性拉屎, 最重要的:关键时刻不能背锅
StrangerJ 发表于 2026-6-12 15:58
真是越回复越莫名其妙
这坛子里的ai狂信徒和反智反ai的也差不多了
谁跟你说的万能机器你去找谁,不要乱扣帽子好吗
—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alpha StrangerJ 发表于 2026-6-12 15:58
真是越回复越莫名其妙
这坛子里的ai狂信徒和反智反ai的也差不多了
我针对的只是只有简单项目才能用 AI 的观点而已
—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alpha
页:
1
[2]