感觉现在ai编程喜欢自作主张，辅助搞学术还是欠点

汤浅比吕美 · 发表于 2026-6-11 23:46

库德里尔发表于 2026-6-11 10:12
用Agent评测思路管理AI Coding —— 31万行代码AI重构的实践

工程技术：在智能体优先的世界中利用 Codex

重构，然后5W 变31W ?

很久就在那边l · 发表于 2026-6-12 00:56

汤浅比吕美发表于 2026-6-11 23:46
重构，然后5W 变31W ?

5w到31w是重构前

读不懂可以让ai帮忙的

库德里尔 · 发表于 2026-6-12 08:01

汤浅比吕美发表于 2026-6-11 23:46
重构，然后5W 变31W ?

系统从 2025 年 6 月约不足 5 万行代码快速扩展至 31 万行……在这样一个高人员流动和跨技术栈的背景下，再叠加 90% 以上代码由 AI 辅助编写这一事实……2026年2月启动了重构。

—— 来自鹅球 v3.5.99

qwjhb · 发表于 2026-6-12 08:19

henvelleng 发表于 2026-6-11 23:32
大模型的本质就是不守规矩的，验收审核也改变不了本质，它已经那么做了，唯一能补救的，只有git回溯然后 ...

？边界约束生成测试
测试不过要改已经在他流程里了
怎么还能到git那步的

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99

henvelleng · 发表于 2026-6-12 08:59

本帖最后由 henvelleng 于 2026-6-12 09:01 编辑

qwjhb 发表于 2026-6-12 08:19
？边界约束生成测试
测试不过要改已经在他流程里了
怎么还能到git那步的

有时候是改不好的，甚至ai自己也会尝试git回溯。感觉是鸡同鸭讲，你说的是做错了怎么补救，我说的是它一开始就做错了，为什么会做错。这是第一个问题，第二个问题是不是什么错都能改回来的。

—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99

qwjhb · 发表于 2026-6-12 10:09

henvelleng 发表于 2026-6-12 08:59
有时候是改不好的，甚至ai自己也会尝试git回溯。感觉是鸡同鸭讲，你说的是做错了怎么补救，我说的是它一 ...

额我没说补救啊
AI写代码都是加大量测试的和回归测试的你要一个新需求他在实现过程中有测试不绿自然就开始重写了不会到提交那不
发现过的问题测试加好不改好永远通不过任务不会完成
改好了通过这个问题的测试还要继续过回归避免引入新问题

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99

hugosol · 发表于 2026-6-12 10:28

本帖最后由 hugosol 于 2026-6-12 11:46 编辑

是的，所以tdd现在又火起来了

其实我觉得tdd对ai之所以有用不是因为测试有用，而是因为tdd的前提是要做好垂直切片，垂直切片做得好了，每做一个小改动都让编译器来把关（相当于强制每写几句就让ai用lsp检查），那风险就降得很低了
还有就是能用tdd测试的代码本身架构上就有一定考量了，会倒逼ai的产出质量提高

qwjhb · 发表于 2026-6-12 10:41

模型负责模糊创造
程序负责精准校验
擅长什么就干什么

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99

ykrank · 发表于 2026-6-12 10:54

StrangerJ 发表于 2026-6-9 23:26
不要觉得自己有多特殊，你应该感谢工作环境足够简单和干净。
当项目context足够大，你对其他部门乱七八糟 ...

你们项目能比 chrome 和 Windows 复杂多少？

—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alpha

AraTurambar · 发表于 2026-6-12 11:03

qwjhb 发表于 2026-6-12 10:41
模型负责模糊创造
程序负责精准校验
擅长什么就干什么

正确流程就是让AI写脚本但是Sympy和Lean必须跑得起来。

盯着AI迭代到Lean没有sorry，自己再肉眼检查，就八九不离十了。

Lamic · 发表于 2026-6-12 11:42

我最常用的指令就是“重新阅读源码，梳理逻辑”

—— 来自 vivo V2520A, Android 16, 鹅球 v3.5.99

henvelleng · 发表于 2026-6-12 12:28

qwjhb 发表于 2026-6-12 10:09
额我没说补救啊
AI写代码都是加大量测试的和回归测试的你要一个新需求他在实现过程中有测试不绿自然就 ...

有时候是改不好的。我举个极端例子，ai偷懒自己写了个正则表达式的脚本做批量替换，一下替换掉几千行代码，怎么改回来？不可能改回来了。这时候你仔细观察，ai首先会尝试git，发现agent没给git权限，然后会通过各种途径去找可能的备份。找不到备份，才会去硬改，如果你不介入，它很可能会陷入循环

—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99

长生久视 · 发表于 2026-6-12 13:16

lactone 发表于 2026-6-9 02:27
那你搞错了，现在在非cs领域，比如自然科学里面搞跨学科的，可能真不如CRUD boy

—— 来自 HONOR AAK-AN ...

比原来强就行了，本来搞学术的就不是万能，低水平学术多了去了，比如常凯申这个翻译就是某个历史教授搞出来的，好像也没身败名裂啥的

Anarkia · 发表于 2026-6-12 15:27

henvelleng 发表于 2026-6-12 12:28
有时候是改不好的。我举个极端例子，ai偷懒自己写了个正则表达式的脚本做批量替换，一下替换掉几千行代码 ...

ai犯错 -> 发现自己错了 -> 找办法补救
这是AI ReAct标准流程

收敛AI犯错可能，规范AI行为，提供Agent工作环境，为每个Agent制定标准和行为边界
这是标准harness工程

不做harness工程让AI瞎跑当然不行，现在谁家vibe coding都不是给个prompt就让它跑的，那是没工程经验当许愿机用呢
是你没有明白怎么从工程角度控制AI行为

StrangerJ · 发表于 2026-6-12 15:58

ykrank 发表于 2026-6-12 10:54
你们项目能比 chrome 和 Windows 复杂多少？

—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alp ...

真是越回复越莫名其妙
这坛子里的ai狂信徒和反智反ai的也差不多了

要么你用的不够多，要么你的项目太小了
opus4.7根据名字判断用途完全是家常便饭，你不告诉他去看代码他立刻就会偷懒

这是我原来的回复，我每天都用codex和claude，所有项目都是用ai来做的，用ai来做不代表ai就像你们现在嘴巴里形容的万能机器一样了
你写了一堆doc，然后发现这东西因为context忘记了然后开始骗你都是经常的事

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99

henvelleng · 发表于 2026-6-12 16:44

本帖最后由 henvelleng 于 2026-6-12 16:51 编辑

Anarkia 发表于 2026-6-12 15:27
ai犯错 -> 发现自己错了 -> 找办法补救
这是AI ReAct标准流程

你还是没理解我说的话。

1 你定的规则对ai来说并不会完全有效，比如你禁止ai写脚本用正则表达式无脑替代，ai就一定会听话吗？并不会。

2 过了测试的代码就是正确的了吗？外行都知道不是。

3 让另一个ai去review ai的代码，跟没有review裸奔没有任何区别，我把这话放这儿，就不怕被喷。

哎，怎么感觉跟你们说话也有点在循环绕圈子了，而且我看到harness这类不明所以的词就很反感了，和元宇宙一个味儿。

—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99

hugosol · 发表于 2026-6-12 17:51

henvelleng 发表于 2026-6-12 16:44
你还是没理解我说的话。

1 你定的规则对ai来说并不会完全有效，比如你禁止ai写脚本用正则表达式无脑替代 ...

可以用hook自定义规则。。。

henvelleng · 发表于 2026-6-12 17:57

本帖最后由 henvelleng 于 2026-6-12 17:59 编辑

hugosol 发表于 2026-6-12 17:51
可以用hook自定义规则。。。

其实无论通过什么途径定规则，最终都是通过prompt给到大模型的，大模型之所以会无视规则，本质是因为专注力的问题，上下文太大了，控制好上下文就能有效避免无视规则的问题，反正上下文现在在agent里也都看得到。

现在几乎所有的所谓ai使用技巧，都在以非常快的速度融合进各大agent中，甚至我看到有些agent已经有了节点控制，可以回滚到某次对话，省的自己用git备份和回溯

—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99

ceruleancard · 发表于 2026-6-12 17:57

老黄说ai能让每个人都成为程序员，但我看你们这讨论，用ai写程序比古法写代码还复杂啊

LeoDT · 发表于 2026-6-12 18:13

ceruleancard 发表于 2026-6-12 17:57
老黄说ai能让每个人都成为程序员，但我看你们这讨论，用ai写程序比古法写代码还复杂啊 ...

这东西不是让每个人都成为程序员，而是要求每个人都是架构师，架构师可比程序员要求高出不知道多少了。当然你就是写着玩不管代码质量那确实每个人都是程序员。

ai并不能改变一个人写代码的能力，原本的强者更强，原本的屎更屎。

phorcys02 · 发表于 2026-6-12 21:38

ceruleancard 发表于 2026-6-12 17:57
老黄说ai能让每个人都成为程序员，但我看你们这讨论，用ai写程序比古法写代码还复杂啊 ...

每个人都能当程序员
但那是当业余爱好

你要把这当门手艺, 你就得从程序员进化成架构师+pm 最少.
本质上搞好几个agent写代码.和你带七八个十来个人的小团队开发项目没区别, 该有的那个都跑不了
只不过llm写得快,而且没有活人的主观能动性,还经常性拉屎, 最重要的:关键时刻不能背锅

ykrank · 发表于 2026-6-13 15:26

StrangerJ 发表于 2026-6-12 15:58
真是越回复越莫名其妙
这坛子里的ai狂信徒和反智反ai的也差不多了

谁跟你说的万能机器你去找谁，不要乱扣帽子好吗

—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alpha

ykrank · 发表于 2026-6-13 15:28

StrangerJ 发表于 2026-6-12 15:58
真是越回复越莫名其妙
这坛子里的ai狂信徒和反智反ai的也差不多了

我针对的只是只有简单项目才能用 AI 的观点而已

—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alpha

		自动登录	找回密码
密码			立即注册

[科技] 感觉现在ai编程喜欢自作主张，辅助搞学术还是欠点