找回密码
 立即注册
搜索
楼主: lactone

[科技] 感觉现在ai编程喜欢自作主张,辅助搞学术还是欠点

[复制链接]
     
发表于 2026-6-11 23:46 | 显示全部楼层
库德里尔 发表于 2026-6-11 10:12
用Agent评测思路管理AI Coding —— 31万行代码AI重构的实践

工程技术:在智能体优先的世界中利用 Codex

重构,然后5W 变31W ?
回复

使用道具 举报

     
发表于 2026-6-12 00:56 来自手机 | 显示全部楼层

5w到31w是重构前读不懂可以让ai帮忙的
回复

使用道具 举报

     
发表于 2026-6-12 08:01 来自手机 | 显示全部楼层

系统从 2025 年 6 月约不足 5 万行代码快速扩展至 31 万行……在这样一个高人员流动和跨技术栈的背景下,再叠加 90% 以上代码由 AI 辅助编写这一事实……2026年2月启动了重构。

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-6-12 08:19 来自手机 | 显示全部楼层
henvelleng 发表于 2026-6-11 23:32
大模型的本质就是不守规矩的,验收审核也改变不了本质,它已经那么做了,唯一能补救的,只有git回溯然后 ...

? 边界约束生成测试
测试不过要改 已经在他流程里了
怎么还能到git那步的

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-12 08:59 来自手机 | 显示全部楼层
本帖最后由 henvelleng 于 2026-6-12 09:01 编辑
qwjhb 发表于 2026-6-12 08:19
? 边界约束生成测试
测试不过要改 已经在他流程里了
怎么还能到git那步的

有时候是改不好的,甚至ai自己也会尝试git回溯。感觉是鸡同鸭讲,你说的是做错了怎么补救,我说的是它一开始就做错了,为什么会做错。这是第一个问题,第二个问题是不是什么错都能改回来的。

—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-6-12 10:09 来自手机 | 显示全部楼层
henvelleng 发表于 2026-6-12 08:59
有时候是改不好的,甚至ai自己也会尝试git回溯。感觉是鸡同鸭讲,你说的是做错了怎么补救,我说的是它一 ...

额 我没说补救啊
AI写代码都是加大量测试的和回归测试的 你要一个新需求他在实现过程中有测试不绿自然就开始重写了 不会到提交那不
发现过的问题测试加好 不改好永远通不过任务不会完成
改好了通过这个问题的测试 还要继续过回归 避免引入新问题

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-12 10:28 | 显示全部楼层
本帖最后由 hugosol 于 2026-6-12 11:46 编辑

是的,所以tdd现在又火起来了
其实我觉得tdd对ai之所以有用不是因为测试有用,而是因为tdd的前提是要做好垂直切片,垂直切片做得好了,每做一个小改动都让编译器来把关(相当于强制每写几句就让ai用lsp检查),那风险就降得很低了
还有就是能用tdd测试的代码本身架构上就有一定考量了,会倒逼ai的产出质量提高
回复

使用道具 举报

发表于 2026-6-12 10:41 来自手机 | 显示全部楼层
模型负责模糊创造
程序负责精准校验
擅长什么就干什么

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-12 10:54 来自手机 | 显示全部楼层
StrangerJ 发表于 2026-6-9 23:26
不要觉得自己有多特殊,你应该感谢工作环境足够简单和干净。
当项目context足够大,你对其他部门乱七八糟 ...

你们项目能比 chrome 和 Windows 复杂多少?

—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alpha
回复

使用道具 举报

     
发表于 2026-6-12 11:03 | 显示全部楼层
qwjhb 发表于 2026-6-12 10:41
模型负责模糊创造
程序负责精准校验
擅长什么就干什么

正确流程就是让AI写脚本但是Sympy和Lean必须跑得起来。

盯着AI迭代到Lean没有sorry,自己再肉眼检查,就八九不离十了。
回复

使用道具 举报

     
发表于 2026-6-12 11:42 来自手机 | 显示全部楼层
我最常用的指令就是“重新阅读源码,梳理逻辑”

—— 来自 vivo V2520A, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-12 12:28 来自手机 | 显示全部楼层
qwjhb 发表于 2026-6-12 10:09
额 我没说补救啊
AI写代码都是加大量测试的和回归测试的 你要一个新需求他在实现过程中有测试不绿自然就 ...

有时候是改不好的。我举个极端例子,ai偷懒自己写了个正则表达式的脚本做批量替换,一下替换掉几千行代码,怎么改回来?不可能改回来了。这时候你仔细观察,ai首先会尝试git,发现agent没给git权限,然后会通过各种途径去找可能的备份。找不到备份,才会去硬改,如果你不介入,它很可能会陷入循环

—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-12 13:16 来自手机 | 显示全部楼层
lactone 发表于 2026-6-9 02:27
那你搞错了,现在在非cs领域,比如自然科学里面搞跨学科的,可能真不如CRUD boy

—— 来自 HONOR AAK-AN ...

比原来强就行了,本来搞学术的就不是万能,低水平学术多了去了,比如常凯申这个翻译就是某个历史教授搞出来的,好像也没身败名裂啥的
回复

使用道具 举报

发表于 2026-6-12 15:27 | 显示全部楼层
henvelleng 发表于 2026-6-12 12:28
有时候是改不好的。我举个极端例子,ai偷懒自己写了个正则表达式的脚本做批量替换,一下替换掉几千行代码 ...

ai犯错 -> 发现自己错了 -> 找办法补救
这是AI ReAct标准流程

收敛AI犯错可能,规范AI行为,提供Agent工作环境,为每个Agent制定标准和行为边界
这是标准harness工程

不做harness工程让AI瞎跑当然不行,现在谁家vibe coding都不是给个prompt就让它跑的,那是没工程经验当许愿机用呢
是你没有明白怎么从工程角度控制AI行为
回复

使用道具 举报

     
发表于 2026-6-12 15:58 来自手机 | 显示全部楼层
ykrank 发表于 2026-6-12 10:54
你们项目能比 chrome 和 Windows 复杂多少?

—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alp ...

真是越回复越莫名其妙
这坛子里的ai狂信徒和反智反ai的也差不多了

要么你用的不够多,要么你的项目太小了
opus4.7根据名字判断用途完全是家常便饭,你不告诉他去看代码他立刻就会偷懒

这是我原来的回复,我每天都用codex和claude,所有项目都是用ai来做的,用ai来做不代表ai就像你们现在嘴巴里形容的万能机器一样了
你写了一堆doc,然后发现这东西因为context忘记了然后开始骗你都是经常的事

—— 来自 OPPO PKU110, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-12 16:44 来自手机 | 显示全部楼层
本帖最后由 henvelleng 于 2026-6-12 16:51 编辑
Anarkia 发表于 2026-6-12 15:27
ai犯错 -> 发现自己错了 -> 找办法补救
这是AI ReAct标准流程

你还是没理解我说的话。

1 你定的规则对ai来说并不会完全有效,比如你禁止ai写脚本用正则表达式无脑替代,ai就一定会听话吗?并不会。

2 过了测试的代码就是正确的了吗?外行都知道不是。

3 让另一个ai去review ai的代码,跟没有review裸奔没有任何区别,我把这话放这儿,就不怕被喷。

哎,怎么感觉跟你们说话也有点在循环绕圈子了,而且我看到harness这类不明所以的词就很反感了,和元宇宙一个味儿。

—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-12 17:51 | 显示全部楼层
henvelleng 发表于 2026-6-12 16:44
你还是没理解我说的话。

1 你定的规则对ai来说并不会完全有效,比如你禁止ai写脚本用正则表达式无脑替代 ...

可以用hook自定义规则。。。
回复

使用道具 举报

     
发表于 2026-6-12 17:57 来自手机 | 显示全部楼层
本帖最后由 henvelleng 于 2026-6-12 17:59 编辑
hugosol 发表于 2026-6-12 17:51
可以用hook自定义规则。。。

其实无论通过什么途径定规则,最终都是通过prompt给到大模型的,大模型之所以会无视规则,本质是因为专注力的问题,上下文太大了,控制好上下文就能有效避免无视规则的问题,反正上下文现在在agent里也都看得到。

现在几乎所有的所谓ai使用技巧,都在以非常快的速度融合进各大agent中,甚至我看到有些agent已经有了节点控制,可以回滚到某次对话,省的自己用git备份和回溯

—— 来自 Xiaomi 23117RK66C, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-6-12 17:57 | 显示全部楼层
老黄说ai能让每个人都成为程序员,但我看你们这讨论,用ai写程序比古法写代码还复杂啊
回复

使用道具 举报

     
发表于 2026-6-12 18:13 | 显示全部楼层
ceruleancard 发表于 2026-6-12 17:57
老黄说ai能让每个人都成为程序员,但我看你们这讨论,用ai写程序比古法写代码还复杂啊 ...

这东西不是让每个人都成为程序员,而是要求每个人都是架构师,架构师可比程序员要求高出不知道多少了。当然你就是写着玩不管代码质量那确实每个人都是程序员。

ai并不能改变一个人写代码的能力,原本的强者更强,原本的屎更屎。
回复

使用道具 举报

     
发表于 2026-6-12 21:38 | 显示全部楼层
ceruleancard 发表于 2026-6-12 17:57
老黄说ai能让每个人都成为程序员,但我看你们这讨论,用ai写程序比古法写代码还复杂啊 ...

每个人都能当程序员
但那是当业余爱好

你要把这当门手艺, 你就得从程序员进化成架构师+pm 最少.
本质上搞好几个agent写代码.和你带七八个十来个人的小团队开发项目没区别, 该有的那个都跑不了
只不过llm写得快,而且没有活人的主观能动性,还经常性拉屎, 最重要的:关键时刻不能背锅

回复

使用道具 举报

     
发表于 2026-6-13 15:26 来自手机 | 显示全部楼层
StrangerJ 发表于 2026-6-12 15:58
真是越回复越莫名其妙
这坛子里的ai狂信徒和反智反ai的也差不多了

谁跟你说的万能机器你去找谁,不要乱扣帽子好吗

—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alpha
回复

使用道具 举报

     
发表于 2026-6-13 15:28 来自手机 | 显示全部楼层
StrangerJ 发表于 2026-6-12 15:58
真是越回复越莫名其妙
这坛子里的ai狂信徒和反智反ai的也差不多了

我针对的只是只有简单项目才能用 AI 的观点而已

—— 来自 OnePlus PJD110, Android 15, 鹅球 v4.0.100-alpha
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-24 11:01 , Processed in 0.104256 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表