找回密码
 立即注册
搜索
楼主: 赤星ビスコ

[科技] AI编程交流

[复制链接]
发表于 2026-4-6 12:46 | 显示全部楼层
之前还是走trae这种集成ide来写代码,那个还要自己一点点检查,还会生成错误。现在cli普及后真的太爽了。装点skill和mcp,把需求文档写好然后他读取开plan模式检查一遍就可以干活了。

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-4-6 12:48 来自手机 | 显示全部楼层
现在一般用什么工作流比较好?我之前用的openspec,现在似乎superpowers那一套比较强?

—— 来自 vivo V2307A, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

发表于 2026-4-6 12:52 | 显示全部楼层
体感代码量到1w行左右就比较难处理了,处理成本激增上下文token都开始不够用。市面上的coding agent都试过,最后还是感觉pi coding agent最好,同样模型下效率最高
回复

使用道具 举报

发表于 2026-4-6 12:54 | 显示全部楼层
SmterC 发表于 2026-4-6 12:48
现在一般用什么工作流比较好?我之前用的openspec,现在似乎superpowers那一套比较强?

—— 来自 vivo V2 ...

还有个gsd。不过我感觉这些东西自己学到概念就行,真安装的话反而影响效率,简单任务也会走一大圈流程,我现在的做法是自己维护一个开发准则,在做计划和验收的阶段让模型判断是否符合准则,基本上够用了
回复

使用道具 举报

     
发表于 2026-4-6 12:54 | 显示全部楼层
本帖最后由 泰坦失足 于 2026-4-6 13:16 编辑

不断堕落和放权的一路.
我就用用Copilot tab, 函数里的每一步都要人工验证输出值是否符合预期. -> ChatGPT web能一口气吐出一个完整的py, 里面遵守我规定好了的Input, Output能直接用啊, 我就奉行OOD Design, 一两个Object用纯AI写写, 以后出错了好直接替换. ->什么叫做Coding Agent, 这玩意出错了怎么办-> 诶呀我去, Agent直接在CLI和IDE层面负责修改文件和自己运行自己检查, 我只要检查最终数据输出太爽了.-> 让AI自己负责从网上搜索相关数据集, 自己下载吧->AI你在这个会话里把结果输出为png图表, 我也懒得看原始csv输出了->"现在训练结果怎么样. "..."哦继续训练吧"(其实AI已经在某一步偷偷缩水了预期算法,并且在某个会话的角落只提了一小句, 你不问它不会再次说, 你一问诶呀真有问题)
回复

使用道具 举报

     
 楼主| 发表于 2026-4-6 12:56 | 显示全部楼层
SmterC 发表于 2026-4-6 12:48
现在一般用什么工作流比较好?我之前用的openspec,现在似乎superpowers那一套比较强?

—— 来自 vivo V2 ...

superpowers是一大套吧,我选了TDD和review的skill
其实我觉得让AI自己写skill和agent的md文件也差不太多,我是一边跑着一边让AI来改
回复

使用道具 举报

发表于 2026-4-6 13:04 | 显示全部楼层
rryu 发表于 2026-4-6 10:39
我觉得 Openclaw 类产品最大的价值就是让很多人体会到了管人的乐趣(或者痛苦) ...

Claude:脾气大(老是封号)能力强 工资高的大佬
GPT:有点啰嗦 审美掉线 干活不错的中坚
MiniMax:干活傻快 但是一遇到难题就要上面两个员工帮忙擦屁股的新员工
目前主要用的三个模型就是这感觉
我就是个屁都不懂只知道下命令的傻逼老板

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-4-6 13:09 | 显示全部楼层
和昨天那贴差不多,吹了一通,没有结果。
这波AI潮,相关公司确实下了不少本钱,用户确实多了。
但能不能来点过程和结果啊,自己测试的怎么样,大概遇到点什么问题怎么解决。

行文都是这工具,那工具,然后AI超好用。
这发帖也是AI写的吧。
回复

使用道具 举报

     
发表于 2026-4-6 13:27 来自手机 | 显示全部楼层
angelkos 发表于 2026-4-6 13:09
和昨天那贴差不多,吹了一通,没有结果。
这波AI潮,相关公司确实下了不少本钱,用户确实多了。
但能不能来 ...

这个你实际使用下就能比较好的体会到了。

编程时LLM的一个重要参数就是上下文大小,然后再看看聪明程度,再考虑下在上下文大小中的有效注意力范围能占多大。

然后就是产出的稳定性了,在上面几个参数影响下,工程的复杂度应该有个大概的上限,超过这个上限就会遇到现在的各种问题,技术债啊,屎山啊,频繁出bug忽略细节啊等等。

如果在上面上限以内,那产出的质量就非常可靠。

当然指挥AI的人思路清楚很重要,架构设计合理,能够提高前面那个上限。最简单的,项目的目录组织结构合理,起名合理,符合主流规范,LLM的搜索效率都会提升,也能减少屎山问题。

还有就是基于上下文的限制和AI写代码的工作逻辑,AI的重构能力容易翻车,比较简单的变量改名没问题,涉及到代码块的剪切复制,有依赖的目录改名啥的,最好自己来。

总结一下,AI编程的那个上限,其实就是注意力不足了。除非你把所有有关的代码都扔给他,他可以注意到,否则他在渐进式的搜集到一些内容以后,他就觉得够了,这个时候没有人为的提醒,就出现前面的各种问题了。
回复

使用道具 举报

     
发表于 2026-4-6 13:28 | 显示全部楼层
赤星ビスコ 发表于 2026-4-6 12:42
现在是11万行ts+7万行tsx
我觉得可能精心设计的代码可以有90分,ai写的够用有70分,当然ai代码写的越多, ...

要不你开源一下代码看看你做了个啥?口说无凭啊。我觉得你可能根本不理解10w行逻辑代码能做什么。

至于吹spec大可不必。spec要是能精确描述一个功能那还要代码干嘛?spec如果写长了,现在模型根本就遵循不了。如果你连这个都不知道,很难让人相信你真的用ai写了10w行代码。
回复

使用道具 举报

     
发表于 2026-4-6 13:28 | 显示全部楼层
本帖最后由 泰坦失足 于 2026-4-6 13:29 编辑

谈笑之间 AI帮我平地起高楼完成了一整个从数据收集到重新搭一套独立于我手搭正式版的非正式版AI训练框架, 切换到新特性的异步训练流水线, 再给出Score和后训练模型.
然后我看了汇报报告后只问了一句"tmd你这个里面的reward怎么除了结果奖励和格式奖励外, 哪来的中间过程奖励, 我都没有中间过程预期的真实值, 你哪来的判断用真实值"
回复

使用道具 举报

     
发表于 2026-4-6 13:33 | 显示全部楼层
泰坦失足 发表于 2026-4-6 12:54
不断堕落和放权的一路.
我就用用Copilot tab, 函数里的每一步都要人工验证输出值是否符合预期. -> ChatGPT  ...

不要再用tab了,早点换agent模式或者cc,确实效率有很大的提升。但和楼主在吹的是两回事
回复

使用道具 举报

     
 楼主| 发表于 2026-4-6 13:38 | 显示全部楼层
7uly 发表于 2026-4-6 13:28
要不你开源一下代码看看你做了个啥?口说无凭啊。我觉得你可能根本不理解10w行逻辑代码能做什么。

至于 ...

代码产权并不归我呀,我看了下占比最大的是审批流的代码

我说的重构当然不是靠spec来重构,而是可以通过把生成某段代码时候的spec要求存代码库里,能够回溯到某个功能为什么这么写。
回复

使用道具 举报

     
发表于 2026-4-6 13:53 | 显示全部楼层
还好吧,我用codex写了14w的代码感觉gpt5.4对于中小型项目的代码应对已经很轻松了
回复

使用道具 举报

     
发表于 2026-4-6 13:58 来自手机 | 显示全部楼层
spec和计划模式都用过,公司肯付费让我们站起来蹬确实爽。开发周期缩短了很多甚至有时上线压力去到了测试组和需求组。组里每个人的产出效果差异也大,几个老员工不爱学的用起来就在那说搞不了写的不对。那个opus4.6再吸一口的梗图我就觉得很贴合我

—— 来自 samsung SM-F9460, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-4-6 13:59 | 显示全部楼层
villsian 发表于 2026-4-6 13:27
这个你实际使用下就能比较好的体会到了。

编程时LLM的一个重要参数就是上下文大小,然后再看看聪明程度 ...

我还是挺乐观的, 就在3年前, GPT4初版才8K token, 32K版本的gpt4更是值得拿来新闻大吹特吹并且还不公开提供.
回复

使用道具 举报

     
发表于 2026-4-6 14:02 | 显示全部楼层
问个问题 你们都怎么压成本的
cursor里的claude和codex api都太贵了
一周就烧光了20刀…..我没钱都不敢用了
回复

使用道具 举报

     
发表于 2026-4-6 14:10 来自手机 | 显示全部楼层
すぴぱら 发表于 2026-4-6 14:02
问个问题 你们都怎么压成本的
cursor里的claude和codex api都太贵了
一周就烧光了20刀…..我没钱都不敢用了 ...

codex不是套餐吗?5小时限量多少一周限量多少那种。
回复

使用道具 举报

     
发表于 2026-4-6 14:40 | 显示全部楼层
villsian 发表于 2026-4-6 13:27
这个你实际使用下就能比较好的体会到了。

编程时LLM的一个重要参数就是上下文大小,然后再看看聪明程度 ...

那就是,大局自己把握,熟悉AI性能,了解其上限后,把需求尽量的分解后,让AI一块砖或者几块砖一次的来砌墙,这层完事儿了,再根据需求处理下一层。
那本质上还是得有相当的能力才行。

你这个好懂,楼主这个感觉是跳过的熟悉AI的过程,立马就熟练工了,很轻松的就掌握了AI和其它工具的特性。
标题是为交流,实质是流水账,很是空洞,下面的回复更是夸张,完全就像是打广告来的。
6楼的这个“我感觉AI的理解力和遵循规范的程度是优于真人的”要达到这个程序,那沟通过程必然是严谨的按着AI的喜好来的,所以不是广告才怪咧。
回复

使用道具 举报

发表于 2026-4-6 14:47 | 显示全部楼层
すぴぱら 发表于 2026-4-6 14:02
问个问题 你们都怎么压成本的
cursor里的claude和codex api都太贵了
一周就烧光了20刀…..我没钱都不敢用了 ...

别买token买plan,codex plus信用卡可以白嫖一周,或者闲鱼直接买,20左右
回复

使用道具 举报

     
发表于 2026-4-6 15:01 | 显示全部楼层
竞争力剩下架构能力和项目规划描述能力 我写了60多w行了 1月份到现在 ,合理规划的的话 没有啥大问题的 真有大问题,重新设计后重写业务也就一两天的事情 你这个代码量级的话
回复

使用道具 举报

     
发表于 2026-4-6 15:08 | 显示全部楼层
子虚乌有 发表于 2026-4-6 14:10
codex不是套餐吗?5小时限量多少一周限量多少那种。

我是在cursor里面的包月plan, 每月给20刀的token用光了就凉了,买不了chatgpt, 没支付方式
回复

使用道具 举报

     
发表于 2026-4-6 15:12 | 显示全部楼层
angelkos 发表于 2026-4-6 14:40
那就是,大局自己把握,熟悉AI性能,了解其上限后,把需求尽量的分解后,让AI一块砖或者几块砖一次的来砌 ...

学习成本又不高,装上工具付费然后实践就是了,有啥不懂开chatbox直接问,属于自带客服的工具了

还等着别人给你写教程,属于内心里就不想用
回复

使用道具 举报

     
发表于 2026-4-6 15:19 | 显示全部楼层
我感觉我干10年也写不了60w行代码,也没有业务需要写这么多代码,各位都是些什么大佬啊
回复

使用道具 举报

发表于 2026-4-6 15:30 | 显示全部楼层
ceruleancard 发表于 2026-4-6 15:19
我感觉我干10年也写不了60w行代码,也没有业务需要写这么多代码,各位都是些什么大佬啊 ...

比如说,找个开源项目,重写成RUST。写完了再找个。

自从有了AI,代码已经不值钱了。
回复

使用道具 举报

     
发表于 2026-4-6 15:33 来自手机 | 显示全部楼层
我有几个小工具是用ai写的,辅助办公。

一个信号源的上位机,直接把协议喂给minimax做的,这样就不用测试时一边操作电脑一边点仪器了。

两个表格填充工具,用于出报告填数据。

一个配置管理工具,用于公司软件一堆配置的修改。

前一个是Python和qt写的,后三个切到c#了。

工作之外做了些个人的玩意

一个提示词管理网站,用来做ai二次元图提示词。

bs架构,Python,目前想把后端切到c#

一个github pages博文的填写工具。方便规范格式写markdown。

都是些代码不长,主要调轮子的。

—— 来自 HONOR PGT-AN10, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-4-6 15:40 | 显示全部楼层
すぴぱら 发表于 2026-4-6 15:08
我是在cursor里面的包月plan, 每月给20刀的token用光了就凉了,买不了chatgpt, 没支付方式 ...

任务分级,没有必要什么都用最好的模型,auto模式也不错的,做些简单的任务,composer2也能胜任的。
回复

使用道具 举报

     
发表于 2026-4-6 15:50 | 显示全部楼层
ceruleancard 发表于 2026-4-6 15:19
我感觉我干10年也写不了60w行代码,也没有业务需要写这么多代码,各位都是些什么大佬啊 ...

找个自己想做的需求,当兴趣玩呗,就当自娱自乐好了,打磨和完善的过程那代码量不就上来了嘛。

页面一定要花哨酷炫,给我做10套动态主题!

业内同类软件的高级功能都有啥,我也要,给我实现!

业内同类软件的痛点是啥,我要解决它!
回复

使用道具 举报

     
发表于 2026-4-6 15:57 | 显示全部楼层
其实我一直在尝试把vibe coding全流程自动化和skill化
目前做下来从方案设计到代码实现,review,单元测试到cicd这些流程都是可以实现的
比较难以全自动skill实现的是自动生成test case(手工测试的那种),自动化接口测试和前端测试。并且自动根据测试结果反馈AI修复问题
不知道各位有没有好的方案。

还有我也想如何把vibe coding运用到团队合作的开发里面。
目前想到的是以AI生成的SPEC文档为准,团队整体review大的文档,然后再由相关人员自行根据总体SPEC文档作为context再生成负责部分的文档,再回来review进行开发。
回复

使用道具 举报

     
 楼主| 发表于 2026-4-6 16:10 | 显示全部楼层
angelkos 发表于 2026-4-6 14:40
那就是,大局自己把握,熟悉AI性能,了解其上限后,把需求尽量的分解后,让AI一块砖或者几块砖一次的来砌 ...

我本身从中学算起写了十多年的代码了,对AI工具的使用也是从22年的copilot开始,多用AI多体验AI也能知道AI能干什么样。我不知道自己有没有陷入知识的诅咒,至少我觉得现在AI能很大程度替代我过去的工作了

至于说的AI的理解力和规范的遵循,一方面来说,AI更“博学”,特别涉及业务方面,比起毕业生或者没接触过相关行业的来说更懂,不需要跟AI解释一下业务知识。另一方面,AI在偏离规范时候,有更快速和充分的反馈。我也是带过人的,资深的不了解,至少相当一部分初级程序员沟通起来并不如AI

回复

使用道具 举报

     
发表于 2026-4-6 16:20 | 显示全部楼层
すぴぱら 发表于 2026-4-6 15:08
我是在cursor里面的包月plan, 每月给20刀的token用光了就凉了,买不了chatgpt, 没支付方式 ...

gpt现在跟以前不一样了,以前得绑国外信用卡。
现在代充挺成熟的了。自己也可以通过苹果或者安卓市场充。
回复

使用道具 举报

     
 楼主| 发表于 2026-4-6 16:31 | 显示全部楼层
kaics 发表于 2026-4-6 15:57
其实我一直在尝试把vibe coding全流程自动化和skill化
目前做下来从方案设计到代码实现,review,单元测试 ...

我现在做法是先生成测试用例,人工review或者补充测试用例,再生成e2e,再跑e2e。
我是个web服务,e2e比较好搞,写代码的agent可以直接build然后调e2e来跑,得到结果

然后说的团队合作,我感觉本质是如何维护一套关于产品的真实信息源吧,我的做法PRD 转化成 BDD,这个BDD是产品行为的描述,脱离具体的技术实现。后续的开发spec和测试用例的生成都是基于BDD来做。然后每个新功能就更新整个BDD库
回复

使用道具 举报

     
发表于 2026-4-6 16:34 | 显示全部楼层
有一小段时间确实不review ai写的代码,后来发现绝对不行,ai犯的低级错误能把人牙都笑掉,而且调试过程中拉的屎,加的废弃代码,ai不会自己删掉也不做标记。

再有一个是很多代码是和硬件相关的,靠仿真调试达不到目的,而且仿真环境配起来烦得要死,还得实机调试,ai对竞态情况的分析能力几乎是0。

ai擅长写全新的功能,可以放飞自我,不擅长改代码,哪怕原代码是ai自己写的,也就是说ai适合写个粗糙的demo,不适合优化、调整
回复

使用道具 举报

     
发表于 2026-4-6 16:47 | 显示全部楼层
ceruleancard 发表于 2026-4-6 15:19
我感觉我干10年也写不了60w行代码,也没有业务需要写这么多代码,各位都是些什么大佬啊 ...

你用ai跑过稍微复杂一点的项目就知道,现在有了ai就相当于你作为产品经理在指挥ai干活
以前不敢想的做大型开源项目改造也有了可能
回复

使用道具 举报

发表于 2026-4-6 16:57 来自手机 | 显示全部楼层
mp5 发表于 2026-4-6 16:47
你用ai跑过稍微复杂一点的项目就知道,现在有了ai就相当于你作为产品经理在指挥ai干活
以前不敢想的做大 ...

它最大的缺点在于如果缺乏监督,它使用的具体解决方法可能放在整个项目的背景下不合适,例如采用一个新的过度设计的模式来解决比较简单的问题,或者不使用已有的代码来完成类似的工作——如果是熟悉此代码库的人类来编写的话可能会更优先考虑一定的重构来减少代码的复杂度而不是任意的新造轮子。
所以最后还是需要人类做好各种限制来把关,不然后面屎山高了连AI读起来可能都费劲。

当然,如果是做一些单独的,简单或者一次性的工作,那么直接让AI去写一个基本上都是又快又好。
很多以前绝对不想写的工具现在都可以轻松写出来了,在队内反而容易出现一种“需要协调你们这么多工具到底最后哪些应该进代码库给大家用”的问题。
回复

使用道具 举报

     
发表于 2026-4-6 17:00 | 显示全部楼层
mp5 发表于 2026-4-6 16:47
你用ai跑过稍微复杂一点的项目就知道,现在有了ai就相当于你作为产品经理在指挥ai干活
以前不敢想的做大 ...

光是用商业ai 不大保险,最好是自己弄一个专家系统来当赛博秘书。
回复

使用道具 举报

     
 楼主| 发表于 2026-4-6 17:03 | 显示全部楼层
henvelleng 发表于 2026-4-6 16:34
有一小段时间确实不review ai写的代码,后来发现绝对不行,ai犯的低级错误能把人牙都笑掉,而且调试过程中 ...

这个是行业领域不同的差异吧,对web来说反馈 -> 修改 -> 新反馈的流程很方便也快速,而技术债的累积在功能正确的前提下并不致命,可以到一定程度再一次性重构掉。

相比于以前,AI差不多是3倍速度写功能,5倍的速度积累技术债吧
回复

使用道具 举报

发表于 2026-4-6 17:18 | 显示全部楼层
henvelleng 发表于 2026-4-6 16:34
有一小段时间确实不review ai写的代码,后来发现绝对不行,ai犯的低级错误能把人牙都笑掉,而且调试过程中 ...

用AI debug有时候比写代码更强,设个断点,当场瞬间读取各种变量堆栈内存,找到问题。

回复

使用道具 举报

     
发表于 2026-4-6 17:19 | 显示全部楼层
赤星ビスコ 发表于 2026-4-6 17:03
这个是行业领域不同的差异吧,对web来说反馈 -> 修改 -> 新反馈的流程很方便也快速,而技术债的累积在功 ...

web的话也遇到过问题,比如我ui喜欢用blazor,改一个样式,如果我直接给ai下命令,说出具体的样式,那么ai的第一反应不是用当前的组件库现成样式,而是用css覆盖,非常无语。你必须非常具体地告诉ai,用组件库里叫某某某的具体组件,或是其他地方类似的组件。

本质上,造成这种滑稽现象的根本原因是ai是瞎子,它看不到当前页面的实际样式,只能通过代码来分析,而ai本身是非常喜欢偷懒的,觉得费那劲儿干啥,我直接给你覆盖了完事。这就是ai coding的一个缩影,它在修改代码的时候,第一选择不会尝试用正规途径去做,而是怎么省力怎么来。

当然,ai不仅是瞎子,而且也是聋子,没有5感,无法进行任何实机调试
回复

使用道具 举报

     
 楼主| 发表于 2026-4-6 17:23 | 显示全部楼层
Wiksy 发表于 2026-4-6 16:57
它最大的缺点在于如果缺乏监督,它使用的具体解决方法可能放在整个项目的背景下不合适,例如采用一个新的 ...

你说的倒还好,还能有个确定的模式,代码库里重复的模式抽象出来,这种让AI来干也能干。

更复杂一点比如把原来混在一起的状态派生和副作用抽离,这种就完全依赖于人的经验来设计了,AI干也干不好。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-21 05:58 , Processed in 0.161777 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表