vibe coding现在到底是个什么水平?
看网上一个个说的这么神,"不应该给我发工资,应该花钱买token"之类的,为啥代码补全也没做多好,作为java boy我很困惑啊 体验非常好,动嘴让别人干活,跟自己一个个字敲或者ctrlc,ctrlv能一样么?用了就回不去了 vibe一时爽, bug火葬场. 真正的自然语言编程,分割任务+高精度要求+做好品控就行不过补全没试过,不喜欢自己写的时候有干扰
vibe出来要是哪段看不明白还可以问到懂为止,现在简单的提取/转格式之类的事基本懒得自己写了,终于不用自己折腾复杂的正则了 都这么久了你不会还只用代码补全吧,简直是活化石了
openai现在内部几乎全部用codex了,a社就更不用说了 现在还要啥补全,不是写个注释然后一个tab吗 好用。
1)写了点小玩意,做成了安卓APP。(不过让它配环境是个大坑)
2)在原有论坛应用基础上加功能。大概半小时搞定我原本4小时的工作。
就算对我这种业余人事来说也很友好啊
订阅了google one 一个月一百多,日常咨询用gemini对话,代码用antigravity(能用opus),性价比不错。 vibecoding现在已经不是你写代码时候蹦出来一些编码建议啦
这年头都是你给它一个业务需求,它自己理解需求,阅读已有的项目代码,写prd,自己开发,自己测试
虽然出来的东西仍然可能会一坨屎 而且按量调用很贵
但是做小东西很他妈爽
—— 来自 鹅球 v3.5.99 从编程员转变为督工AI编程的管理人员了 出demo无敌,debug不行 你把ai想成你,你想成你特别烦的那个产品经理,产品经理丢一个软件需求规格说明书给你,要写成成品。
—— 来自 HONOR PGT-AN10, Android 16, 鹅球 v3.5.99-alpha 我这一个假期都在折腾一个事,就是让 minimax m2.5 这个水平的模型用我不熟悉的语言写一个我只有思路的复杂工程
工具折腾了一堆,提示词和会话搞了大量的,然后测试方法不停的调整,写出来的玩意勉强可用,这个就相当不错了
—— 来自 OnePlus PJD110, Android 16, 鹅球 v3.5.99 写正经的需要后续维护项目不能vibe,你会发现强如opus也会拉出屎山。
但是写一次性狗屎项目太爽了,什么屎山,我拉出来删了再拉就是了
— from Xiaomi 23127PN0CC, Android 16, S1 Next Goose v3.5.99 能用的模型是不是只有美国那几个大厂的模型,国产还不太行? 扭曲怪 发表于 2026-2-24 12:04
能用的模型是不是只有美国那几个大厂的模型,国产还不太行?
minimax还可以的,我有几个同事一直在用。他上下文长度和token数都还不错。新出的glm5据说也可以,不知泥潭有没有人试试 扭曲怪 发表于 2026-2-24 12:04
能用的模型是不是只有美国那几个大厂的模型,国产还不太行?
glm minimax kimi k2 thinking这几个做了代码特优处理的都不错,能有claude4.5 sonnet差不多水平
glm4.5前期便宜,导致4.6超卖严重,降智厉害,前段时间刚道歉 能把你写代码的劳动时间调整到看代码、debug上 扭曲怪 发表于 2026-2-24 12:04
能用的模型是不是只有美国那几个大厂的模型,国产还不太行?
现在的AI智能,不论国内外,写个100行左右需求明确的功能基本上都能一遍过,剩下的就是代码质量的问题了
问题在于用AI的人能不能把自己的任务拆解到这个颗粒度 tab补全和用agent是两个流派,反正我已经很久没有手写过代码了
现在的agent的编码能力大概就是一个新入职,基础好的程序员,相当好用
拉屎山的问题不在于ai模型的能力,而是软件工程管理的能力。类比的话就是让一个初级程序员每次清空记忆,自己读代码库来开发功能,那谁来写都是堆成屎山。用从上到下的架构设计 -> 技术分析 -> 及时重构清除技术债,这样还是可以很好的维持项目的质量。 现在都是前后端项目拉一个目录下,给需求让他写个plan,跟AI讨论确认下细节然后让他开写。
下一步就是agent,agent组成一个团队,写完的东西再让 QA AI review代码。
这个过程进化太快了。代码补全应该是两年前的老黄历了。我已经很久没自己写代码了。。 云卷花开 发表于 2026-2-24 12:03
我这一个假期都在折腾一个事,就是让 minimax m2.5 这个水平的模型用我不熟悉的语言写一个我只有思路的复杂 ...
minimax 我感觉是前端写的好,写好需求就能画出漂亮的网页再给出api,然后下载下来我用glm或者kimi写后端。
—— 来自 HONOR PGT-AN10, Android 16, 鹅球 v3.5.99-alpha 话说谭油现在还有活跃的vibe coding群组啥的吗 之前加的几个s1 ai相关的群最近都不太活跃了 还想找同好交流交流的
假期里做个小项目尝试了下(一开始用google的反重力,后面用claude code) 谈谈我个人的感受
代码能力比前几年那些单纯做文本补全的ai要强很多
这一方面是基础大模型能力提升带来的 不过我个人认为更主要的提升来源还是应用了一些成熟的流程编排、接入网络访问和运行系统命令这些外围能力 补充了用户提问中信息缺失还有模型训练数据信息滞后的问题
我用的比较谨慎 严格来说可能不算vibe coding,我会先说明好我要的应用分层架构,然后像具体的实体模型这些需要说的细致一点,要哪些字段这些都要说全,不然没有信息输入ai也只能瞎编了。业务逻辑编排可以粗略一些,说明好输入输出,剩下逻辑代码让它自己写,另外像使用一些公开的api或是sdk啥的,以前要自己费老大劲去找的资料,现在可以让ai自己干,确实舒服很多。
如果自己有开发能力,并且习惯测试驱动开发(TDD)的模式的话,让ai自己写实现和单元测试+集成测试,只要人工确认或者补充断言就行了,提效还是非常明显的。就算本身没有开发能力,只要做好把一个复杂的任务分解为多个步骤,明确每个步骤的输入输出,然后复核每一步的输出符合预期,这样出错的概率也会比较低。
说实话在用反重力的plan模式的时候,我觉得和我上班做TL干的活也差不多……架构设计,分解开发任务,任务的kick off,然后等代码跑通了做code review……
前端目前:等着抄大佬搭的框架->等着抄大佬写的skill
—— 来自 HUAWEI PLA-AL10, Android 12, 鹅球 v3.5.99 的确好用。特别是在接手新项目的时候。 glm5爱在细节上犯点小错,还得用kimi检查一遍
—— 来自 HONOR PTP-AN10, Android 16, 鹅球 v3.5.99 本帖最后由 亚瑟摩根 于 2026-2-24 14:42 编辑
爽啊
vibing code爽,一直vibing 一直爽
我现在是opus 4.6写方案,codex 5.3 xhigh执行
CodePlan国内哪家比较实惠? KIMI/智普/MINIMAX , 目前冲了个KIMI,分析了一个EXCEL表格7天用量就跑了1%,这7天冷却时间有点长呀 听说claude 可以支持棺材板语言了,于是我让他自己找了个简单的report generation程序,随机加上了两个小需求和自我语法检查,他目前完成的都可以,就差准备几条测试数据真跑出来看了,大概水平能对应一个3年内开发经验的棺材板语言使用者吧
但最大的问题是什么呢,我们公司不允许用,我是纯粹自己实验,而且我还没法用它做代码分析 很多场景基本都是人出思路让AI写,纯让AI出思路还不大行。
欢迎加入码农群:访问primeoj.com做题加群 和ai交流的时候不要偷懒,尽量说详细,包括你原来的代码思路、架构,必要时直接指定引导ai去阅读相关代码,能有效降低ai瞎改的概率。
还有就是如果ai改错了,还是应该用版本工具回退,不要偷懒,妄想让ai自己原路改回来?很容易改错,这地方吃过大亏。
还有就是,ai本身也是懒鬼 万恶淫猥手 发表于 2026-2-24 13:43
看我签名啊
仔细一看当初建群的那个帖子我还看过
不过确实有点尴尬 qq群tg群都无所谓 微信加群我有点抗拒
这个水平 所以现在AI敲代码哪家强 ?cursor vibe codex claude Windsurf 哪个更好点 seedees3 发表于 2026-2-24 18:02
所以现在AI敲代码哪家强 ?cursor vibe codex claude Windsurf 哪个更好点
codex 5.3 xhigh > opus 4.6 1m> gemini 3.1pro
亲自测试
但是审美这个排名是调过来的。
而且你上面说的cursor和windsurf都是ide