vibe coding现在到底是个什么水平？

扭曲怪 发表于 2026-2-24 11:20

看网上一个个说的这么神，"不应该给我发工资，应该花钱买token"之类的，为啥代码补全也没做多好，作为java boy我很困惑啊

废柴失格 发表于 2026-2-24 11:24

体验非常好，动嘴让别人干活，跟自己一个个字敲或者ctrlc,ctrlv能一样么？用了就回不去了

万恶淫猥手 发表于 2026-2-24 11:25

thq 发表于 2026-2-24 11:25

vibe一时爽, bug火葬场.

tiro_finale 发表于 2026-2-24 11:35

真正的自然语言编程，分割任务+高精度要求+做好品控就行
不过补全没试过，不喜欢自己写的时候有干扰
vibe出来要是哪段看不明白还可以问到懂为止，现在简单的提取/转格式之类的事基本懒得自己写了，终于不用自己折腾复杂的正则了

StarForceTi 发表于 2026-2-24 11:42

都这么久了你不会还只用代码补全吧，简直是活化石了

openai现在内部几乎全部用codex了，a社就更不用说了

格林达姆 发表于 2026-2-24 11:44

现在还要啥补全，不是写个注释然后一个tab吗

fat 发表于 2026-2-24 11:48

好用。

1）写了点小玩意，做成了安卓APP。（不过让它配环境是个大坑）
2）在原有论坛应用基础上加功能。大概半小时搞定我原本4小时的工作。
就算对我这种业余人事来说也很友好啊

订阅了google one 一个月一百多，日常咨询用gemini对话，代码用antigravity（能用opus），性价比不错。

库德里尔 发表于 2026-2-24 11:51

vibecoding现在已经不是你写代码时候蹦出来一些编码建议啦
这年头都是你给它一个业务需求，它自己理解需求，阅读已有的项目代码，写prd，自己开发，自己测试
虽然出来的东西仍然可能会一坨屎而且按量调用很贵

但是做小东西很他妈爽

—— 来自鹅球 v3.5.99

Nanachi 发表于 2026-2-24 11:55

从编程员转变为督工AI编程的管理人员了

Jet.Black 发表于 2026-2-24 11:58

出demo无敌，debug不行

diohanmilton 发表于 2026-2-24 12:01

你把ai想成你，你想成你特别烦的那个产品经理，产品经理丢一个软件需求规格说明书给你，要写成成品。

—— 来自 HONOR PGT-AN10, Android 16, 鹅球 v3.5.99-alpha

云卷花开 发表于 2026-2-24 12:03

我这一个假期都在折腾一个事，就是让 minimax m2.5 这个水平的模型用我不熟悉的语言写一个我只有思路的复杂工程
工具折腾了一堆，提示词和会话搞了大量的，然后测试方法不停的调整，写出来的玩意勉强可用，这个就相当不错了

—— 来自 OnePlus PJD110, Android 16, 鹅球 v3.5.99

Azcarlo 发表于 2026-2-24 12:04

写正经的需要后续维护项目不能vibe，你会发现强如opus也会拉出屎山。
但是写一次性狗屎项目太爽了，什么屎山，我拉出来删了再拉就是了

— from Xiaomi 23127PN0CC, Android 16, S1 Next Goose v3.5.99

扭曲怪 发表于 2026-2-24 12:04

能用的模型是不是只有美国那几个大厂的模型，国产还不太行？

kraxia 发表于 2026-2-24 12:07

扭曲怪发表于 2026-2-24 12:04
能用的模型是不是只有美国那几个大厂的模型，国产还不太行？

minimax还可以的，我有几个同事一直在用。他上下文长度和token数都还不错。新出的glm5据说也可以，不知泥潭有没有人试试

万恶淫猥手 发表于 2026-2-24 12:10

Lorraine_Kinney 发表于 2026-2-24 12:10

扭曲怪发表于 2026-2-24 12:04
能用的模型是不是只有美国那几个大厂的模型，国产还不太行？

glm minimax kimi k2 thinking这几个做了代码特优处理的都不错，能有claude4.5 sonnet差不多水平
glm4.5前期便宜，导致4.6超卖严重，降智厉害，前段时间刚道歉

LilithMardin 发表于 2026-2-24 12:22

能把你写代码的劳动时间调整到看代码、debug上

Processed 发表于 2026-2-24 12:42

扭曲怪发表于 2026-2-24 12:04
能用的模型是不是只有美国那几个大厂的模型，国产还不太行？

现在的AI智能，不论国内外，写个100行左右需求明确的功能基本上都能一遍过，剩下的就是代码质量的问题了

问题在于用AI的人能不能把自己的任务拆解到这个颗粒度

赤星ビスコ 发表于 2026-2-24 12:46

tab补全和用agent是两个流派，反正我已经很久没有手写过代码了

现在的agent的编码能力大概就是一个新入职，基础好的程序员，相当好用

拉屎山的问题不在于ai模型的能力，而是软件工程管理的能力。类比的话就是让一个初级程序员每次清空记忆，自己读代码库来开发功能，那谁来写都是堆成屎山。用从上到下的架构设计 -> 技术分析 -> 及时重构清除技术债，这样还是可以很好的维持项目的质量。

randomjo 发表于 2026-2-24 12:54

现在都是前后端项目拉一个目录下，给需求让他写个plan，跟AI讨论确认下细节然后让他开写。
下一步就是agent，agent组成一个团队，写完的东西再让 QA AI review代码。
这个过程进化太快了。代码补全应该是两年前的老黄历了。我已经很久没自己写代码了。。

diohanmilton 发表于 2026-2-24 13:02

云卷花开发表于 2026-2-24 12:03
我这一个假期都在折腾一个事，就是让 minimax m2.5 这个水平的模型用我不熟悉的语言写一个我只有思路的复杂 ...

minimax 我感觉是前端写的好，写好需求就能画出漂亮的网页再给出api，然后下载下来我用glm或者kimi写后端。

—— 来自 HONOR PGT-AN10, Android 16, 鹅球 v3.5.99-alpha

紧那罗 发表于 2026-2-24 13:07

话说谭油现在还有活跃的vibe coding群组啥的吗之前加的几个s1 ai相关的群最近都不太活跃了还想找同好交流交流的

假期里做个小项目尝试了下（一开始用google的反重力，后面用claude code）谈谈我个人的感受
代码能力比前几年那些单纯做文本补全的ai要强很多
这一方面是基础大模型能力提升带来的不过我个人认为更主要的提升来源还是应用了一些成熟的流程编排、接入网络访问和运行系统命令这些外围能力补充了用户提问中信息缺失还有模型训练数据信息滞后的问题

我用的比较谨慎严格来说可能不算vibe coding，我会先说明好我要的应用分层架构，然后像具体的实体模型这些需要说的细致一点，要哪些字段这些都要说全，不然没有信息输入ai也只能瞎编了。业务逻辑编排可以粗略一些，说明好输入输出，剩下逻辑代码让它自己写，另外像使用一些公开的api或是sdk啥的，以前要自己费老大劲去找的资料，现在可以让ai自己干，确实舒服很多。

如果自己有开发能力，并且习惯测试驱动开发（TDD）的模式的话，让ai自己写实现和单元测试+集成测试，只要人工确认或者补充断言就行了，提效还是非常明显的。就算本身没有开发能力，只要做好把一个复杂的任务分解为多个步骤，明确每个步骤的输入输出，然后复核每一步的输出符合预期，这样出错的概率也会比较低。

说实话在用反重力的plan模式的时候，我觉得和我上班做TL干的活也差不多……架构设计，分解开发任务，任务的kick off，然后等代码跑通了做code review……

a4ac7 发表于 2026-2-24 13:20

前端目前：等着抄大佬搭的框架->等着抄大佬写的skill

—— 来自 HUAWEI PLA-AL10, Android 12, 鹅球 v3.5.99

万恶淫猥手 发表于 2026-2-24 13:43

Prolun 发表于 2026-2-24 13:59

的确好用。特别是在接手新项目的时候。

calmer 发表于 2026-2-24 14:37

glm5爱在细节上犯点小错，还得用kimi检查一遍

—— 来自 HONOR PTP-AN10, Android 16, 鹅球 v3.5.99

亚瑟摩根 发表于 2026-2-24 14:41

本帖最后由亚瑟摩根于 2026-2-24 14:42 编辑

爽啊

vibing code爽，一直vibing 一直爽

我现在是opus 4.6写方案，codex 5.3 xhigh执行

lyzsuper 发表于 2026-2-24 14:42

CodePlan国内哪家比较实惠? KIMI/智普/MINIMAX , 目前冲了个KIMI,分析了一个EXCEL表格7天用量就跑了1%,这7天冷却时间有点长呀

sliencer 发表于 2026-2-24 14:56

听说claude 可以支持棺材板语言了，于是我让他自己找了个简单的report generation程序，随机加上了两个小需求和自我语法检查，他目前完成的都可以，就差准备几条测试数据真跑出来看了，大概水平能对应一个3年内开发经验的棺材板语言使用者吧
但最大的问题是什么呢，我们公司不允许用，我是纯粹自己实验，而且我还没法用它做代码分析

pyx 发表于 2026-2-24 15:28

很多场景基本都是人出思路让AI写，纯让AI出思路还不大行。

欢迎加入码农群：访问primeoj.com做题加群

zack2012 发表于 2026-2-24 16:42

henvelleng 发表于 2026-2-24 16:51

和ai交流的时候不要偷懒，尽量说详细，包括你原来的代码思路、架构，必要时直接指定引导ai去阅读相关代码，能有效降低ai瞎改的概率。

还有就是如果ai改错了，还是应该用版本工具回退，不要偷懒，妄想让ai自己原路改回来？很容易改错，这地方吃过大亏。

还有就是，ai本身也是懒鬼

万恶淫猥手 发表于 2026-2-24 17:39

紧那罗 发表于 2026-2-24 17:47

万恶淫猥手发表于 2026-2-24 13:43
看我签名啊

仔细一看当初建群的那个帖子我还看过
不过确实有点尴尬 qq群tg群都无所谓微信加群我有点抗拒

万恶淫猥手 发表于 2026-2-24 17:56

无攻不受鹿 发表于 2026-2-24 17:58

这个水平

seedees3 发表于 2026-2-24 18:02

所以现在AI敲代码哪家强？cursor vibe codex claude Windsurf 哪个更好点

亚瑟摩根 发表于 2026-2-24 18:34

seedees3 发表于 2026-2-24 18:02
所以现在AI敲代码哪家强？cursor vibe codex claude Windsurf 哪个更好点

codex 5.3 xhigh > opus 4.6 1m> gemini 3.1pro

亲自测试

但是审美这个排名是调过来的。

而且你上面说的cursor和windsurf都是ide

页: [1] 2 3

Stage1st's Archiver

vibe coding现在到底是个什么水平？