找回密码
 立即注册
搜索
楼主: omnitoken

[科技] claude opus 4.6更新了,还整了个大活

[复制链接]
     
发表于 2026-2-6 13:25 | 显示全部楼层
一觉起来 前端又失业了 😭

论坛助手,iPhone
回复

使用道具 举报

头像被屏蔽
发表于 2026-2-6 13:28 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-2-6 13:31 | 显示全部楼层
比上次哪个公司写的浏览器烂活强点, 不过c编译器也比浏览器简单很多
回复

使用道具 举报

     
发表于 2026-2-6 13:38 | 显示全部楼层
写个能运行的c编译器本来也不复杂,复杂的是中后端的优化。啥时候AI 直接从需求到汇编去掉中间商赚差价。

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-2-6 13:44 | 显示全部楼层
larry1 发表于 2026-2-6 12:55
最近在用claude4.5写代码。
感觉还是得一部分一部分。让他写。然后拼起来。
而且也经常搞不好。然后只能重 ...

对于现有的比较复杂的东西,最好还是想好要怎么改,让AI来执行
回复

使用道具 举报

     
发表于 2026-2-6 13:47 | 显示全部楼层
xuanwu_lei 发表于 2026-2-6 13:14
说起agent swarm我就来气

必须在提示词里主动去要某个方面的agent,不然就只给你派四个

agent swarm是动态分配的,要在prompt里面明确一点他就会给你多了。
可以指定数量比如16个,
也可以指定划分方向告诉他哪个方面用多少个(minimal),不过对一般任务的效果影响不大就是了
回复

使用道具 举报

     
发表于 2026-2-6 14:20 | 显示全部楼层
omnitoken 发表于 2026-2-6 12:49
那个适用gcc的输出做指导,不是直接抄gcc源码

—— 来自 鹅球 v3.3.96

说得好像他训练语料里没有开源代码似的。

本质和cursor前一阵子搞的那个什么自主写100w行代码的浏览器是同一类型的烂活
回复

使用道具 举报

     
发表于 2026-2-6 14:33 来自手机 | 显示全部楼层
我不太懂,ai agent也可以算clean room开发吗?
回复

使用道具 举报

     
发表于 2026-2-6 14:59 来自手机 | 显示全部楼层
热带鱼鱼 发表于 2026-2-6 13:28
最近我在高强度使用cursor里那些ai,感觉ai的边界还是挺明显的,今天写一个cuda算子,想让gemini3 pro帮我 ...

现在应该最好还是 Claude 和 gpt

—— 来自 Xiaomi 24072PX77C, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-2-6 15:15 | 显示全部楼层
最近习惯把一个项目先切片分解,一个个小功能让AI跑,最后自己拼
回复

使用道具 举报

头像被屏蔽
发表于 2026-2-6 15:17 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
发表于 2026-2-6 18:30 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-2-6 20:42 | 显示全部楼层
热带鱼鱼 发表于 2026-2-6 18:30
直接生成汇编太傻了,没办法适配不同平台,而且汇编代码的长度太长了,对上下文压力极大。最适合ai的语言 ...

生成LLVM IR呀

—— 来自 S1Fun
回复

使用道具 举报

发表于 2026-2-6 22:06 来自手机 | 显示全部楼层
常陆茉子prpr 发表于 2026-2-6 12:27
换语言重写的活我还真在干,至少有几十万行量级的重写

目前用下来无论是gemini flash/pro还是claude opus/ ...

商用的上下文限制和他们自己开的权限不一样吧,这种肯定资源算力喂到饱
回复

使用道具 举报

发表于 2026-2-6 22:08 来自手机 | 显示全部楼层
热带鱼鱼 发表于 2026-2-6 18:30
直接生成汇编太傻了,没办法适配不同平台,而且汇编代码的长度太长了,对上下文压力极大。最适合ai的语言 ...

都有llm了还要什么python语法糖
回复

使用道具 举报

头像被屏蔽
发表于 2026-2-6 22:25 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2026-2-6 23:11 来自手机 | 显示全部楼层
已经有人写过的东西很难么?对于人来说确实很难,但但是对于ai来说不要太容易吧。


— from samsung SM-S911U1, Android 16, S1 Next Goose v3.5.99
回复

使用道具 举报

     
发表于 2026-2-6 23:12 来自手机 | 显示全部楼层
隔壁pc数码区刚用这个把c盘系统搞炸了,要不要再叫他使用 4.6 的 重新试一试?
回复

使用道具 举报

     
发表于 2026-2-6 23:26 来自手机 | 显示全部楼层
Claude Opus 4.6玩小丑牌
https://stage1st.com/2b/thread-2274148-0-1.html

给作者反馈了个崩溃问题,看样子是修好了
现在能稳定打到ante 6+,有点屌

—— 来自 Xiaomi 25060RK16C, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-2-6 23:39 | 显示全部楼层
虽然用rust重写C编译器不算是个好点子,但这个重点不在做了什么,而是尝试用超多Agent相互协作 + 大于一周无人干预的超长运行下,哪怕是翻译成rust➕编译,最终也能run起来一个复杂项目。基本上算是把这条道路指名了可以走,后面就看怎么优化了。

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-2-6 23:46 来自手机 | 显示全部楼层
我都是把项目切片到独立文件夹让他一点点研究,一整个大项目包寄的

—— 来自 samsung SM-F9460, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

发表于 2026-2-7 07:09 来自手机 | 显示全部楼层
能直接把cuda移到amd卡上吗
回复

使用道具 举报

发表于 2026-2-7 07:37 来自手机 | 显示全部楼层
这样搞 安全漏洞怎么说?  这不完全是盲盒, 有没有漏洞或bug不就是天知道了吗
回复

使用道具 举报

发表于 2026-2-7 08:10 | 显示全部楼层
有最终代码放出来么,想看看写成什么样子。
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-2-7 09:05 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-2-7 11:00 | 显示全部楼层
Jet.Black 发表于 2026-2-7 08:10
有最终代码放出来么,想看看写成什么样子。

有放在github上 在blog上有提到

https://www.anthropic.com/engineering/building-c-compiler

但看完blog会发现,其实这个blog生动地说明了为什么做一个大型项目离不开人
回复

使用道具 举报

     
发表于 2026-2-7 11:07 | 显示全部楼层
4.6比4.5 的纯代码能力提升其实不大,群蜂也不是适用于所有的任务。
谷歌也写过论文,不是sub越多越好,要看具体任务和架构,是不是要并发
另外tokens消耗也非常大。
噱头的1M上下文其实也只给1企业和 tier4,cc用户也用不到(https://mp.weixin.qq.com/s/QtdvXTLDPSCUQzJqPmSWcQ

我个人反而推荐codex,这次5 3 codex提示非常大,和5.2完全2个产品,思考极速,思考链中文,和cc体验差距不大了
而且奥特曼这次大方 所有用户usage 2倍 2个月,codex又是比较节约的模型
回复

使用道具 举报

头像被屏蔽
发表于 2026-2-7 15:00 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-2-7 15:03 来自手机 | 显示全部楼层
热带鱼鱼 发表于 2026-2-7 15:00
Cursor有上5.3codex吗?好像还用的是5.2

—— 来自 Xiaomi 22101317C, Android 14, 鹅球 v3.5.99 ...

给第三方的api好像还没开放?
不过你可以直接codex试试,这次免费用户和go用户(看广告的那个)也有codex额度
回复

使用道具 举报

发表于 2026-2-8 00:41 来自手机 | 显示全部楼层
个人体验4.6就是4.5换皮,当天4.5强行降智。看版本号infer吧(内部原话
回复

使用道具 举报

     
发表于 2026-2-8 04:14 | 显示全部楼层
malisa 发表于 2026-2-7 11:07
4.6比4.5 的纯代码能力提升其实不大,群蜂也不是适用于所有的任务。
谷歌也写过论文,不是sub越多越好,要 ...

我感觉新的 codex 思维链的思路也更好了,让它查 bug 的时候感觉整体上时间缩短到了原来的 1/3
回复

使用道具 举报

头像被屏蔽
发表于 2026-2-8 05:03 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-2-8 08:28 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-2-8 08:58 | 显示全部楼层
热带鱼鱼 发表于 2026-2-6 13:28
最近我在高强度使用cursor里那些ai,感觉ai的边界还是挺明显的,今天写一个cuda算子,想让gemini3 pro帮我 ...

我搞UE和V8也是这个样子,全是幻想出来的API,编译都过不了。
你自己用搜索引擎搜,能搜出很多相关内容的AI就能搞定,搜不出来的AI就抓瞎,AI本质还是搬运工,没数据AI也无能为力,你硬要他搞,只能给你现编了。
回复

使用道具 举报

     
发表于 2026-2-8 09:00 | 显示全部楼层
codex可以在那些IDE里用?除了vscode还有吗
回复

使用道具 举报

     
发表于 2026-2-8 09:33 | 显示全部楼层
osborn 发表于 2026-2-8 09:00
codex可以在那些IDE里用?除了vscode还有吗

mac的话比较多,桌面端 cli
windows cli(好像要wsl?) vscode等ide 桌面端快要出了
回复

使用道具 举报

发表于 2026-2-8 10:18 来自手机 | 显示全部楼层
热带鱼鱼 发表于 2026-2-6 13:28
最近我在高强度使用cursor里那些ai,感觉ai的边界还是挺明显的,今天写一个cuda算子,想让gemini3 pro帮我 ...

个人经验这个要多ai互搏,然后自己引导设计。复杂一点的目标不明确的就是容易错。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-21 05:57 , Processed in 0.170936 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表