找回密码
 立即注册
搜索
查看: 2827|回复: 34

[软件] 阿里开源Qwen3-Coder代码模型及Qwen Code编程工具,4800亿参数性能出色

[复制链接]
发表于 2025-7-23 16:15 来自手机 | 显示全部楼层 |阅读模式
阿里巴巴Qwen团队于7月23日开源了最新一代旗舰编程模型Qwen3-Coder-480B-A35B-Instruct。该模型拥有4800亿参数,激活参数为350亿,原生支持256K上下文,还可通过外推扩展至100万上下文(输入),最大输出为6.5万token。在基准测试中,Qwen3-Coder在编程和智能体任务上成绩斐然,于Agentic Coding(智能体编程)、Agentic Browser-Use(智能体浏览器使用)和Agentic Tool-Use(智能体工具调用)三类任务中获得开源SOTA,超越Kimi K2、DeepSeek V3等开源模型以及GPT-4.1等闭源模型,能与以编程能力著称的Claude Sonnet 4相抗衡。同时,Qwen团队还开源了由Gemini Code分叉而来的智能体编程命令行工具————Qwen Code,该工具适配了定制提示和函数调用协议,可充分释放Qwen3-Coder在智能体编程任务上的能力。
回复

使用道具 举报

     
发表于 2025-7-23 16:41 | 显示全部楼层
好,期待sakura跟进

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2025-7-23 16:58 | 显示全部楼层
能在copilot里调用吗
回复

使用道具 举报

     
发表于 2025-7-23 17:01 | 显示全部楼层
马大善人能免费开放吗? Qwen之前那个IDE插件我用了下就卸载了. CoPilot用光了高级请求额度后, GPT4.1和Sonnet一比和智障似得
回复

使用道具 举报

     
发表于 2025-7-23 17:05 来自手机 | 显示全部楼层
480b,普通人跑不动

----发送自 samsung SM-S9180,Android 15
回复

使用道具 举报

     
发表于 2025-7-23 17:10 来自手机 | 显示全部楼层
480B,是不是就是需要480GB显存空间啊
回复

使用道具 举报

     
发表于 2025-7-23 17:17 | 显示全部楼层
有300GB就能跑Q4量化的版本
回复

使用道具 举报

     
发表于 2025-7-23 17:24 来自手机 | 显示全部楼层
GJRstone 发表于 2025-7-23 17:10
480B,是不是就是需要480GB显存空间啊

不是 但哪怕是最差的量化后100g还是要的
不量化吧480g还不一定够

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2025-7-23 17:31 | 显示全部楼层
利好512g的mac studio?
回复

使用道具 举报

     
发表于 2025-7-23 18:06 | 显示全部楼层

https://github.com/QwenLM/qwen-code/issues/56
https://github.com/QwenLM/qwen-code/issues/51


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

发表于 2025-7-23 18:18 | 显示全部楼层
小野賢章 发表于 2025-7-23 18:06
https://github.com/QwenLM/qwen-code/issues/56
https://github.com/QwenLM/qwen-code/issues/51

啊这,免费试用不免费?
回复

使用道具 举报

     
发表于 2025-7-23 18:33 | 显示全部楼层
本来想试试的,但是安装下来,配置 api 的时候直接报错了,不过貌似应修复了,但是看到 这些 issues,还是算了,白嫖的 gemini cli 不香吗

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-7-23 18:34 | 显示全部楼层
而且代码里面的 gemini 的痕迹很太深了,侧面说明这东西出得很干,还是先等等吧
回复

使用道具 举报

 楼主| 发表于 2025-7-23 18:40 来自手机 | 显示全部楼层
moekyo 发表于 2025-7-23 18:34
而且代码里面的 gemini 的痕迹很太深了,侧面说明这东西出得很干,还是先等等吧 ...

qwen3底模还是很不错的,看了评测,0分异常率非常高,可能赶着上架没做优化
回复

使用道具 举报

     
发表于 2025-7-23 18:46 | 显示全部楼层
泰坦失足 发表于 2025-7-23 17:01
马大善人能免费开放吗? Qwen之前那个IDE插件我用了下就卸载了. CoPilot用光了高级请求额度后, GPT4.1和Sonn ...

480B,还是生产工具,肯定是有钱的爷this way plz呀
回复

使用道具 举报

     
发表于 2025-7-23 18:55 | 显示全部楼层
德尔惠净水器 发表于 2025-7-23 18:40
qwen3底模还是很不错的,看了评测,0分异常率非常高,可能赶着上架没做优化 ...

我说的不是模型本身,而是那个命令行工具,虽然人家 gemini cli 是开源的,但是现在直接 copy 太糙了,起码整个全局替换啊,截图是我遇到的报错,类似地方还不少,之后很容易被人拿去做文章的

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

发表于 2025-7-23 20:09 来自手机 | 显示全部楼层
那么哪里有api供应商呢

—— 来自 OPPO PKU110, Android 15, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2025-7-23 20:38 | 显示全部楼层
fat 发表于 2025-7-23 20:09
那么哪里有api供应商呢

—— 来自 OPPO PKU110, Android 15, 鹅球 v3.5.99-alpha

阿里云就有,不过很贵,梯度收费,输入token超过256k后收费是200块钱1M token,用cline写个小项目很快就会到了,看了下晚上还打五折了
回复

使用道具 举报

发表于 2025-7-23 20:41 | 显示全部楼层
kokoromimi 发表于 2025-7-23 20:38
阿里云就有,不过很贵,梯度收费,输入token超过256k后收费是200块钱1M token,用cline写个小项目很快就 ...

那是有点贵了……
回复

使用道具 举报

发表于 2025-7-23 21:02 来自手机 | 显示全部楼层
moekyo 发表于 2025-7-23 18:55
我说的不是模型本身,而是那个命令行工具,虽然人家 gemini cli 是开源的,但是现在直接 copy 太糙了,起 ...

发布时直接说fork的gemini cli啊,这有啥

—— 来自 鹅球 v3.4.97
回复

使用道具 举报

     
发表于 2025-7-23 21:46 | 显示全部楼层
overflowal 发表于 2025-7-23 21:02
发布时直接说fork的gemini cli啊,这有啥

—— 来自 鹅球 v3.4.97

你难道没见过那些拿着国产模型输出“我是 ChatGPT”来大肆宣扬抄袭剽窃的人吗,主要是这个发布太急了,明明可以更好的,虽然能理解追上这波命令行 agent 的风潮对宣传有大加分
回复

使用道具 举报

发表于 2025-7-23 23:31 | 显示全部楼层
就一个cli没必要造轮子啊,chat的api不也都是oai的api吗。我不过我看评论token消耗有异常,不知道什么情况。

回复

使用道具 举报

     
发表于 2025-7-24 08:45 | 显示全部楼层
不敢用,都说tokens消耗太快,已经超过claude code了
感觉是走力大飞砖的感觉

不过个人真的很想支持一下,一直被反华公司卡着脖子真的很难受
回复

使用道具 举报

     
发表于 2025-7-24 09:17 | 显示全部楼层
tokens比DS激进N倍,本地跑不动,买API又太贵
回复

使用道具 举报

     
发表于 2025-7-24 11:43 来自手机 | 显示全部楼层
阿里云上qwen3 coder的商业化版本(plus)怎么比开源版本还便宜
回复

使用道具 举报

     
发表于 2025-7-24 12:03 | 显示全部楼层
本帖最后由 kokoromimi 于 2025-7-24 12:04 编辑
astkaasa 发表于 2025-7-24 11:43
阿里云上qwen3 coder的商业化版本(plus)怎么比开源版本还便宜

没有更便宜吧,都是梯度,qwen3-coder-plus-2025-07-22梯度200R/1M token,qwen3-coder-480b-a35b-instruct梯度最大60R/1M token
消耗token很厉害,很快就会到最高收费梯度的,昨天直接给我干没送的1M  token还扣费十多块钱
回复

使用道具 举报

发表于 2025-7-24 14:39 | 显示全部楼层
那么具体效果感受如何?吞token太厉害了,还不敢真的导项目

回复

使用道具 举报

     
发表于 2025-7-24 16:24 | 显示全部楼层
"https://openrouter.ai/qwen/qwen3-coder:free"
牛逼这也free.
回复

使用道具 举报

     
发表于 2025-7-24 16:39 来自手机 | 显示全部楼层
本帖最后由 astkaasa 于 2025-7-24 16:40 编辑
泰坦失足 发表于 2025-7-24 16:24
"https://openrouter.ai/qwen/qwen3-coder:free"
牛逼这也free.

这行字是忘删了还是什么意思
Pricing for the Alibaba endpoints varies by context length. Once a request is greater than 128k input tokens, the higher pricing is used.
回复

使用道具 举报

     
发表于 2025-7-24 16:58 来自手机 | 显示全部楼层
哦,懂了,openrouter的free有每天限额,不充钱是50,充10刀是1000
回复

使用道具 举报

     
发表于 2025-7-25 13:26 来自手机 | 显示全部楼层
看下来效果好像不大好啊,而且疑似刷榜https://www.zhihu.com/question/1931014634283967287/answer/1931303843557282471?share_code=FCrnnupqXwfo&utm_psn=1932069139289182866

— from Xiaomi 23127PN0CC, Android 15, S1 Next Goose v3.5.99
回复

使用道具 举报

     
发表于 2025-7-25 14:16 | 显示全部楼层
Azcarlo 发表于 2025-7-25 13:26
看下来效果好像不大好啊,而且疑似刷榜https://www.zhihu.com/question/1931014634283967287/answer/193130 ...

驴唇不对马嘴,这俩根本就不是一个模型。
另外SimpleQA这个评测本身价值也存疑
回复

使用道具 举报

     
发表于 2025-7-25 14:19 | 显示全部楼层
moekyo 发表于 2025-7-23 18:55
我说的不是模型本身,而是那个命令行工具,虽然人家 gemini cli 是开源的,但是现在直接 copy 太糙了,起 ...

官方直接说了用Gemini Code改的
回复

使用道具 举报

     
发表于 2025-7-25 21:38 | 显示全部楼层
qratosones1337 发表于 2025-7-25 14:19
官方直接说了用Gemini Code改的

我知道啊,我这里补充了
你难道没见过那些拿着国产模型输出“我是 ChatGPT”来大肆宣扬抄袭剽窃的人吗,主要是这个发布太急了,明明可以更好的,虽然能理解追上这波命令行 agent 的风潮对宣传有大加分
回复

使用道具 举报

     
发表于 2025-7-25 23:27 | 显示全部楼层
发布了新的推理模型
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-8-16 23:50 , Processed in 0.151561 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表