猫榜出现神秘刷榜模型，评分仅次于chatgpt5.5xhigh - 第3页 - 归墟 - Stage1st

ayanamilin 发表于 2026-5-4 17:14

根据 https://benchlm.ai/llm-speed 的数据，171 TPS 附近的模型如下，可以看到无一例外都是小型/快速模型：

GPT-5.4 nanoOpenAI191
Grok 3 MinixAI190
Ministral 3 8BMistral182
GPT-4.1 nanoOpenAI181
Mistral Small 4Mistral175
Grok Code Fast 1xAI172
o4-mini (high)OpenAI161
o3-miniOpenAI160
Gemini 3 FlashGoogle159
Nemotron 3 Nano 30BNVIDIA152

我觉得 171 TPS 这个数字是有水分的，实际开始 serve 后的表现起码要打七折，不过依然很夸张了。

findpkq 发表于 2026-5-4 17:21

热搜都在骂豆包，但是之前服务的免费用户量属于终极做慈善了

但是新的大模型如果侧重coding和agent能力，要卖其实也没必要捆着豆包品牌吧，不知道怎么打算，捆ppt和视频生成也很怪，seedance面向用户侧的话每月500也就相当于即梦高级会员

倒是期待能把trae solo好好打磨成codex客户端这种程度，应用层这块大厂这种产品经理溢出的做起来还是比ds侧重研究性质的更有经验

小川彩 发表于 2026-5-4 18:01

所以这表格在哪看的我在知乎没看到

论坛助手,iPhone

小妻水亚美 发表于 2026-5-4 18:02

本帖最后由小妻水亚美于 2026-5-4 18:04 编辑

findpkq 发表于 2026-5-4 17:21
热搜都在骂豆包，但是之前服务的免费用户量属于终极做慈善了

但是新的大模型如果侧重coding和agent能力， ...

这个定价对不懂行的老百姓来说肯定要骂啊，他们心想就问问问题当个搜索引擎来用，幻觉这么严重居然还想收这么高的月租费

—— 来自 vivo V2454DA, Android 16上的 S1Next-鹅版 v2.5.2

血色黎明的绽放 发表于 2026-5-4 18:45

love4aids 发表于 2026-5-4 11:37
我会按表格里的性能指纹来推断，不联网核验。

不联网只看表格“性能指纹”推断，我会这样押：

水论坛发 AI 回复，你起码把 Markdown 的格式清洗一下。

df600a 发表于 2026-5-4 19:22

以后Ai这玩意儿会走向全面收费化吗？随着这玩意儿逐渐的和日常生活绑定越来越深这玩意儿以后是不是也要和水电费一样成为家庭固定支出？

----发送自 OnePlus GM1900,Android 11

nxmonitor 发表于 2026-5-4 19:29

本帖最后由 nxmonitor 于 2026-5-4 19:31 编辑

df600a 发表于 2026-5-4 19:22
以后Ai这玩意儿会走向全面收费化吗？随着这玩意儿逐渐的和日常生活绑定越来越深这玩意儿以后是不是也要和水 ...
这个问题本身就是矛盾的，不便宜根本绑定不了日常生活，介入日常生活要靠agent，但是很多agent项目都是被高额API费用卡死的，连开发人员都用不起

df600a 发表于 2026-5-4 19:35

引用第86楼nxmonitor于2026-05-04 19:29发表的:
df600a 发表于 2026-5-4 19:22以后Ai这玩意儿会走向全面收费化吗？随着这玩意儿逐......

@nxmonitor
收费也不是说非得高价，我的意思这玩意儿以后就是普遍的收费了但不一定就高价了。就跟水电费宽带费似的，当年那会儿有几家交宽带费的？现在不也是家家都交了？Ai收费我觉得可能也是走这个路子

----发送自 OnePlus GM1900,Android 11

phorcys02 发表于 2026-5-4 20:19

ov_efly 发表于 2026-5-4 15:55
国内有能力定制芯片的不多吧
阿里、字节和华为
还有谁？

还有大家都骂的百度...

hyhyhyhy 发表于 2026-5-4 20:38

国模豆包大尺度私拍

Esoterica 发表于 2026-5-4 20:39

主要如果真是字节的话应该不会再叫豆包了吧，这“通俗”的名字加上有点糖的形象感觉不太适合用在偏专业的领域了。
国模能崛起是好事，GPT搞起来我都嫌麻烦更别说A/

sellboy 发表于 2026-5-4 20:44

Esoterica 发表于 2026-5-4 20:39
主要如果真是字节的话应该不会再叫豆包了吧，这“通俗”的名字加上有点糖的形象感觉不太适合用在偏专业的领 ...

字节的文字模型叫Seed。
豆包算前端应用

一般市民 发表于 2026-5-4 21:09

"画一张中国码农跪在豆包周围向豆包道歉的图。"

chronicle 发表于 2026-5-4 21:12

如果是百度，那真是天大的乐子。如果是百度，我宁愿送钱给a➗和openai

舞以发表于 2026-5-4 23:04

看看字节推的订阅服务市场反应咋样了
真牛逼的话就把id里剩下的日元用完就转回豆包

phorcys02 发表于 2026-5-4 23:47

真有 gpt5.5 的这个分数+这个tps...
略微贵点真不是不能忍啊.

雪影发表于 2026-5-5 09:20

寒武纪那规格真能跑出这速度，那我只能说挖出天顶星科技了
除非寒武纪有新硬件没发直接让字节用

—— 来自 Xiaomi 2304FPN6DC, Android 13, 鹅球 v3.5.99-alpha

火沙发表于 2026-5-5 09:24

有没有可能是跑在华为算力卡上的模型？虽然华子的算力比较拉，但毕竟现在很多模型对显卡资源的利用率也不是那么高。如果进行特定优化适配的话？

夜游宫 发表于 2026-5-5 09:48

Esoterica 发表于 2026-5-4 20:39
主要如果真是字节的话应该不会再叫豆包了吧，这“通俗”的名字加上有点糖的形象感觉不太适合用在偏专业的领 ...

豆包=都包，以字节的体量肯定是奔着全品覆盖路子走的。

dada 发表于 2026-5-5 10:52

df600a 发表于 2026-5-4 19:22
以后Ai这玩意儿会走向全面收费化吗？随着这玩意儿逐渐的和日常生活绑定越来越深这玩意儿以后是不是也要和水 ...

token 没有边际成本递减，以后肯定收费，ai 类应用商业模式和传统互联网应用不一样，目前看只有靠专业用户收费才能维持

sellboy 发表于 2026-5-5 11:17

dada 发表于 2026-5-5 10:52
token 没有边际成本递减，以后肯定收费，ai 类应用商业模式和传统互联网应用不一样，目前看只有靠专业用 ...

类似阶梯电价吧
民用成本供应基本等于租卡钱，商用考虑模型研发成本和利润需求后定价。
用得多就阶梯涨价到商用价级别

nxmonitor 发表于 2026-5-5 12:32

本帖最后由 nxmonitor 于 2026-5-5 12:38 编辑

光靠专业用户怎么维持？知道closeai和A÷为什么要用ARR吹收益吗？不就是价格敏感程度其实特别高吗？

损友阿德 发表于 2026-5-5 12:52

nxmonitor 发表于 2026-5-4 10:51
现在上市的两个，一个被V4P挤压，一个被V4F覆盖，哪怕不比海外三家，至少几个月翻不了身 ...

实际使用体验编程上glm5.1还是明显有优势的coding plan套餐一直是缺货状态

忧郁的杰哥 发表于 2026-5-5 16:08

tillnight 发表于 2026-5-5 17:04

忧郁的杰哥发表于 2026-5-5 16:08
如果不是梁圣开源deepseek

其实去年就给搞收费了

总有人喜欢滥用开源这个概念，国产收费先锋的智谱、月之暗面都是坚持旗舰模型开源的，也没影响订阅价直接对标国际了。反过来说，deepseek v3/r1开启的开源新时代恰恰和“开源=免费”没有任何关系，因为r1最划时代的是671b的满血版，量化后的小模型都没比同时的qwen更好。能部署671b模型提供的二道贩子要么是卖token的要不是自研模型拉了捡到了稻草的（腾讯百度），都和真正意义上的免费共享精神没有关系。
Deepseek和其他人的最大区别不是开源，不然qwen都开源旗舰了。鲸鱼的不同点是坚持网页端免费和同时期价格杀手级的token价格，而这和开源没有关系，就是闭源ds也一样可以这么做。
反过来说豆包，只要理解字节的商业逻辑就知道拿一个订阅计划就来节奏说免费用最后就是让你掏钱的属于典型的想简单了。豆包必然不可能放弃这个已经占据的下沉免费用户市场，他继续提供免费服务不会是口嗨的。这时候很多人又忘记了阿里千问三个月前还在想砸钱撬开这个市场占有呢。对于阿里和字节这种巨兽来说，ai时代占据这个流量接口太重要了，不管是往主营业务引流还是数据滚雪球。所以没有ds豆包去年也必然是这个免费引流的路线，之后也会是。当然以后新的功能肯定会逐渐放在paywall后面逐步往订阅引，但是目前这个订阅价格明显就是在向程序猿卖coding plan或者变相的卖他那个贵的离谱的seedance2，和收割普通用户没什么关系。

鹅肉机构 发表于 2026-5-5 17:14

鹅肉机构 发表于 2026-5-5 17:17

勿徊哉 发表于 2026-5-5 17:18

所以到底是哪家的现在还不确定吗？
目前只有 QQ 群榜单截图证明这个模型的存在，其他榜单有这个模型吗？

赤星ビスコ 发表于 2026-5-5 17:19

tillnight 发表于 2026-5-5 17:04
总有人喜欢滥用开源这个概念，国产收费先锋的智谱、月之暗面都是坚持旗舰模型开源的，也没影响订阅价直接 ...

其实主要问题是，它要收费的话，可以不放在豆包里面收啊，就像seedance一样。
本来就有了seed pro 的api和trae 之类的产品。还要在豆包里放收费plan，要么就说明它的收费计划希望触达更多用户。

忧郁的杰哥 发表于 2026-5-5 17:26

thisism 发表于 2026-5-5 17:45

这东西显然以后要普及到能接受的地步才会人人用。没人高兴用agent点个鸡腿花多5毛钱。

大中型机到pc，pc到手机。电话当年的初装费，网络当年的拨号，都一样。

goranger 发表于 2026-5-5 19:27

码农会用自己的钱包投票，你一个码农，用国模编程，符合这个群体刻板印象吗

论坛助手,iPhone

舞以发表于 2026-5-5 19:36

goranger 发表于 2026-5-5 19:27
码农会用自己的钱包投票，你一个码农，用国模编程，符合这个群体刻板印象吗

论坛助手,iPhone ...
claude很多人是真“不辱不用”
越被羞辱越要用，越顶着羞辱用越感觉自己已经不是⏰人了

mrkikokiko 发表于 2026-5-5 23:07

goranger 发表于 2026-5-5 19:27
码农会用自己的钱包投票，你一个码农，用国模编程，符合这个群体刻板印象吗

论坛助手,iPhone ...

之前cc和codex模型也便宜啊，一个月花300rmb，天天狠艹也花不完额度，不过由于这两家要大涨价，现在我们公司同事已经开始研究国模了

startraveller 发表于 2026-5-5 23:38

mrkikokiko 发表于 2026-5-5 23:07
之前cc和codex模型也便宜啊，一个月花300rmb，天天狠艹也花不完额度，不过由于这两家要大涨价，现在我们 ...

现在这两家的20刀都是做几个需求就没了，干正事100刀起

—— 来自 HUAWEI HOP-AL10, Android 12, 鹅球 v3.5.99-alpha

苏西踩我了 发表于 2026-5-6 02:49

大概是豆包了，之前字节花了巨量的钱在新加坡建算力中心，买了很多GB200，300来，字节能搞出seedance，再把豆包训练到接近gpt也很合理

nxmonitor 发表于 2026-5-7 00:25

今天看到一个豆包lite的图，分数上是老高了，估计上面的就是这个，但是注意力貌似只有16K。

勿徊哉 发表于 2026-5-8 16:07

本帖最后由勿徊哉于 2026-5-8 16:08 编辑

已经5月8号了。这个模型还没确定是哪家吗？
也没有看到其他消息，推上也没人提。
是P图后的假消息？还是担心放出来之后美股崩了？会这么考虑美股影响的企业只能是字节了？还是等XXX访华的时候才会放？

小野賢章 发表于 2026-5-8 16:18

boeing 发表于 2026-5-4 00:52
DEEPSEEK不搞这种活吧。
DeepSeek V4 在论文里面还感谢了知乎用户东山奈央，请他内测了

小野賢章 发表于 2026-5-8 16:20

拜拜发表于 2026-5-4 10:35
恒科都不看好中国大模型吗？

字节不上市，字节越强，恒科互联网就越拉。

页: 1 2 [3] 4

Stage1st's Archiver