富哥富哥, 试过洋垃圾DGX-1没有? V100 32G SXM2 *6不到25K的价格搞得我硬了起来, 想测一下nvfp4 的397B ...
nvfp4 好像在GB10上表现不如int4: https://forums.developer.nvidia.com/t/qwen3-5-397b-a17b-dgx-spark-duo/360780/42
另外V100对fp4有优化吗? 先说需求啊 笑死藤子弄了个国内的龙虾skill商店叫skillhub
结果把哥们的clawhub上发布的skill都搬过去了
这件事pete还吐槽 我被骗了五块钱 发表于 2026-3-12 15:07
先说需求啊
跟风,就像没有想玩的游戏却买了游戏机 才10天,火山coding plan 丐版就用爆了大家有没有什么省token的方法,删减那几个md/减少无用的skill/还是有其他办法
另外这两天开始用omlx+本地qwen3.5 35b方案,能用倒是能用,但是感觉智商下降有点多,另外omlx这个依赖固态擦写硬扛上下文的思路,感觉很伤硬盘啊
论坛助手,iPhone 古畑任三郎2015 发表于 2026-3-13 00:45
才10天,火山coding plan 丐版就用爆了大家有没有什么省token的方法,删减那几个md/减少无用的skill/还是 ...
现在不是很多coding plan吗?都在推
最简单就是拿谷歌号堆反代,这个纯白嫖 本帖最后由 古畑任三郎2015 于 2026-3-13 14:02 编辑
风怒,编辑掉 亚瑟摩根 发表于 2026-3-13 12:40
现在不是很多coding plan吗?都在推
最简单就是拿谷歌号堆反代,这个纯白嫖 ...
我算了下,按我之前几天的用法,火山那个pro版5倍的量也不够用,但价格上百一个月已经超过我的接受度了,因为我就是纯玩没生产力的
然后谷歌号反代是什么操作,教教我,gemini 免费版卡ip地址,我之前不想折腾
论坛助手,iPhone 古畑任三郎2015 发表于 2026-3-13 14:01
我算了下,按我之前几天的用法,火山那个pro版5倍的量也不够用,但价格上百一个月已经超过我的接受度了, ...
https://github.com/su-kaka/gcli2api
把这个架设起来,架哪里都无所谓,可以zeabur有一键部署的
然后架设起来,把你的谷歌号登录这个这个网页服务,获取凭证(号越多越好)
接着把这个服务的base url和api key
拿去更改claw的provider url和key(最简单是让ai帮你改,就说你的claw想换第三方的key)
再设置一下模型,大功告成
随便玩了,纯白嫖 亚瑟摩根 发表于 2026-3-13 14:05
https://github.com/su-kaka/gcli2api
把这个架设起来,架哪里都无所谓,可以zeabur有一键部署的
需要架梯子吗? redfortress 发表于 2026-3-13 16:37
需要架梯子吗?
你反代之后是不需要的,反正我是没架梯子 聚合工具我推荐axonhub
https://github.com/looplj/axonhub/blob/unstable/README.zh-CN.md
支持claudecode、antigravity、codex的oauth接入,也支持任意第三方api key。(如果axonhub所在服务器没有访问openai等网站的权限,记得给渠道配置代理,否则oauth通不过)
支持负载均衡和手动配置渠道模型优先级,支持项目和api key的管理,以及底层适配了anthropic和gemini等协议的互转。
我们团队现在就是用这套搭了自己的聚合中转站,在本地使用时只需要接入这么一套key即可,不需要在本地配一堆provider来回切了
页:
1
[2]
