找回密码
 立即注册
搜索
查看: 5549|回复: 31

[硬件] 现在搞块全新的7900XTX 拿来跑LLM好像性价比还不错

[复制链接]
     
发表于 2026-5-29 19:24 来自手机 | 显示全部楼层 |阅读模式
本帖最后由 mmmrm 于 2026-5-29 20:08 编辑

某抖5200多的蓝宝7900xtx白金,虽然纯打游戏性价比是垃圾

但是放二奶机里面跑跑LLM好像又还不错,24G显存找不到更便宜的了

打游戏的话,不开光追应该至少也有个4070 Ti左右的性能吧
回复

使用道具 举报

     
发表于 2026-5-29 19:44 来自手机 | 显示全部楼层
mmmrm 发表于 2026-5-29 19:24
某抖5200多的蓝宝7900xtx白金,虽然纯打游戏,性价比是垃圾

但是放二奶机里面跑跑LLM好像又还不错,24G显 ...

3090游戏比不过,ai应该秒了吧

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
 楼主| 发表于 2026-5-29 19:49 来自手机 | 显示全部楼层
FML2009 发表于 2026-5-29 19:44
3090游戏比不过,ai应该秒了吧

—— 来自 鹅球 v3.3.96-alpha

游戏也未必差多少,前提你能接受矿卡,而且矿卡也贵1000
回复

使用道具 举报

     
发表于 2026-5-29 20:21 | 显示全部楼层
mmmrm 发表于 2026-5-29 19:24
某抖5200多的蓝宝7900xtx白金,虽然纯打游戏性价比是垃圾

但是放二奶机里面跑跑LLM好像又还不错,24G显存 ...

7900xtx拿来跑qwen3.6 27b的Q4能有多少tk/s?之前看过有人推荐,但是非nvidia卡跑llm感觉速度不容易上去    Re:Source
回复

使用道具 举报

     
发表于 2026-5-29 20:31 来自手机 | 显示全部楼层
马上fsr4.1下放rnda3了,7900xtx也许游戏性能可以超过4070tis了
回复

使用道具 举报

     
发表于 2026-5-29 22:07 来自手机 | 显示全部楼层
不要折腾本地llm。还不如跑跑涩图,那也是n卡好些
回复

使用道具 举报

     
发表于 2026-5-30 15:04 来自手机 | 显示全部楼层
本地llm可能就翻译用途有点用。

—— 来自 HONOR PGT-AN10, Android 16, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
 楼主| 发表于 2026-5-30 18:27 来自手机 | 显示全部楼层
limon 发表于 2026-5-29 22:07
不要折腾本地llm。还不如跑跑涩图,那也是n卡好些

主力机当然是N卡了,从novelAI到comfyui我AI生图用了好多年了,本地LLM也玩了大半年了,都挺好玩的
回复

使用道具 举报

     
发表于 2026-5-30 19:10 | 显示全部楼层
diohanmilton 发表于 2026-5-30 15:04
本地llm可能就翻译用途有点用。

—— 来自 HONOR PGT-AN10, Android 16, 鹅球 v3.5.99-alpha ...

跑翻译用混元1.8b都能凑合了
回复

使用道具 举报

     
发表于 2026-5-31 12:05 来自手机 | 显示全部楼层
刚刚试了一下vega56跑ollama,配置是真烦琐啊
喷了

—— 来自 vivo V2238A, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-5-31 12:11 来自手机 | 显示全部楼层
llm是本地部署最没有意义的模型,显卡钱拿来买deepseek api够你用不知道多久了
回复

使用道具 举报

     
 楼主| 发表于 2026-5-31 13:59 来自手机 | 显示全部楼层
Kiraru 发表于 2026-5-31 12:11
llm是本地部署最没有意义的模型,显卡钱拿来买deepseek api够你用不知道多久了 ...

关于这个只能说实际用过就知道了
回复

使用道具 举报

发表于 2026-5-31 15:32 | 显示全部楼层
Kiraru 发表于 2026-5-31 12:11
llm是本地部署最没有意义的模型,显卡钱拿来买deepseek api够你用不知道多久了 ...

本地跑越狱无审查模型玩的,DS太敏感了。
回复

使用道具 举报

     
发表于 2026-5-31 16:16 | 显示全部楼层
Kiraru 发表于 2026-5-31 12:11
llm是本地部署最没有意义的模型,显卡钱拿来买deepseek api够你用不知道多久了 ...

不不不,deepseek 有些问答方面,即使调用api也存在和谐,会一本正经的输出官话,跟Kimi-K2.6(含K2,K2.5)及智谱GLM-5.1(含4.5到5)还是存在明显差别的。

如果是使用deepseek干活,我很支撑你的看法,但我更倾向认为DS是御三家之下一个不错的选择。我也部分支持你“个人本人部署LLM无意义”观点,普通人确实用不上太多本地功能,但富哥有能力去玩,我为什么不选择支持他一下呢,我可以期望他分享经验供我参考
回复

使用道具 举报

     
发表于 2026-5-31 16:41 来自手机 | 显示全部楼层
这就是我们rocm
喜欢要自己写算子和框架bug适配的amd显卡么
回复

使用道具 举报

     
 楼主| 发表于 2026-5-31 19:44 | 显示全部楼层
mp5 发表于 2026-5-29 20:21
7900xtx拿来跑qwen3.6 27b的Q4能有多少tk/s?之前看过有人推荐,但是非nvidia卡跑llm感觉速度不容易上去  ...

Q4在65K上下文下应该是30-40t/s,如果是MTP更快,MTP的Q5KM能跑到60t/s左右

不过我现在已经改用gemma了
回复

使用道具 举报

     
发表于 2026-5-31 20:41 | 显示全部楼层
mmmrm 发表于 2026-5-31 19:44
Q4在65K上下文下应该是30-40t/s,如果是MTP更快,MTP的Q5KM能跑到60t/s左右

不过我现在已经改用gemma了 ...

mtp的Q4在200K上下文能跑到30tk/s以上吗?能的话就的确可以考虑了    Re:Source
回复

使用道具 举报

发表于 2026-6-1 11:21 | 显示全部楼层
没有什么特殊的需求,API走起,本地部署又贵智商还不如API
回复

使用道具 举报

     
发表于 2026-6-1 11:57 | 显示全部楼层


······

花这钱,够你用很就在线llm了
回复

使用道具 举报

发表于 2026-6-1 12:47 | 显示全部楼层
本地llm不太行,智力比线上的差太远了,几乎无用。
搞涩图非常行,毕竟没有限制,速度也够用。
但是不知道各生图模型对a卡适配如何    Re:Source
回复

使用道具 举报

     
 楼主| 发表于 2026-6-1 12:57 来自手机 | 显示全部楼层
zris 发表于 2026-6-1 11:57
······

花这钱,够你用很就在线llm了

能说出这个,说明你还不知道本地和在线LLM的区别
回复

使用道具 举报

     
发表于 2026-6-1 13:49 | 显示全部楼层
mmmrm 发表于 2026-6-1 12:57
能说出这个,说明你还不知道本地和在线LLM的区别

愿闻其详
回复

使用道具 举报

     
发表于 2026-6-1 14:06 | 显示全部楼层
不如3080魔改20g
回复

使用道具 举报

     
发表于 2026-6-3 00:28 | 显示全部楼层
lixianfyss 发表于 2026-5-31 15:32
本地跑越狱无审查模型玩的,DS太敏感了。

其实你要是真想要解限的LLM,可以找一个支持微调的服务输入一批你想要的有害数据集稍微微调一下,
安全能力就完全消失了
回复

使用道具 举报

     
发表于 2026-6-3 08:17 | 显示全部楼层
24GB跑LLM真的够吗?

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-6-3 09:16 | 显示全部楼层
用破限比用去审查模型好,后者会降智商。ds的破限是最轻松的那档了,开了色情破限政治也会破    Re:Source
回复

使用道具 举报

发表于 2026-6-3 10:06 来自手机 | 显示全部楼层
我用的Mac Studio在跑,感觉小模型比较容易出逻辑问题,注意力也非常有限,使用时要专门做很多调整,折腾着折腾着就懒得用了

—— 来自 鹅球 v3.5.99-alpha
回复

使用道具 举报

发表于 2026-6-4 08:08 | 显示全部楼层
你说这个谁懂呀? 发表于 2026-6-3 00:28
其实你要是真想要解限的LLM,可以找一个支持微调的服务输入一批你想要的有害数据集稍微微调一下,
安全能 ...

搞这种事情花的时间成本就高了,也不知道会不会被封。
回复

使用道具 举报

发表于 2026-6-4 08:42 | 显示全部楼层
你说这个谁懂呀? 发表于 2026-6-3 00:28
其实你要是真想要解限的LLM,可以找一个支持微调的服务输入一批你想要的有害数据集稍微微调一下,
安全能 ...

你真当这些提供微调服务的平台不审核你的数据集啊?这条路现在已经是重点防控了。
回复

使用道具 举报

     
发表于 2026-6-4 08:57 来自手机 | 显示全部楼层
MeursaulT 发表于 2026-6-3 09:16
用破限比用去审查模型好,后者会降智商。ds的破限是最轻松的那档了,开了色情破限政治也会破    Re:Source ...


感觉deepseek的api有个硬审核,我之前opencode接deepseek给一个有敏//感//词库的项目写代码,deepseek如果读到那个词库就会直接拒绝输出,无论官api还是opencodego的api都不行,但是像kimi,glm还有小米那个就能继续使用,遇到这个情况只能先用其他模型写下去,然后开新的对话再改回ds。
回复

使用道具 举报

     
发表于 2026-6-4 09:31 | 显示全部楼层
mccleaner 发表于 2026-6-4 08:57
感觉deepseek的api有个硬审核,我之前opencode接deepseek给一个有敏//感//词库的项目写代码,deepseek如 ...

api不破限不会回答政治特别敏感的东西和民族问题,很正常,给opencode挂个破限就行,不降智    Re:Source
回复

使用道具 举报

     
发表于 2026-6-4 14:08 | 显示全部楼层
lixianfyss 发表于 2026-6-4 08:42
你真当这些提供微调服务的平台不审核你的数据集啊?这条路现在已经是重点防控了。 ...

笑死,你说的真是我做的,
现在如何用完全无害的数据集微调一个大模型让他能有害已经是一个完全成熟的方向了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-5 04:30 , Processed in 0.203569 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表