找回密码
 立即注册
搜索
查看: 1126|回复: 9

[硬件] 9070XT和AI Max 395/392 的AI性能差多少

[复制链接]
     
发表于 2026-2-5 15:46 | 显示全部楼层 |阅读模式
从纸面数据来看,9070XT浮点运算能力是48.66 TFLOPS, AI Max的8060S核显是14.85 TFLOPS,只有9070XT的三分之一还不到。

但是9070XT的显存只有16G,而AI Max最多可以有128G的共享内存和显存

那是不是可以理解成,9070XT能跑的动的模型性能可以有AI Max的三倍多,但是AI Max可以跑9070XT跑不动的模型?

回复

使用道具 举报

发表于 2026-2-5 15:59 | 显示全部楼层
只要你内存够大够快比如ddr5,9070也能跑大模型,就是慢点罢了,但是aimax也不快所以都不咋地
回复

使用道具 举报

     
发表于 2026-2-5 16:00 | 显示全部楼层
算力是算力,一般用TOPS来衡量
但是tokens速度一般是看显存的速度
另外,AI MAX最大是96G显存
回复

使用道具 举报

     
发表于 2026-2-5 16:09 | 显示全部楼层
跑模型内存比性能重要,内存大小决定了你能跑多大的模型。算力反而不是最重要的。

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-2-5 16:19 | 显示全部楼层
AI Max最多划96GB给GPU跑模型

显存爆了就跑不了,部分模型可以用各种技术分一些数据进内存,但是会变慢,至少能跑。
回复

使用道具 举报

     
发表于 2026-2-5 17:12 | 显示全部楼层
我64gddr5+32gvram,lmstudio能跑qwen 80B q4km,就是慢,太慢了。 不知道395MAX+128g内存能跑多快?
回复

使用道具 举报

     
发表于 2026-2-5 17:22 | 显示全部楼层
yjmy705 发表于 2026-2-5 17:12
我64gddr5+32gvram,lmstudio能跑qwen 80B q4km,就是慢,太慢了。 不知道395MAX+128g内存能跑多快? ...

Qwen3-Next (80B) Q6_K with 262144 token context: ~26 t/s

https://www.reddit.com/r/LocalLL ... _max_395_benchmarks

换成q4估计还会快一些?
回复

使用道具 举报

     
发表于 2026-2-5 17:30 | 显示全部楼层
yjmy705 发表于 2026-2-5 17:12
我64gddr5+32gvram,lmstudio能跑qwen 80B q4km,就是慢,太慢了。 不知道395MAX+128g内存能跑多快? ...

你内存速度太慢了
AI MAX是4通 DDR5X 8000,有240GB/S的读取速度
回复

使用道具 举报

     
发表于 2026-2-5 18:42 | 显示全部楼层
matthewsteel 发表于 2026-2-5 17:22
Qwen3-Next (80B) Q6_K with 262144 token context: ~26 t/s

https://www.reddit.com/r/LocalLLaMA/comm ...

哇袄,这也太快了,怪不得内存金子价了,感觉5090白买了,只有5.9token/s,是因为交换太频繁的降速吗?还是跑32B好了
回复

使用道具 举报

     
发表于 2026-2-5 18:44 | 显示全部楼层
雪影 发表于 2026-2-5 17:30
你内存速度太慢了
AI MAX是4通 DDR5X 8000,有240GB/S的读取速度

是的。6600mhz的内存速度只有101GB/S,就算换8000的双通道也就130GB/S,当时买来打游戏而已没想那么多。现在想换都换不起了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-2-15 21:52 , Processed in 0.068745 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表