9070XT和AI Max 395/392 的AI性能差多少

shinzero 发表于 2026-2-5 15:46

从纸面数据来看，9070XT浮点运算能力是48.66 TFLOPS， AI Max的8060S核显是14.85 TFLOPS，只有9070XT的三分之一还不到。

但是9070XT的显存只有16G，而AI Max最多可以有128G的共享内存和显存

那是不是可以理解成，9070XT能跑的动的模型性能可以有AI Max的三倍多，但是AI Max可以跑9070XT跑不动的模型？

mitzvah 发表于 2026-2-5 15:59

只要你内存够大够快比如ddr5，9070也能跑大模型，就是慢点罢了，但是aimax也不快所以都不咋地

雪影发表于 2026-2-5 16:00

算力是算力，一般用TOPS来衡量
但是tokens速度一般是看显存的速度
另外，AI MAX最大是96G显存

niubility 发表于 2026-2-5 16:09

跑模型内存比性能重要，内存大小决定了你能跑多大的模型。算力反而不是最重要的。

论坛助手,iPhone

木谷高明 发表于 2026-2-5 16:19

AI Max最多划96GB给GPU跑模型

显存爆了就跑不了，部分模型可以用各种技术分一些数据进内存，但是会变慢，至少能跑。

yjmy705 发表于 2026-2-5 17:12

我64gddr5+32gvram，lmstudio能跑qwen 80B q4km，就是慢，太慢了。不知道395MAX+128g内存能跑多快？

matthewsteel 发表于 2026-2-5 17:22

yjmy705 发表于 2026-2-5 17:12
我64gddr5+32gvram，lmstudio能跑qwen 80B q4km，就是慢，太慢了。不知道395MAX+128g内存能跑多快？ ...

Qwen3-Next (80B) Q6_K with 262144 token context: ~26 t/s

https://www.reddit.com/r/LocalLLaMA/comments/1pmuf22/ryzen_ai_max_395_benchmarks

换成q4估计还会快一些?

雪影发表于 2026-2-5 17:30

yjmy705 发表于 2026-2-5 17:12
我64gddr5+32gvram，lmstudio能跑qwen 80B q4km，就是慢，太慢了。不知道395MAX+128g内存能跑多快？ ...

你内存速度太慢了
AI MAX是4通 DDR5X 8000，有240GB/S的读取速度

yjmy705 发表于 2026-2-5 18:42

matthewsteel 发表于 2026-2-5 17:22
Qwen3-Next (80B) Q6_K with 262144 token context: ~26 t/s

https://www.reddit.com/r/LocalLLaMA/comm ...

哇袄，这也太快了，怪不得内存金子价了，感觉5090白买了，只有5.9token/s，是因为交换太频繁的降速吗？还是跑32B好了

yjmy705 发表于 2026-2-5 18:44

雪影发表于 2026-2-5 17:30
你内存速度太慢了
AI MAX是4通 DDR5X 8000，有240GB/S的读取速度

是的。6600mhz的内存速度只有101GB/S，就算换8000的双通道也就130GB/S，当时买来打游戏而已没想那么多。现在想换都换不起了。

页: [1]

Stage1st's Archiver

9070XT和AI Max 395/392 的AI性能差多少