shinzero 发表于 2026-2-5 15:46

9070XT和AI Max 395/392 的AI性能差多少

从纸面数据来看,9070XT浮点运算能力是48.66 TFLOPS, AI Max的8060S核显是14.85 TFLOPS,只有9070XT的三分之一还不到。

但是9070XT的显存只有16G,而AI Max最多可以有128G的共享内存和显存

那是不是可以理解成,9070XT能跑的动的模型性能可以有AI Max的三倍多,但是AI Max可以跑9070XT跑不动的模型?

mitzvah 发表于 2026-2-5 15:59

只要你内存够大够快比如ddr5,9070也能跑大模型,就是慢点罢了,但是aimax也不快所以都不咋地

雪影 发表于 2026-2-5 16:00

算力是算力,一般用TOPS来衡量
但是tokens速度一般是看显存的速度
另外,AI MAX最大是96G显存

niubility 发表于 2026-2-5 16:09

跑模型内存比性能重要,内存大小决定了你能跑多大的模型。算力反而不是最重要的。

论坛助手,iPhone

木谷高明 发表于 2026-2-5 16:19

AI Max最多划96GB给GPU跑模型

显存爆了就跑不了,部分模型可以用各种技术分一些数据进内存,但是会变慢,至少能跑。

yjmy705 发表于 2026-2-5 17:12

我64gddr5+32gvram,lmstudio能跑qwen 80B q4km,就是慢,太慢了。 不知道395MAX+128g内存能跑多快?

matthewsteel 发表于 2026-2-5 17:22

yjmy705 发表于 2026-2-5 17:12
我64gddr5+32gvram,lmstudio能跑qwen 80B q4km,就是慢,太慢了。 不知道395MAX+128g内存能跑多快? ...

Qwen3-Next (80B) Q6_K with 262144 token context: ~26 t/s

https://www.reddit.com/r/LocalLLaMA/comments/1pmuf22/ryzen_ai_max_395_benchmarks

换成q4估计还会快一些?

雪影 发表于 2026-2-5 17:30

yjmy705 发表于 2026-2-5 17:12
我64gddr5+32gvram,lmstudio能跑qwen 80B q4km,就是慢,太慢了。 不知道395MAX+128g内存能跑多快? ...

你内存速度太慢了
AI MAX是4通 DDR5X 8000,有240GB/S的读取速度

yjmy705 发表于 2026-2-5 18:42

matthewsteel 发表于 2026-2-5 17:22
Qwen3-Next (80B) Q6_K with 262144 token context: ~26 t/s

https://www.reddit.com/r/LocalLLaMA/comm ...

哇袄,这也太快了,怪不得内存金子价了,感觉5090白买了,只有5.9token/s,是因为交换太频繁的降速吗?还是跑32B好了

yjmy705 发表于 2026-2-5 18:44

雪影 发表于 2026-2-5 17:30
你内存速度太慢了
AI MAX是4通 DDR5X 8000,有240GB/S的读取速度

是的。6600mhz的内存速度只有101GB/S,就算换8000的双通道也就130GB/S,当时买来打游戏而已没想那么多。现在想换都换不起了。
页: [1]
查看完整版本: 9070XT和AI Max 395/392 的AI性能差多少