找回密码
 立即注册
搜索
查看: 4936|回复: 19

[硬件] 农企显卡炼丹画图效率居然还行了

[复制链接]
     
发表于 2025-12-12 19:10 | 显示全部楼层 |阅读模式
都用comfyi跑z images,农企需要手动装,但是性能居然还行。

395 跑一张图 24s左右,9060xt 15s,5060ti 17s然后我升了下速度到14s,这些卡账面fp32都在差不多水平,20多T。
虽然我感觉真用农企可能有别的稀奇古怪的问题。
回复

使用道具 举报

     
发表于 2025-12-12 19:12 来自手机 | 显示全部楼层
a770呢

—— 来自 Xiaomi 23049RAD8C, Android 14, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2025-12-12 19:47 来自手机 | 显示全部楼层
本帖最后由 雪影 于 2025-12-13 14:49 编辑

rocm 7.1提升应该不小,比跑zluda高
不过rocm win只能跑wsl2,不如原生linux
注意,是7.1

—— 来自 Xiaomi 2304FPN6DC, Android 13, 鹅球 v3.5.99-alpha
回复

使用道具 举报

发表于 2025-12-12 19:50 | 显示全部楼层
rocm一个版本的软件更新llm的提示处理翻了一倍多,看的我下巴都惊掉,再看看**mac,下一代直接上张量单元,现有用户全部淘汰...贵一倍价格软件支持跟屎一样
回复

使用道具 举报

     
发表于 2025-12-12 20:59 | 显示全部楼层
A卡生态还是太麻烦了吧
只支持90卡吗?68xt还能挣扎么
回复

使用道具 举报

     
发表于 2025-12-12 21:30 来自手机 | 显示全部楼层
我这边用zluda triton跑不了 不带triton的跑第一张图可以 第二张图闪退 烦

—— 来自 OnePlus PJX110, Android 14, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2025-12-12 22:20 来自手机 | 显示全部楼层
可是395也涨价了

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-12-12 23:27 来自手机 | 显示全部楼层
做了Linux双系统,重启到Linux系统,从别的电脑访问网页端,N卡3090和395都很快。
回复

使用道具 举报

     
发表于 2025-12-13 00:53 来自手机 | 显示全部楼层
d2loader 发表于 2025-12-12 22:20
可是395也涨价了

—— 来自 鹅球 v3.3.96

395涨价是因为内存涨价
fevm预售的那台,128G只要14K,放现在还行

—— 来自 Xiaomi 2304FPN6DC, Android 13, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
 楼主| 发表于 2025-12-13 09:01 来自手机 | 显示全部楼层
雪影 发表于 2025-12-12 19:47
rocm提升应该不小,比跑zluda高
不过rocm win只能跑wsl2,不如原生linux

win下原生跑的,另外两张独立显卡我用usb4接到小主机上跑的,Ubuntu下独显调不起来,可能我哪配的不对

—— 来自 Xiaomi 24117RK2CC, Android 15上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2025-12-13 14:06 | 显示全部楼层
还是太慢了有代差
我用3090这种老卡跑zimage快的起飞
回复

使用道具 举报

     
发表于 2025-12-13 14:23 来自手机 | 显示全部楼层
mitzvah 发表于 2025-12-12 19:50
rocm一个版本的软件更新llm的提示处理翻了一倍多,看的我下巴都惊掉,再看看**mac,下一代直接上张量单元, ...

amd也不支持上一代啊,rocm windows 7000系只支持7900xtx
回复

使用道具 举报

     
发表于 2025-12-13 14:49 | 显示全部楼层
DeepFishing 发表于 2025-12-13 09:01
win下原生跑的,另外两张独立显卡我用usb4接到小主机上跑的,Ubuntu下独显调不起来,可能我哪配的不对

...

ROCm原生只能在linux下,win通过WSL2实现的,这个不是硬件直通,还是走的虚拟化,有性能损失
回复

使用道具 举报

     
发表于 2025-12-13 14:50 | 显示全部楼层
Kiraru 发表于 2025-12-13 14:23
amd也不支持上一代啊,rocm windows 7000系只支持7900xtx

实际上,7.1只支持90X0和AI MAX+系列
回复

使用道具 举报

     
 楼主| 发表于 2025-12-13 14:54 来自手机 | 显示全部楼层
雪影 发表于 2025-12-13 14:49
ROCm原生只能在linux下,win通过WSL2实现的,这个不是硬件直通,还是走的虚拟化,有性能损失 ...

可以跑的,我用的预览版的rocm和pytorch

—— 来自 Xiaomi 24117RK2CC, Android 15上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

发表于 2025-12-13 15:00 | 显示全部楼层
借地问下PCIE带宽影响大吗,现在用的USB4,有吃灰台机但懒得开

跑的过程中要占近100GB的RAM+pagefile,俺寻思这么多数据在VRAM、RAM、SSD之间倒来倒去,PCIE带宽应该影响不小,但没实测过
回复

使用道具 举报

     
发表于 2025-12-13 15:12 来自手机 | 显示全部楼层
mitzvah 发表于 2025-12-12 19:50
rocm一个版本的软件更新llm的提示处理翻了一倍多,看的我下巴都惊掉,再看看**mac,下一代直接上张量单元, ...

下一代的升级有点类似11年跳gcn架构吧,以前的老架构直接抛弃。

—— 来自 motorola XT2401-2, Android 15, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2025-12-13 15:16 | 显示全部楼层
albertfu 发表于 2025-12-13 15:00
借地问下PCIE带宽影响大吗,现在用的USB4,有吃灰台机但懒得开

跑的过程中要占近100GB的RAM+pagefile,俺 ...

如果只是ai画图,你pcie带宽只会影响你从硬盘载入模型的速度,以常见sdxl模型6g多来算,pcie x8 1.1单向理论速度是2.0g,也就是说你载入模型的理论速度大概3秒多点。
模型载入完成后,跑模型的时候就跟pcie带宽没关系了。

以上是理论数据,如果你显卡的显存不够大启用了共享显存,那就是另一个复杂的问题了。
回复

使用道具 举报

发表于 2025-12-13 15:19 | 显示全部楼层
小妻水亚美 发表于 2025-12-13 15:12
下一代的升级有点类似11年跳gcn架构吧,以前的老架构直接抛弃。

—— 来自 motorola XT2401-2, Android  ...

那倒不至于,但是m5补全了大量张量计算单元,相当于直接加上了Tensorcore,算力直接翻四到五倍,这些加速m5以前的产品全都吃不到,老硬件的软件优化估计也是没戏了。amd别的不说,strixhalo社区还是不断出更新,到时候npu都能拿来算llm,这些mac全没有
回复

使用道具 举报

发表于 2025-12-13 15:25 | 显示全部楼层
netplaying 发表于 2025-12-13 15:16
如果只是ai画图,你pcie带宽只会影响你从硬盘载入模型的速度,以常见sdxl模型6g多来算,pcie x8 1.1单向 ...

那个checkpoint 29GB,显存只有24GB,所以我估摸着PCIE带宽影响不小
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-12-15 04:00 , Processed in 0.130170 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表