半肾
精华
|
战斗力 鹅
|
回帖 0
注册时间 2020-9-19
|
“
同时使用所有的CUs是有代价的。因为CU需要分配给图形卡的资源以运行代码,如果图形卡不能将所有的资源分配到所有的CU上以运行一个代码,那么可执行的CU数量将会下降。例如,对52个CU仅利用其20%,因为图形卡没有足够的资源在所有的时间支持所有的缓存。For example, instead of 52, use 20% of it because it doesn't have enough resources for all caches at all times.”
恕我直言,以我个人的开发经验来说,能说出这种话的,真的是难以想象。合理分配cu是优化的基本操作,尤其现在各种异步compute大行其道的时候。而且本身硬件也没那么蠢。只有在人为的管线设计出现失误导致某时间段大家都在等一个轻量级task才会导致闲置cu用不上的情况干着急。
但是异步gpu任务+framegraph这类操作在本世代机上就已经是基操的东西你和我说次世代反而做不到了?
更何况高分辨率下很多compute操作也需要更多cu来解决才对。
老实说,这个人的发言对我来说相当迷惑。 |
|