—— 来自 Xiaomi MI 5s, Android 8.0.0上的 S1Next-鹅版 v2.4.1 3080除fe版没有双槽卡,安培有bfloat16,不过框架这个点适配不知道怎么样。
既有业务最好别换,容易翻车。
puget system测的3080半精度训练性能不对头,最好等等别人先踩坑,或者就买一张跑跑看。
—— 来自 Sony H8296, Android 10上的 S1Next-鹅版 v2.2.0.1 你们说的炼丹是啥 3080有翻倍的计算核心......据说......然而目前的DLSS看不出来 lvcha 发表于 2020-9-19 18:59
https://www.pugetsystems.com/labs/hpc/RTX3080-TensorFlow-and-NAMD-Performance-on-Linux-Preliminary-1 ...
fp32翻倍,tensor单元也说翻倍,但是性能特别是fp16都打不过rtx titan
—— 来自 Sony H8296, Android 10上的 S1Next-鹅版 v2.2.0.1 自己做实验,10g足够了。
要商用才会计算这些效费比,因为训练时间可以换成钱。直接买最大的。 DeepFishing 发表于 2020-9-19 19:15
fp32翻倍,tensor单元也说翻倍,但是性能特别是fp16都打不过rtx titan
—— 来自 Sony H8296, Android 1 ...
白 皮 书上GA102的tensor core性能相对GA100砍半了。而且CUDA的FP16性能是FP32的1x而不是2x。 你10g放不下的模型,11g照样放不下。3080够了。 BT有理 发表于 2020-9-19 19:01
你们说的炼丹是啥
深度学习训练模型,因为训练出来的模型没法解释,开始训练之后又什么都不用管放任机器跑就行了,故称炼丹 iceprince10 发表于 2020-9-20 15:54
看了3090的对比评测我觉得3080的10g绝对够了,甚至不用担心20g版本的背刺。基本上测下来两款显卡3a游戏4k下 ...
人家问炼丹 你说一通游戏 就算你把模型控制在10g,一旦迭代了不得不增加不就又完了。 要真出了20g版大不了再出二手换呗 没差别,大的模型16G也没辙,要上32G,甚至48G 我他妈要能买到3090我就不用跟3080那帮耍猴的傻逼较劲生气了。。。 顶一下帖子问问,炼丹这事瓶颈在显存还是核心?显存位宽被阉到192bit的12g3060炼丹师们会抢么? lockoff0131 发表于 2020-12-23 11:34
顶一下帖子问问,炼丹这事瓶颈在显存还是核心?显存位宽被阉到192bit的12g3060炼丹师们会抢么? ...
显存关乎能不能跑,核显关乎速度。穷逼企业才抱着游戏卡用,更穷的才会用非旗舰游戏卡,起码20系批量只有2080ti才有企业抢,多卡是不能混插的
—— 来自 Sony H8296, Android 10上的 S1Next-鹅版 v2.4.3 建议2080ti
3080就只能cuda11+了
—— 来自 samsung SM-G9730, Android 10上的 S1Next-鹅版 v2.4.3 话说,为什么显存不能像内存一样想装多少装多少呢?
—— 来自 HUAWEI EBG-AN00, Android 10上的 S1Next-鹅版 v2.4.3 花海境 发表于 2020-12-23 14:30
话说,为什么显存不能像内存一样想装多少装多少呢?
—— 来自 HUAWEI EBG-AN00, Android 10上的 S1Next- ...
内存也跑不上20ghz DeepFishing 发表于 2020-12-23 11:51
显存关乎能不能跑,核显关乎速度。穷逼企业才抱着游戏卡用,更穷的才会用非旗舰游戏卡,起码20系批量只有 ...
2080ti,4352个CUDA,13.4t flops
3060 12g,3840个cuda,而且30系的cuda算力比20系强(https://developer.nvidia.com/zh-cn/cuda-gpus#compute,一个8.6,一个7.5),这样一算3060的总cuda算力还超过2080ti
就算3060上市后指导价2700,不比2080ti便宜太多了? lockoff0131 发表于 2020-12-23 21:16
2080ti,4352个CUDA,13.4t flops
3060 12g,3840个cuda,而且30系的cuda算力比20系强(https://developer ...
所以老黄特意阉割了fp16的性能,30系fp16和fp32性能差不多,而20系rtx卡账面fp16是翻倍的,8.6和7.5指的是计算能力而不是纯性能
—— 来自 Sony H8296, Android 10上的 S1Next-鹅版 v2.4.3 lvcha 发表于 2020-12-23 21:25
这个cuda数量是根据性能折算的
原来这东西的”个”不是实际上的数量么 DeepFishing 发表于 2020-12-23 21:30
所以老黄特意阉割了fp16的性能,30系fp16和fp32性能差不多,而20系rtx卡账面fp16是翻倍的,8.6和7.5指的 ...
……找不到fp16在30系和20系的比较,不过看这意思你们是看不上这个3060了? lvcha 发表于 2020-12-23 22:43
炼丹肯定看不上了。
谢谢 我搞了张3070,我们的代码在30系跑跑不了,,我要跑路了,等不到我做适配了
—— 来自 Sony H8296, Android 10上的 S1Next-鹅版 v2.4.3
页:
[1]
2