找回密码
 立即注册
搜索
查看: 7574|回复: 28

[硬件] 老黄为所欲为,泰坦V!

[复制链接]
头像被屏蔽
     
发表于 2017-12-8 12:41 | 显示全部楼层 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2017-12-8 13:03 | 显示全部楼层
看了下,中文圈好像新闻基本还没出来,英文新闻还是在半个小时前报的。以下均属机翻:NVIDIA刚刚发布了基于Volta GPU架构Titan V的最新Titan显卡.NVIDIA Titan V采用了最新的GPU技术,如12nm Volta GPU架构以及大量的HBM2内存。

NVIDIA Titan V宣布 - 售价3000美元的Juggernaut拥有5120个CUDA内核,12 GB HBM2 VRAM和全面的12nm Volta GPU架构
NVIDIA Titan V图形卡采用最新的12纳米Volta GPU架构,因此融入了NVIDIA所提供的最新技术。在Titan家族中,GPU将瞄准消费者市场,因此,你可以期待一个非常高的价格,因为这个坏男孩将花费3000美元。

NVIDIA技术的GeForce  - 泰坦XP-星战 - 收藏版 - 银河 - 帝国照片-001
相关
NVIDIA的离散GPU市场份额在2017年第三季度攀升至72.8%,AMD的份额从30%下降至27% - 个人电脑游戏需求在AIB出货量上升
通过NVIDIA创始人兼CEO詹森黄在每年公布  NIPS conferen CE,TITAN V擅长的科学模拟计算处理。其211亿个晶体管提供了110 teraflops的原始马力,是其前身的9倍,并且具有极高的能源效率。



“我们对沃尔的看法是推动高性能计算和人工智能的外部极限。我们用新的处理器架构,指令,数字格式,存储器架构和处理器链接打破了新的局面。“用TITAN V,我们把沃尔特放到了世界各地的研究人员和科学家手中。我迫不及待地想看到他们突破性的发现。”通过NVIDIA


作为回报,您不仅可以获得令人敬畏的全新Volta GPU架构“GV100”,买家还可以获得12 GB的HBM2内存。是的,这是第一个Titan显卡,也是第一个采用HBM2内存的NVIDIA显卡(Non Quadro / Non Tesla)系列。

gameworks访谈白
英伟达™(NVIDIA®)GameWorks的
相关
Rev Lebaredian以及它将如何帮助民主化游戏开发


NVIDIA Titan V基于GV100 GPU架构,共有5120个CUDA内核和320个纹理单元。这与Tesla V100的核心数量完全相同。除了常规内核外,该卡还在Volta GPU内部封装了640个Tensor Cores。这些都是为了最大限度地提高深度学习性能,因为该卡可以减少高达110 TFLOP的GPU性能的AI相关算法。整个内核的时钟频率为1200 MHz,提升频率为1455 MHz。即使有这么多的规格,该卡只需要一个8和6针电源连接器配置引导,并进入一个250W的封装。



所以来到HBM2 VRAM,是的,显卡上有12 GB的内存,并且在3072位内存总线上有1.7 Gbps的数据速率。这使得卡的总带宽为652.8 GB / s,比之前的Titan XP要快。与Tesla V100相比,我们正在寻求一个降低总线接口(4096位和3072位),同时也降低了12GB的VRAM,而该板上的16GB。总的来说,这款显卡可以用于专业和常规的工作负载,比如游戏,而且这种卡打包的方式很有意思。


回复

使用道具 举报

发表于 2017-12-8 13:13 | 显示全部楼层
只要用得上tensor core就可以买,毕竟9倍性能。
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2017-12-8 13:14 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2017-12-8 13:19 | 显示全部楼层
这下Titan XP作为深度学习卡的价值大打折扣。
回复

使用道具 举报

     
发表于 2017-12-8 13:22 | 显示全部楼层
真jb牛逼。可惜买不起
回复

使用道具 举报

     
发表于 2017-12-8 13:24 | 显示全部楼层
回复

使用道具 举报

头像被屏蔽
     
发表于 2017-12-8 13:35 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2017-12-8 13:38 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2017-12-8 14:03 | 显示全部楼层
gtx480也是250w吧
回复

使用道具 举报

     
发表于 2017-12-8 15:14 来自手机 | 显示全部楼层
110T,是XP的9倍……老黄这挤牙膏也太用力了吧



—— 来自 Sony F5321, Android 7.1.1上的 S1Next-鹅版 v1.3.2.1-fix
回复

使用道具 举报

     
发表于 2017-12-8 15:15 | 显示全部楼层
9倍……可以叫泰坦-泰坦 了吧
回复

使用道具 举报

     
发表于 2017-12-8 15:17 | 显示全部楼层
不是9倍吧,对比的数据有问题。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2017-12-8 15:32 | 显示全部楼层
bilibon 发表于 2017-12-8 15:17
不是9倍吧,对比的数据有问题。

tensor performance 是比 half precision 稍微高明一点的东西
不过感觉都没什么用就对了 (?)
回复

使用道具 举报

     
发表于 2017-12-8 15:41 | 显示全部楼层
usernm 发表于 2017-12-8 15:32
tensor performance 是比 half precision 稍微高明一点的东西
不过感觉都没什么用就对了 (?) ...

据说深度学习用的。。。TXP看上去都没这个数据。。。反正不是微博里说的9倍那个数据。。。
回复

使用道具 举报

     
发表于 2017-12-8 15:43 | 显示全部楼层
bilibon 发表于 2017-12-8 15:17
不是9倍吧,对比的数据有问题。

同,明明就是110T的Tensor性能,却变成110T浮点性能了。
回复

使用道具 举报

     
发表于 2017-12-8 15:47 | 显示全部楼层
bilibon 发表于 2017-12-8 15:41
据说深度学习用的。。。TXP看上去都没这个数据。。。反正不是微博里说的9倍那个数据。。。 ...

tensor performance 是半精度乘和单精度加, 和半精度比没问题
回复

使用道具 举报

     
发表于 2017-12-8 15:57 来自手机 | 显示全部楼层
bilibon 发表于 2017-12-8 15:17
不是9倍吧,对比的数据有问题。

我就说嘛……110T,这是一下子挤了好几年的牙膏吧,进步幅度也太夸张了

—— 来自 Sony F5321, Android 7.1.1上的 S1Next-鹅版 v1.3.2.1-fix
回复

使用道具 举报

发表于 2017-12-8 15:59 | 显示全部楼层
usernm 发表于 2017-12-8 15:47
tensor performance 是半精度乘和单精度加, 和半精度比没问题

什么,tensor performance不是INT8吗
fp16+fp32怎么做到110TFLOPS的
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2017-12-8 16:42 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2017-12-8 17:04 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2017-12-8 17:07 | 显示全部楼层
本帖最后由 lwa190212 于 2017-12-8 17:08 编辑
66666 发表于 2017-12-8 16:42
GV100的int8单元是独立的,可以做int计算的同时做浮点

跟GP102构架完全不一样 ...

这个tensor performance的110TFLOPS是个什么类型的运算性能
咦等等,按道理TFLOPS本身就代表算的是浮点,用来表示int8会不会产生了偏差,几个运算库里我也没发现fp8的数据格式,还是说因为计量的是同时输出的int8和fp16/32总和
回复

使用道具 举报

头像被屏蔽
发表于 2017-12-8 17:12 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2017-12-8 17:18 | 显示全部楼层
宏 发表于 2017-12-8 17:12
双卡的话,连接桥卖599美元一个,还需要买两个显卡也能卖DLC了

这代运算卡搭上连接桥有什么加成吗,对cuda运算没什么帮助吧也没有显存同步的需要,看经费溢出的大佬们买一箱子titan也没人顺手买个连接桥的
回复

使用道具 举报

     
发表于 2017-12-8 17:44 来自手机 | 显示全部楼层
买这个卡用连接桥的人,连接桥再贵一倍也会买的。
而且要是多花20块成本把连接桥做酷炫点还会更高兴。
回复

使用道具 举报

头像被屏蔽
     
发表于 2017-12-8 18:10 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2017-12-8 18:24 | 显示全部楼层
本帖最后由 treexper 于 2017-12-8 18:27 编辑
lwa190212 发表于 2017-12-8 17:18
咦这代运算卡搭上连接桥有什么加成吗,对cuda运算没什么帮助吧也没有显存同步的需要,看经费溢出的 ...

这个是nvlink的桥,跟以前的弱鸡sli桥简直不是一个东西,可以做真的统一殉职。以前的sli装上也不能统一寻址,都是走pcie的,所以tesla都没sli。pcie是假寻址,都是先要镜像sync,cuda 8.0后代码层面可以直接managed memory,做个假的寻址体验,但性能基本没用。
回复

使用道具 举报

     
发表于 2017-12-8 18:32 来自手机 | 显示全部楼层
aws p3不是用的这个卡吗
用了快一个月了

—— 来自 samsung SM-G9350, Android 6.0.1上的 S1Next-鹅版 v1.3.2.1-fix-play
回复

使用道具 举报

     
发表于 2017-12-8 20:49 来自手机 | 显示全部楼层
消费级volta会支持什么新的视频解码协议吗?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-8-15 20:46 , Processed in 0.232705 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表