NVIDIA Titan V宣布 - 售价3000美元的Juggernaut拥有5120个CUDA内核,12 GB HBM2 VRAM和全面的12nm Volta GPU架构
NVIDIA Titan V图形卡采用最新的12纳米Volta GPU架构,因此融入了NVIDIA所提供的最新技术。在Titan家族中,GPU将瞄准消费者市场,因此,你可以期待一个非常高的价格,因为这个坏男孩将花费3000美元。
NVIDIA技术的GeForce- 泰坦XP-星战 - 收藏版 - 银河 - 帝国照片-001
相关
NVIDIA的离散GPU市场份额在2017年第三季度攀升至72.8%,AMD的份额从30%下降至27% - 个人电脑游戏需求在AIB出货量上升
通过NVIDIA创始人兼CEO詹森黄在每年公布NIPS conferen CE,TITAN V擅长的科学模拟计算处理。其211亿个晶体管提供了110 teraflops的原始马力,是其前身的9倍,并且具有极高的能源效率。
“我们对沃尔的看法是推动高性能计算和人工智能的外部极限。我们用新的处理器架构,指令,数字格式,存储器架构和处理器链接打破了新的局面。“用TITAN V,我们把沃尔特放到了世界各地的研究人员和科学家手中。我迫不及待地想看到他们突破性的发现。”通过NVIDIA
作为回报,您不仅可以获得令人敬畏的全新Volta GPU架构“GV100”,买家还可以获得12 GB的HBM2内存。是的,这是第一个Titan显卡,也是第一个采用HBM2内存的NVIDIA显卡(Non Quadro / Non Tesla)系列。
gameworks访谈白
英伟达™(NVIDIA®)GameWorks的
相关
Rev Lebaredian以及它将如何帮助民主化游戏开发
NVIDIA Titan V基于GV100 GPU架构,共有5120个CUDA内核和320个纹理单元。这与Tesla V100的核心数量完全相同。除了常规内核外,该卡还在Volta GPU内部封装了640个Tensor Cores。这些都是为了最大限度地提高深度学习性能,因为该卡可以减少高达110 TFLOP的GPU性能的AI相关算法。整个内核的时钟频率为1200 MHz,提升频率为1455 MHz。即使有这么多的规格,该卡只需要一个8和6针电源连接器配置引导,并进入一个250W的封装。
所以来到HBM2 VRAM,是的,显卡上有12 GB的内存,并且在3072位内存总线上有1.7 Gbps的数据速率。这使得卡的总带宽为652.8 GB / s,比之前的Titan XP要快。与Tesla V100相比,我们正在寻求一个降低总线接口(4096位和3072位),同时也降低了12GB的VRAM,而该板上的16GB。总的来说,这款显卡可以用于专业和常规的工作负载,比如游戏,而且这种卡打包的方式很有意思。
只要用得上tensor core就可以买,毕竟9倍性能。 这下Titan XP作为深度学习卡的价值大打折扣。 真jb牛逼。可惜买不起 250w tdp
-- 来自 能搜索的 Stage1官方 iOS客户端 gtx480也是250w吧 110T,是XP的9倍……老黄这挤牙膏也太用力了吧
—— 来自 Sony F5321, Android 7.1.1上的 S1Next-鹅版 v1.3.2.1-fix 9倍……可以叫泰坦-泰坦 了吧 不是9倍吧,对比的数据有问题。
bilibon 发表于 2017-12-8 15:17
不是9倍吧,对比的数据有问题。
tensor performance 是比 half precision 稍微高明一点的东西
不过感觉都没什么用就对了 (?) usernm 发表于 2017-12-8 15:32
tensor performance 是比 half precision 稍微高明一点的东西
不过感觉都没什么用就对了 (?) ...
据说深度学习用的。。。TXP看上去都没这个数据。。。反正不是微博里说的9倍那个数据。。。 bilibon 发表于 2017-12-8 15:17
不是9倍吧,对比的数据有问题。
同,明明就是110T的Tensor性能,却变成110T浮点性能了。 bilibon 发表于 2017-12-8 15:41
据说深度学习用的。。。TXP看上去都没这个数据。。。反正不是微博里说的9倍那个数据。。。 ...
tensor performance 是半精度乘和单精度加, 和半精度比没问题 bilibon 发表于 2017-12-8 15:17
不是9倍吧,对比的数据有问题。
我就说嘛……110T,这是一下子挤了好几年的牙膏吧,进步幅度也太夸张了
—— 来自 Sony F5321, Android 7.1.1上的 S1Next-鹅版 v1.3.2.1-fix usernm 发表于 2017-12-8 15:47
tensor performance 是半精度乘和单精度加, 和半精度比没问题
什么,tensor performance不是INT8吗
fp16+fp32怎么做到110TFLOPS的 本帖最后由 lwa190212 于 2017-12-8 17:08 编辑
66666 发表于 2017-12-8 16:42
GV100的int8单元是独立的,可以做int计算的同时做浮点
跟GP102构架完全不一样 ...
这个tensor performance的110TFLOPS是个什么类型的运算性能
咦等等,按道理TFLOPS本身就代表算的是浮点,用来表示int8会不会产生了偏差,几个运算库里我也没发现fp8的数据格式,还是说因为计量的是同时输出的int8和fp16/32总和 宏 发表于 2017-12-8 17:12
双卡的话,连接桥卖599美元一个,还需要买两个显卡也能卖DLC了
咦这代运算卡搭上连接桥有什么加成吗,对cuda运算没什么帮助吧也没有显存同步的需要,看经费溢出的大佬们买一箱子titan也没人顺手买个连接桥的 买这个卡用连接桥的人,连接桥再贵一倍也会买的。
而且要是多花20块成本把连接桥做酷炫点还会更高兴。 本帖最后由 treexper 于 2017-12-8 18:27 编辑
lwa190212 发表于 2017-12-8 17:18
咦这代运算卡搭上连接桥有什么加成吗,对cuda运算没什么帮助吧也没有显存同步的需要,看经费溢出的 ...
这个是nvlink的桥,跟以前的弱鸡sli桥简直不是一个东西,可以做真的统一殉职。以前的sli装上也不能统一寻址,都是走pcie的,所以tesla都没sli。pcie是假寻址,都是先要镜像sync,cuda 8.0后代码层面可以直接managed memory,做个假的寻址体验,但性能基本没用。 aws p3不是用的这个卡吗
用了快一个月了
—— 来自 samsung SM-G9350, Android 6.0.1上的 S1Next-鹅版 v1.3.2.1-fix-play 消费级volta会支持什么新的视频解码协议吗?
页:
[1]