吹牛:
GP100核心是目前基于16nm FinFET工艺打造的最大的GPU核心,面积达到了610平方毫米,150亿颗晶体管(之前传言是170亿),16GB HBM2显存,带宽可达到720GB/s(很遗憾没到1TB/s)。
双精度运算能力是5.3Teraflops,单精度为10.6Teraflops(AMD双芯Radeon Pro Duo是16 TeraFLOPs)。
要知道,上一代麦克斯韦架构的大核心GM200,单精度只有7TFlops,双精度更是区区0.2TFlops,这次提升非常猛。
GP100核心内建3840个CUDA核心(集成在6个显卡运算丛集中)、240个纹理单元、最高32GB HBM2显存、位宽4096bit。
实况:
1、质变,SM从24到了56,没错就是上一代乘以2,也就48个,这就是老黄口中的质变。但这个质变后距离质变之前量变有多少呢?单精度单元3584-3072=512,双精度单元1792-96=1696
2、性能提升,单精度由7到10.6,双精度由0.2到5.3。这是什么鬼?把次要的带宽提升忽略掉,原来核心频率从948到了1328,提升了40%。那么问题来了7x1.4=9.8,看到没有即便不增加单精度单元也够数了。那么少了一部分的西墙去哪了?补到双精度的东墙上去了!
3、显存位宽,从原来384到HBM2的4096,但是带宽却没有上到1TB/S
结论:
N粉已经萎了!
段子:
某天早上
秘书:黄总该刷牙了,放多少牙膏
黄:放三分之一就够了,省着点用,学学i家怎么挤的,别浪费。
秘书:万一A货的膏药有10cm厚,咱的不就太少了吗?
黄:别担心,夏天马上来了,傻粉肯定嫌厚膏药热!
秘书:那n粉怎么办?
黄:没事,我们的n粉够“自信”,还够多!
秘书:已经挤好了,黄总请用。
刷完牙后黄总自信满满来到了GTC2016会场。。。
谁把本年度奖品发到老黄手里?
GP100核心是目前基于16nm FinFET工艺打造的最大的GPU核心,面积达到了610平方毫米,150亿颗晶体管(之前传言是170亿),16GB HBM2显存,带宽可达到720GB/s(很遗憾没到1TB/s)。
双精度运算能力是5.3Teraflops,单精度为10.6Teraflops(AMD双芯Radeon Pro Duo是16 TeraFLOPs)。
要知道,上一代麦克斯韦架构的大核心GM200,单精度只有7TFlops,双精度更是区区0.2TFlops,这次提升非常猛。
GP100核心内建3840个CUDA核心(集成在6个显卡运算丛集中)、240个纹理单元、最高32GB HBM2显存、位宽4096bit。
实况:
1、质变,SM从24到了56,没错就是上一代乘以2,也就48个,这就是老黄口中的质变。但这个质变后距离质变之前量变有多少呢?单精度单元3584-3072=512,双精度单元1792-96=1696
2、性能提升,单精度由7到10.6,双精度由0.2到5.3。这是什么鬼?把次要的带宽提升忽略掉,原来核心频率从948到了1328,提升了40%。那么问题来了7x1.4=9.8,看到没有即便不增加单精度单元也够数了。那么少了一部分的西墙去哪了?补到双精度的东墙上去了!
3、显存位宽,从原来384到HBM2的4096,但是带宽却没有上到1TB/S
结论:
N粉已经萎了!
段子:
某天早上
秘书:黄总该刷牙了,放多少牙膏
黄:放三分之一就够了,省着点用,学学i家怎么挤的,别浪费。
秘书:万一A货的膏药有10cm厚,咱的不就太少了吗?
黄:别担心,夏天马上来了,傻粉肯定嫌厚膏药热!
秘书:那n粉怎么办?
黄:没事,我们的n粉够“自信”,还够多!
秘书:已经挤好了,黄总请用。
刷完牙后黄总自信满满来到了GTC2016会场。。。
谁把本年度奖品发到老黄手里?