正在阅读:帕斯卡架构白皮书公布:NVIDIA要上天?帕斯卡架构白皮书公布:NVIDIA要上天?

2016-04-25 09:54 出处:PConline原创 作者:佚名 责任编辑:王志鹏1

  【PConline 资讯】近日,NVIDIA公布了一份帕斯卡架构白皮书,几乎公开了GP100核心与Tesla P100的各种规格。GP100是帕斯卡家族的旗舰核心,它采用台积电16nm FinFET工艺制造,集成了153亿个晶体管,比麦克斯韦GM200多了超过90%,核心面积达610平方毫米,只比28nm工艺的GM200大了区区9平方毫米,预计桌面上的GTX 1080 Ti、新版GTX Titan X也会使用它。

NVIDIA

  完整的GP100核心拥有60个SM(流式多处理器)单元,Tesla P100开启了其中的56个。每个SM单元内有64个FP32单精度CUDA核心(麦克斯韦、开普勒架构分别有128个、192个),总计3840个。每个SM单元分为两部分,每部分有32个FP32 CUDA核心、一个指令缓冲器、一个Warp调度器、两个分派单元。

NVIDIA

  GP100核心每个SM单元的CUDA与麦克斯韦架构拥有相同的寄存器文件尺寸(256KB),支持类似的Warp和线程模块。GP100核心的每个SM单元内还有32个FP64双精度CUDA核心,总计1920个,是单精度的1/2。另外,GP100核心还有统一的4096KB二级缓存,超过开普勒GK110 1536KB、麦克GM200 3702KB,可以减少对GPU DRAM的请求,从而降低整体功耗、内存带宽,提升性能。整个核心还配备了240个纹理单元。

NVIDIA

  Tesla P100计算卡搭配了4096-bit HBM2高带宽显存,容量16GB,热设计功耗300W。拥有3584个FP32单精度、1792个FP64双精度CUDA核心,核心基础频率1328MHz,加速频率高达1480MHz,峰值单精度性能10600GFlops,比起上代提升了足足55%,而双精度性能也达到了5300GFlops,是开普勒架构的3.2倍,更是麦克斯韦架构的25.2倍。至于我们何时能迎来GP100核心新品,尚待官方公布。

NVIDIA

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
热门排行

笔记本论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品