核心頻率:1304 MHz
Turbo頻率:1442 MHz
流處理單元:3584 個(gè)
核心架構(gòu):Pascal
GPU代號(hào):GP100
生產(chǎn)工藝:16 nm
TDP功耗:235W
內(nèi)存頻率:1430 Mbps
內(nèi)存類型:HBM2
內(nèi)存位寬:4096 bit
最大顯存:16 GB
晶體管數(shù)量:15,300 million
代工廠:TSMC
核心面積:610 mm2
一級(jí)緩存:24 KB
二級(jí)緩存:4 MB
光柵單元:224
紋理單元:96
SM count:56
建議電源:550 W
公版供電:1x 8-pin
公版接口:1x DVI4x DisplayPort
總線接口:PCIe 3.0 x16
像素填充率:138.4 GPixel/s
紋理填充率:323.0 GTexel/s
顯存帶寬:732.2 GB/s
FP16:20.67 TFLOPS (2:1)
FP32:10.34 TFLOPS
FP64:5.168 TFLOPS (1:2)
DirectX:12 (12_1)
OpenGL:4.6
OpenCL:3.0
Vulkan:1.2
CUDA:6.0
Shader model:6.4
GP100容易讓人誤會(huì),它并非是核心名,而品名就是Quadro GP100,作為這一家族的旗艦登場(chǎng)。Quadro GP100基于Pascal核心,單精度CUDA 3584個(gè),雙精度CUDA 1792個(gè),半精/單精/雙精浮點(diǎn)運(yùn)算性能分別是20.7T、10.3T和5.2T,匹配16GB HBM2顯存,帶寬高達(dá)717GB/s,功耗235W。
GP100 提供超過(guò) 20 TFLOPS 的半精度計(jì)算,可謂在 Windows 和 Linux 環(huán)境中進(jìn)行深度學(xué)習(xí)的理想開(kāi)發(fā)平臺(tái)。
GP100是帕斯卡家族的旗艦核心,預(yù)計(jì)桌面上的GTX 1080 Ti、新版GTX Titan X也會(huì)使用它。
它采用臺(tái)積電16nm FinFET工藝制造,集成了153億個(gè)晶體管,比麥克斯韋GM200多了超過(guò)90%,核心面積達(dá)610平方毫米,只比28nm工藝的GM200大了區(qū)區(qū)9平方毫米。
完整的GP100核心擁有60個(gè)SM(流式多處理器)單元,Tesla P100只開(kāi)啟了其中的56個(gè)。每個(gè)SM單元內(nèi)有64個(gè)FP32單精度CUDA核心(麥克斯韋、開(kāi)普勒架構(gòu)分別有128個(gè)、192個(gè)),總計(jì)3840個(gè)。
每個(gè)SM單元分為兩部分,每部分有32個(gè)FP32 CUDA核心、一個(gè)指令緩沖器、一個(gè)Warp調(diào)度器、兩個(gè)分派單元。
GP100核心每個(gè)SM單元的CUDA核心數(shù)量雖然只有麥克斯韋架構(gòu)的一半,但是擁有相同的寄存器文件尺寸(256KB),支持類似的Warp和線程模塊。
GP100核心的每個(gè)SM單元內(nèi)還有32個(gè)FP64雙精度CUDA核心,總計(jì)1920個(gè),是單精度的1/2,這種比例可以更好地配合GP100核心新的數(shù)據(jù)路徑配置,更高效地處理雙精度負(fù)載。
GP100核心還有統(tǒng)一的4096KB二級(jí)緩存,超過(guò)開(kāi)普勒GK110 1536KB、麥克GM200 3702KB,可以減少對(duì)GPU DRAM的請(qǐng)求,從而降低整體功耗、內(nèi)存帶寬,提升性能。
整個(gè)核心還配備了240個(gè)紋理單元。
? ? ? ? ? ? ? ?Copyright 2020-2026 同袍存儲(chǔ) 粵ICP備2021121885號(hào)網(wǎng)站地圖