NVIDIA A40 GPU 可使數(shù)據(jù)中心的性能和多工作負(fù)載能力獲得進(jìn)化式飛躍。它集優(yōu)秀的專業(yè)圖形性能與強大的計算和 AI 加速能力于一體,可應(yīng)對當(dāng)今的設(shè)計、創(chuàng)意和科學(xué)挑戰(zhàn)。NVIDIA A40 能驅(qū)動新一代虛擬工作站和基于服務(wù)器的工作負(fù)載,并隨時隨地為專業(yè)人士提供光線追蹤渲染、模擬、虛擬制作等領(lǐng)域的先進(jìn)功能。
NVIDIA? A40 提供基于數(shù)據(jù)中心的解決方案,可滿足設(shè)計師、工程師、藝術(shù)家和科學(xué)家所需,助其攻克當(dāng)今面臨的挑戰(zhàn)。A40 依托于 NVIDIA Ampere 架構(gòu)而構(gòu)建,將新一代 RT Core、Tensor Core、CUDA? Core 與 48GB 顯存融于一身,可提供遠(yuǎn)超以往的圖形處理、渲染、計算和 AI 性能。從隨時隨地可供訪問的強大虛擬工作站,到專用渲染節(jié)點,A40 旨在處理數(shù)據(jù)中心中要求非常嚴(yán)苛的視覺計算工作負(fù)載。
速度提升一倍的單精度浮點 (FP32) 運算處理和改善的能效可顯著提高圖形和模擬工作流程的性能,例如復(fù)雜的 3D 計算機輔助設(shè)計 (CAD) 和計算機輔助工程 (CAE)。
單個 NVIDIA A40 主板能夠憑借對陰影、反射和折射物理屬性的準(zhǔn)確把握,渲染復(fù)雜的專業(yè)模型,從而為用戶提供即時見解?;?NVIDIA A40 的服務(wù)器可與 NVIDIA OptiX、Microsoft DXR 和 Vulkan 光線追蹤等利用 API 的應(yīng)用配合使用,助力真正的交互式設(shè)計工作流程,繼而提供即時反饋,以實現(xiàn)前所未有的超高生產(chǎn)效率。NVIDIA A40 的可將光線追蹤的運行速度提升至前一代的兩倍。
與前一代相比,第三代 Tensor Core 可借助全新的 Tensor Float 32 (TF32) 精度,提供高達(dá)五倍的訓(xùn)練吞吐量,還可運用結(jié)構(gòu)化稀疏技術(shù),提供高達(dá)十倍的推理吞吐量,且無需更改任何代碼。這縮短了 AI 模型訓(xùn)練或數(shù)據(jù)科學(xué)數(shù)據(jù)準(zhǔn)備和建模工作流程所需的時間。支持結(jié)構(gòu)化稀疏技術(shù)的硬件會通過壓縮網(wǎng)絡(luò)模型的大小并加快模型執(zhí)行,進(jìn)一步提升速度。新一代 Tensor Core 還支持腦浮點格式 (BFloat16)。
A40 具有一個視頻編碼引擎和兩個解碼引擎,能夠提供對 AV1 解碼的支持,同時具有多流視頻應(yīng)用所需的性能,可用于提供安全與視頻服務(wù)。
A40 支持 PCI Express 4.0 (PCIe 4.0),可將 PCIe 3.0 x16 連接的帶寬從 15.75 Gb/s 提高到 31.5 Gb/s,從而提高了數(shù)據(jù)密集型任務(wù)(如 AI 和數(shù)據(jù)科學(xué))中 CPU 內(nèi)存的數(shù)據(jù)傳輸速度,同時可從大型數(shù)據(jù)集中創(chuàng)建 3D 模型。更快的 PCIe 性能還加速了 GPU 直接顯存訪問 (DMA) 傳輸,從而能讓支持視頻的設(shè)備通過 GPUDirect? 更快速地傳輸視頻數(shù)據(jù),并利用 GPUDirect Storage 加快輸入/輸出 (I/O) 速度。
NVIDIA A40 的能效是前一代的兩倍,且可兼容全球 OEM 供應(yīng)商生產(chǎn)的各式服務(wù)器。
A40 擁有 48GB 的 GDDR6 顯存。用戶可借助第三代 NVLink 技術(shù)連接兩塊 A40 顯卡,獲得高達(dá) 96GB 的組合顯存,以滿足渲染、數(shù)據(jù)科學(xué)、工程仿真和其他 GPU 內(nèi)存密集型工作負(fù)載所需的內(nèi)存需求。
A40 與 NVIDIA 虛擬 GPU (vGPU) 軟件相結(jié)合,助力遠(yuǎn)程用戶打造規(guī)模更大、功能更強的虛擬化工作站實例,可用于高端設(shè)計、AI 和計算工作負(fù)載的較大工作流程。NVIDIA vGPU 支持訪問虛擬工作站,并可助力用戶實現(xiàn)可隨處施行的靈活解決方案。
支持最新的高分辨率頭戴式顯示 (HMD)設(shè)備、高性能圖形和 48GB 的較大 GPU 顯存,能夠創(chuàng)建出令人驚嘆的沉浸式增強現(xiàn)實 (AR) 和虛擬現(xiàn)實 (VR) 體驗,可在訓(xùn)練、產(chǎn)品驗證、搭建場景和引人入勝的娛樂活動中加以應(yīng)用。
硬件加速的動態(tài)模糊渲染(一種難以渲染的常見電影效果),意味著藝術(shù)家不再需要依靠動態(tài)矢量這種傳統(tǒng)方法來實現(xiàn)動態(tài)模糊。盡管藝術(shù)家可以借助動態(tài)矢量靈活地調(diào)整后期的動態(tài)模糊,但卻需要對反射和半透明進(jìn)行視覺修復(fù)。
由 AI支持的實時圖像超分辨率可提高設(shè)計和可視化應(yīng)用的交互能力和幀速率。用戶可借助 DLSS 以較低的分辨率進(jìn)行實時引擎渲染,并能在始終保持畫質(zhì)清晰的情況下,采用 AI 技術(shù),輸出分辨率較高的內(nèi)容。
通過 NVLink 連接兩塊 NVIDIA A40 顯卡,即可以高達(dá) 112.5 GB/s(總帶寬)的速度在 GPU 之間傳輸數(shù)據(jù),從而將有效顯存占用提升一倍并實現(xiàn)應(yīng)用性能的擴(kuò)展。
能夠憑借無損計算精度與可靠性,滿足對任務(wù)關(guān)鍵型應(yīng)用的嚴(yán)苛數(shù)據(jù)完整性要求。
NVDEC 非常適用于實時解碼的轉(zhuǎn)碼和視頻播放應(yīng)用。支持用戶使用以下視頻編解碼器進(jìn)行硬件加速解碼:MPEG-2、VC-1、H.264 (AVCHD)、H.265 (HEVC)、VP8、VP9 和 AV1。將此項技術(shù)與 Ampere Tensor Core 結(jié)合使用后,A40 可快速地將 AI 和推理應(yīng)用到實時視頻之中。
NVENC 可處理要求十分嚴(yán)苛的 4K 或 8K 視頻編碼任務(wù),從而釋放圖形引擎和 CPU 來執(zhí)行其他操作。NVENC 還支持虛擬工作站以流式方式傳輸 8K 內(nèi)容,以處理高保真設(shè)計和渲染工作負(fù)載。此外,與基于軟件的 x264 編碼器相比,NVIDIA A40 的編碼質(zhì)量更勝一籌。
NVIDIA A40 采用雙插槽、高能效設(shè)計,與上一代相比能效提升 2 倍,這點已經(jīng)過全球 OEM 出品的各種 NVIDIA 認(rèn)證系統(tǒng)的驗證。NVIDIA A40 還通過硬件可信根功能進(jìn)行安全的測量式引導(dǎo),確保固件未被篡改或損壞。
指令級先占可實現(xiàn)對計算和圖形任務(wù)的更精細(xì)控制,以防長時間運行的應(yīng)用獨占系統(tǒng)資源或超時。
NVIDIA ? NVLink ? 112.5 GB/s (雙向) PCIe 4.0 31.5 GB/s(雙向)
使用 FP16 累加的 FP16 Tensor TFLOPS 峰值
74.8| 149.6*
使用 FP32 累加的 BF16 Tensor TFLOPS 峰值
INT8 Tensor TOPS 峰值
INT4 Tensor TOPS 峰值
299.3| 598.6*
598.7 | 1197.4*
3 個 DisplayPort 1.4**;支持 NVIDIA Mosaic 和 Quadro ? Sync 4
300 W
NVIDIA vPC/vApp、NVIDIA RTX 虛擬工作站、NVIDIA 虛擬計算服務(wù)器
您的電子郵件地址不會被公開,必填項已用 * 標(biāo)注。
提交評論
Δ
? ? ? ? ? ? ? ?Copyright 2020-2026 同袍存儲 粵ICP備2021121885號網(wǎng)站地圖