英偉達(dá)A40視覺計算負(fù)載虛擬工作站顯卡

分類：計算加速卡
|
發(fā)布日期：2022年1月5日下午2:17

NVIDIA A40 GPU 可使數(shù)據(jù)中心的性能和多工作負(fù)載能力獲得進(jìn)化式飛躍。它集優(yōu)秀的專業(yè)圖形性能與強大的計算和 AI 加速能力于一體，可應(yīng)對當(dāng)今的設(shè)計、創(chuàng)意和科學(xué)挑戰(zhàn)。NVIDIA A40 能驅(qū)動新一代虛擬工作站和基于服務(wù)器的工作負(fù)載，并隨時隨地為專業(yè)人士提供光線追蹤渲染、模擬、虛擬制作等領(lǐng)域的先進(jìn)功能。

毛重：1.5kg
質(zhì)保期：3年質(zhì)保
CUDA核心： 10752
顯存： 48 GB GDDR6
單精度： 37.4 TFLOPS
參考價格：36000.00元
采購報價聯(lián)系：18681551725

產(chǎn)品詳情

NVIDIA? A40 提供基于數(shù)據(jù)中心的解決方案，可滿足設(shè)計師、工程師、藝術(shù)家和科學(xué)家所需，助其攻克當(dāng)今面臨的挑戰(zhàn)。A40 依托于 NVIDIA Ampere 架構(gòu)而構(gòu)建，將新一代 RT Core、Tensor Core、CUDA? Core 與 48GB 顯存融于一身，可提供遠(yuǎn)超以往的圖形處理、渲染、計算和 AI 性能。從隨時隨地可供訪問的強大虛擬工作站，到專用渲染節(jié)點，A40 旨在處理數(shù)據(jù)中心中要求非常嚴(yán)苛的視覺計算工作負(fù)載。

A40全新亮點

1、NVIDIA Ampere 架構(gòu) CUDA? 核心

速度提升一倍的單精度浮點 (FP32) 運算處理和改善的能效可顯著提高圖形和模擬工作流程的性能，例如復(fù)雜的 3D 計算機輔助設(shè)計 (CAD) 和計算機輔助工程 (CAE)。

2、第二代RT Core

單個 NVIDIA A40 主板能夠憑借對陰影、反射和折射物理屬性的準(zhǔn)確把握，渲染復(fù)雜的專業(yè)模型，從而為用戶提供即時見解?；?NVIDIA A40 的服務(wù)器可與 NVIDIA OptiX、Microsoft DXR 和 Vulkan 光線追蹤等利用 API 的應(yīng)用配合使用，助力真正的交互式設(shè)計工作流程，繼而提供即時反饋，以實現(xiàn)前所未有的超高生產(chǎn)效率。NVIDIA A40 的可將光線追蹤的運行速度提升至前一代的兩倍。

3、第三代Tensor Core

與前一代相比，第三代 Tensor Core 可借助全新的 Tensor Float 32 (TF32) 精度，提供高達(dá)五倍的訓(xùn)練吞吐量，還可運用結(jié)構(gòu)化稀疏技術(shù)，提供高達(dá)十倍的推理吞吐量，且無需更改任何代碼。這縮短了 AI 模型訓(xùn)練或數(shù)據(jù)科學(xué)數(shù)據(jù)準(zhǔn)備和建模工作流程所需的時間。支持結(jié)構(gòu)化稀疏技術(shù)的硬件會通過壓縮網(wǎng)絡(luò)模型的大小并加快模型執(zhí)行，進(jìn)一步提升速度。新一代 Tensor Core 還支持腦浮點格式 (BFloat16)。

4、編碼或解碼引擎

A40 具有一個視頻編碼引擎和兩個解碼引擎，能夠提供對 AV1 解碼的支持，同時具有多流視頻應(yīng)用所需的性能，可用于提供安全與視頻服務(wù)。

5、PCIe 4.0

A40 支持 PCI Express 4.0 (PCIe 4.0)，可將 PCIe 3.0 x16 連接的帶寬從 15.75 Gb/s 提高到 31.5 Gb/s，從而提高了數(shù)據(jù)密集型任務(wù)(如 AI 和數(shù)據(jù)科學(xué))中 CPU 內(nèi)存的數(shù)據(jù)傳輸速度，同時可從大型數(shù)據(jù)集中創(chuàng)建 3D 模型。更快的 PCIe 性能還加速了 GPU 直接顯存訪問 (DMA) 傳輸，從而能讓支持視頻的設(shè)備通過 GPUDirect? 更快速地傳輸視頻數(shù)據(jù)，并利用 GPUDirect Storage 加快輸入/輸出 (I/O) 速度。

6、節(jié)能高效的雙插槽設(shè)計

NVIDIA A40 的能效是前一代的兩倍，且可兼容全球 OEM 供應(yīng)商生產(chǎn)的各式服務(wù)器。

7、48GB 的高速 GDDR6 顯存

A40 擁有 48GB 的 GDDR6 顯存。用戶可借助第三代 NVLink 技術(shù)連接兩塊 A40 顯卡，獲得高達(dá) 96GB 的組合顯存，以滿足渲染、數(shù)據(jù)科學(xué)、工程仿真和其他 GPU 內(nèi)存密集型工作負(fù)載所需的內(nèi)存需求。

8、虛擬化就緒

A40 與 NVIDIA 虛擬 GPU (vGPU) 軟件相結(jié)合，助力遠(yuǎn)程用戶打造規(guī)模更大、功能更強的虛擬化工作站實例，可用于高端設(shè)計、AI 和計算工作負(fù)載的較大工作流程。NVIDIA vGPU 支持訪問虛擬工作站，并可助力用戶實現(xiàn)可隨處施行的靈活解決方案。

9、AR/VR

支持最新的高分辨率頭戴式顯示 (HMD)設(shè)備、高性能圖形和 48GB 的較大 GPU 顯存，能夠創(chuàng)建出令人驚嘆的沉浸式增強現(xiàn)實 (AR) 和虛擬現(xiàn)實 (VR) 體驗，可在訓(xùn)練、產(chǎn)品驗證、搭建場景和引人入勝的娛樂活動中加以應(yīng)用。

10、動態(tài) BVH(層次包圍盒)

硬件加速的動態(tài)模糊渲染(一種難以渲染的常見電影效果)，意味著藝術(shù)家不再需要依靠動態(tài)矢量這種傳統(tǒng)方法來實現(xiàn)動態(tài)模糊。盡管藝術(shù)家可以借助動態(tài)矢量靈活地調(diào)整后期的動態(tài)模糊，但卻需要對反射和半透明進(jìn)行視覺修復(fù)。

11、NVIDIA 深度學(xué)習(xí)超級采樣 (DLSS)

由 AI支持的實時圖像超分辨率可提高設(shè)計和可視化應(yīng)用的交互能力和幀速率。用戶可借助 DLSS 以較低的分辨率進(jìn)行實時引擎渲染，并能在始終保持畫質(zhì)清晰的情況下，采用 AI 技術(shù)，輸出分辨率較高的內(nèi)容。

其他性能特點

1、第三代 NVIDIA? NVLink——多GPU技術(shù)

通過 NVLink 連接兩塊 NVIDIA A40 顯卡，即可以高達(dá) 112.5 GB/s(總帶寬)的速度在 GPU 之間傳輸數(shù)據(jù)，從而將有效顯存占用提升一倍并實現(xiàn)應(yīng)用性能的擴(kuò)展。

2、顯存糾錯碼 (ECC)

能夠憑借無損計算精度與可靠性，滿足對任務(wù)關(guān)鍵型應(yīng)用的嚴(yán)苛數(shù)據(jù)完整性要求。

3、第五代 NVDEC 引擎

NVDEC 非常適用于實時解碼的轉(zhuǎn)碼和視頻播放應(yīng)用。支持用戶使用以下視頻編解碼器進(jìn)行硬件加速解碼：MPEG-2、VC-1、H.264 (AVCHD)、H.265 (HEVC)、VP8、VP9 和 AV1。將此項技術(shù)與 Ampere Tensor Core 結(jié)合使用后，A40 可快速地將 AI 和推理應(yīng)用到實時視頻之中。

4、第七代 NVENC 引擎

NVENC 可處理要求十分嚴(yán)苛的 4K 或 8K 視頻編碼任務(wù)，從而釋放圖形引擎和 CPU 來執(zhí)行其他操作。NVENC 還支持虛擬工作站以流式方式傳輸 8K 內(nèi)容，以處理高保真設(shè)計和渲染工作負(fù)載。此外，與基于軟件的 x264 編碼器相比，NVIDIA A40 的編碼質(zhì)量更勝一籌。

5、數(shù)據(jù)中心效率和安全性

NVIDIA A40 采用雙插槽、高能效設(shè)計，與上一代相比能效提升 2 倍，這點已經(jīng)過全球 OEM 出品的各種 NVIDIA 認(rèn)證系統(tǒng)的驗證。NVIDIA A40 還通過硬件可信根功能進(jìn)行安全的測量式引導(dǎo)，確保固件未被篡改或損壞。

6、先占

指令級先占可實現(xiàn)對計算和圖形任務(wù)的更精細(xì)控制，以防長時間運行的應(yīng)用獨占系統(tǒng)資源或超時。

A40 GPU參數(shù)

Nvidia A40
GPU架構(gòu)	NVIDIA Ampere 架構(gòu)
GPU顯存	帶有 ECC 的 48 GB GDDR6
顯存帶寬	696 GB/秒
互聯(lián)接口	NVIDIA ? NVLink ? 112.5 GB/s (雙向) PCIe 4.0 31.5 GB/s（雙向）
基于 NVIDIA Ampere 架構(gòu)的 CUDA 核心	10752
NVIDIA 第二代 RT Core	84
NVIDIA 第三代 Tensor Core	336
FP32 TFLOPS 峰值 (非 Tensor)	37.4
使用 FP16 累加的 FP16 Tensor TFLOPS 峰值	149.7\| 299.4*
TF32 Tensor TFLOPS 峰值	74.8\| 149.6*
RT Core 性能 TFLOPS	73.1
使用 FP32 累加的 BF16 Tensor TFLOPS 峰值	149.7\| 299.4*
INT8 Tensor TOPS 峰值 INT4 Tensor TOPS 峰值	299.3\| 598.6* 598.7 \| 1197.4*
外形規(guī)格	4.4″（高）x 10.5″（長）雙插槽
顯示端口	3 個 DisplayPort 1.4**；支持 NVIDIA Mosaic 和 Quadro ? Sync 4
最大功耗	300 W
散熱解決方案	被動式
虛擬 GPU (vGPU) 軟件支持	NVIDIA vPC/vApp、NVIDIA RTX 虛擬工作站、NVIDIA 虛擬計算服務(wù)器

上一篇：英偉達(dá)Tesla A30 24G深度學(xué)習(xí)加速顯卡下一篇：Tesla A16 16G*4英偉達(dá)桌面虛擬化顯卡

英偉達(dá)A40視覺計算負(fù)載虛擬工作站顯卡

產(chǎn)品詳情

A40全新亮點

1、NVIDIA Ampere 架構(gòu) CUDA? 核心

2、第二代RT Core

3、第三代Tensor Core

4、編碼或解碼引擎

5、PCIe 4.0

6、節(jié)能高效的雙插槽設(shè)計

7、48GB 的高速 GDDR6 顯存

8、虛擬化就緒

9、AR/VR

10、動態(tài) BVH(層次包圍盒)

11、NVIDIA 深度學(xué)習(xí)超級采樣 (DLSS)

其他性能特點

1、第三代 NVIDIA? NVLink——多GPU技術(shù)

2、顯存糾錯碼 (ECC)

3、第五代 NVDEC 引擎

4、第七代 NVENC 引擎

5、數(shù)據(jù)中心效率和安全性

6、先占