當今市場上數據中心 GPU 中的精尖之作
歡迎進入人工智能時代
各行各業都希望實現智能化,不斷擴張的數據海洋中暗藏著可推動行業變革的真滴。無論是個性化癌癥治療方案、預測下一場颶風,還是能自如交談的虛擬助手。只要數據科學家得到實現其畢生事業所需的工具,這些機遇即可變為現實。
NVIDIA? Tesla? V100(點擊查看產品手冊) 是當今市場上機器先進的數據中心GPU,能加快人工智能、高性能和圖形技術的發展。Tesla V100采用新一代GPU架構(即NVIDIA Volta?),可在一個GPU中提供100個CPU的性能,讓數據科學家、研究人員和工程師能夠解決以前無法解決的難題。
人工智能訓練
從語音識別到訓練虛擬個人助理和教會自動駕駛汽車自動駕駛,數據科學家們正利用人工智能解決日益復雜的挑戰。解決此類問題需要花大量時間密集訓練復雜性飛速增長的深度學習模型。
Tesla V100 擁有640個Tensor內核,是世界上第一個突破100萬億次(TFLOPS)深度學習性格障礙的GPU。新一代NVIDIA NVLink?以高達300GB/s的速度鏈接多個V100 GPU。
以全球打造出功能及其強大的計算服務器?,F在,在之前的系統中需要消耗數周計算資源的人工智能模型在幾天內就可以完成訓練。隨著訓練時間的大幅縮短,人工智能現在可以解決各類新型問題。
以全球打造出功能及其強大的計算服務器?,F在,在之前的系統中需要消耗數周計算資源的人工智能模型在幾天內就可以完成訓練。隨著訓練時間的大幅縮短,人工智能現在可以解決各類新型問題。
人工智能推理
為了利用最相關的信息、服務和產品加強人與人之間的聯系,超大規模計算公司已經開始采用人工智能。然而,及時滿足用戶需求是一項困難的挑戰。例如,全球最大的超大規模計算公司最近估計,如果每個用戶一天僅花費三分鐘時間使用其語音識別服務,他們便需要將數據中心的容量翻倍。
我們設計Tesla V100就是為了在現有的超大規模服務器機架上提供更高的性能。由于將人工智能作為核心,Tesla V100 GPU可提供比CPU服務器高30倍的推力性能。這種吞吐量和效率的大幅提升將使人工智能服務的擴展變成現實。
![]() |
高性能計算(HPC)
高性能計算是現代科學的基石。從天氣預報到發現藥物和發現新能源,研究人員使用大型計算系統來模擬和預測我們的世界。
人工智能可讓研究人員分析大量數據,在僅憑模擬無法完全預測真實世界的情況下快速獲取見解,從而擴展了傳統的高性能計算。
Tesla V100的設計能夠融合人工智能和高性能計算。它為高性能計算系統提供了一個平臺,在用于科學模擬的計算機科學和用于在數據中發現見解的數據科學方面表現優異。 通過在一個統一架構內搭配使用NVIDIA CUDA? 內核和Tensor內核,配備Tesla V100 GPU的單臺服務器可以取代數百臺僅配備通用CPU的服務器來處理傳統的高性能計算和人工智能工作負載。
現在,每位研究人員和工程師都可以負擔得起使用人工智能超級計算機處理最具挑戰性工作的做法。
|
![]() |
![]() |
NVLINK 接口的 NVIDIA TESLA V100為深度學習提供卓越性能 |
PCIe 接口的 NVIDIA TESLA V100通用性出眾適合處理各種工作負載 |
VOLTA架構 通過在一個統一架構內搭配使用CUDA內核和Tensor內核,配備Tesla V100GPU的單臺服務器可以取代數百臺通用CPU服務器來處理傳統的HPC和深度學習。 |
TENSOR核心 Tesla V100配有640個Tensor核心,可提供125萬億次級的深度學習性能。與NVIDIA Pascal GPU相比,可為深度學習訓練提供12倍張量浮點運算能力;為深度學習推理提供6倍張量浮點運算能力。 |
新一代NVLINK Tesla V100中采用的NVIDIA NVLink可提供2倍于上一代的吞吐量。8塊Tesla V100加速器能以高達300GB/s的速度互聯,從而發揮出單個服務器所能提供的最高應用性能。 |
|||
|
最大節能模式 全新的額最大節能模式可允許數據中心在現有的功耗預算內,使每個機架最高提升40%的計算能力。在此模式下,Tesla V100以最大處理效率運行時,可提供高達80%的性能而只需一半的功耗。 |
|
HBM2 Tesla V100將900GB/s的改良版原始帶寬與高達95%的DRAM利用效率相結合,在STREAM上測量時可提供高于Pascal GPU 1.5倍的顯存帶寬。 |
|
可編程性 Tesla V100的架構設計初衷即是為了簡化可編程性。其全新的獨立縣城調度能力可實現細粒度同步,并能通過在瑣碎的工作之間共享資源進而提升GPU的利用率。 |