NVIDIA TESLA V100S

NVIDIA Tesla V100s低調發布:全面提速變身土豪金
SC 2019超算大會期間,NVIDIA低調發布了新款頂級計算卡“ Tesla V100S ”,自然就是此前Tesla V100的升級版本。
Tesla V100最早發佈於2017年5月份的GTC 2017圖形大會上,基於全新的Volta伏特架構、GV100大核心,台積電12nm工藝製造,集成210億個晶體管,面積達815平方毫米,擁有5120個CUDA核心、640個Tensor張量核心,最初基於SXM2形態(300GB/s NVLink總線),很快又增加了PCIe形態(32GB/s PCIe總線)。
兩年多過去了,Tesla V100的地位依然無可撼動,而最新的Tesla V100S更進一步,核心、顯存雙雙提速,但功耗卻沒變。

Tesla V100S只有PCIe擴展卡一種形態,雙精度浮點性能8.2TFlops(萬億次浮點計算),單精度浮點性能16.4TFlops,深度學習性能130TFlops,相比於PCIe、SXM2版本的Tesla V100分別提升了最多17%、5%。
顯存方面,依然採用HBM2,容量固定在32GB而不再提供16GB版本,位寬仍為4096-bit,頻率從1.75GHz加速到2.21GHz,帶寬也從900GB/s增加到1134GB/s。

不過大幅提速的同時,Tesla V100S的功耗依然維持在250W,顯然無論製造工藝還是核心架構都更加成熟。
此外,從現場展示看,Tesla V100S的“肩部”底色從草綠色變成了土豪金色,很容易分辨。




了解更多TESLA V100S歡迎加line或者來電來信洽詢,很樂意提供您們意見與規劃

業務窗口   蔡先生
行動電話:0910-218-322      Line ID: tsaicm1011  wechat微信ID: tsaicm                                                 
公司電話:02-2929-9388 #10
公司傳真:02-2929-7579
Email: sales1@honghutech.com
====
NVIDIA Tesla V100s低調發布:全面升速,變身土豪金

SC 2019大會期間,NVIDIA低調發布了新款頂級計算卡“ Tesla V100S ”,自然就是此前Tesla V100的升級版本。

Tesla V100最早發佈於2017年5月份的GTC 2017大會上,採用全新的Volta架構、GV100大核心,台積電12nm製程,整合210億個電晶體管,面積達815mm2,擁有5120個CUDA核心、 640個Tensor核心,最初採用SXM2形態(300GB/s NVLink匯流排),很快又增加了PCIe形態 (32GB/s PCIe匯流排)。兩年多過去了,Tesla V100的地位依然無可撼動,而最新的Tesla V100S更進一步,核心、記憶體雙雙提速,但功耗卻沒變。

Tesla V100S只有PCIe卡一種形態,雙精度浮點性能8.2TFlops,單精度浮點性能16.4TFlops,深度學習性能130TFlops,相比於PCIe、SXM2版本的Tesla V100分別提升了最多17%、5%。記憶體方面依然採用HBM2,容量固定在32GB而不再提供16GB版本,記憶體匯流排仍為4096-bit,頻率從1.75GHz加速到2.21GHz,頻寬也從900GB/s增加到1134GB/s。不過大幅提速的同時,Tesla V100S的功耗依然維持在250W,顯然無論製程還是核心架構都更加成熟。

此外從現場展示看,Tesla V100S的“肩部”底色從草綠色變成了土豪金色,很容易分辨


===
NVIDIA Tesla V100s基於Volta的圖形卡具有更高的GPU時鐘,可進行超過16個TFLOP的計算,並且存儲帶寬超過1 TB / s

NVIDIA已發布其基於Volta的Tesla圖形卡的新變種,稱為Tesla V100S。這種針對服務器的新解決方案具有與完整的Volta GPU相同的規格,但是為GPU和內存提供了更快的時鐘頻率,從而使其性能在單精度計算工作負載中超過16個TFLOP。

NVIDIA Tesla V100S Volta GPU為服務器帶來16個以上的TFLOP和超過1 TB / s的內存帶寬
在配置方面,Tesla V100S具有相同的GV100 GPU,該GPU基於12nm FinFET工藝節點。規範包括5120個CUDA內核,640個Tensor內核和32 GB的HBM2內存。如您所知,這些規格與現有的Tesla V100非常相似,但是GPU和內存時鐘速度都進行了一些重大更改。



NVIDIA Tesla V100S提供更高的計算和內存性能。
Tesla V100S僅採用PCIe尺寸,但比300W Tesla V100 SMX2(NVLINK)解決方案提供更高的時鐘。與SMX2型號的1533 MHz相比,它具有1601 MHz的GPU時鐘速度,還為HBM2 DRAM提供了更高的1.1 Gbps頻率。內存和圖形時鐘的綜合提升使該Tesla變體成為最快的針對HPC和服務器的圖形解決方案。

以上述時鐘速度,Tesla V100S能夠提供理論上的FP32計算性能16.4 TFLOP,FP64計算性能8.2 TFLOP和DNN / DL計算130 TFLOP。該卡還抽出了超過1 TB的內存帶寬(1134 GB / s),而Tesla V100的每秒帶寬為900GB。Tesla V100S採用250W設計,比AMD Radeon Instinct MI60(基於7nm Vega 20 GPU架構)具有更高的計算性能,但在300W的TDP下可提供14.75 TFLOP的最大FP32計算性能。



NVIDIA Volta Tesla V100S Specs:



NVIDIA Tesla Graphics CardTesla K40
(PCI-Express)
Tesla M40
(PCI-Express)
Tesla P100
(PCI-Express)
Tesla P100 (SXM2)Tesla V100 (PCI-Express)Tesla V100 (SXM2)Tesla V100S (PCIe)
GPUGK110 (Kepler)GM200 (Maxwell)GP100 (Pascal)GP100 (Pascal)GV100 (Volta)GV100 (Volta)GV100 (Volta)
Process Node28nm28nm16nm16nm12nm12nm12nm
Transistors7.1 Billion8 Billion15.3 Billion15.3 Billion21.1 Billion21.1 Billion21.1 Billion
GPU Die Size551 mm2601 mm2610 mm2610 mm2815mm2815mm2815mm2
SMs15245656808080
TPCs15242828404040
CUDA Cores Per SM1921286464646464
CUDA Cores (Total)2880307235843584512051205120
Texture Units240192224224320320320
FP64 CUDA Cores / SM6443232323232
FP64 CUDA Cores / GPU9609617921792256025602560
Base Clock745 MHz948 MHz1190 MHz1328 MHz1230 MHz1297 MHzTBD
Boost Clock875 MHz1114 MHz1329MHz1480 MHz1380 MHz1530 MHz1601 MHz
FP16 ComputeN/AN/A18.7 TFLOPs21.2 TFLOPs28.0 TFLOPs30.4 TFLOPs32.8 TFLOPs
FP32 Compute5.04 TFLOPs6.8 TFLOPs10.0 TFLOPs10.6 TFLOPs14.0 TFLOPs15.7 TFLOPs16.4 TFLOPs
FP64 Compute1.68 TFLOPs0.2 TFLOPs4.7 TFLOPs5.30 TFLOPs7.0 TFLOPs7.80 TFLOPs8.2 TFLOPs
Memory Interface384-bit GDDR5384-bit GDDR54096-bit HBM24096-bit HBM24096-bit HBM24096-bit HBM24096-bit HBM
Memory Size12 GB GDDR5 @ 288 GB/s24 GB GDDR5 @ 288 GB/s16 GB HBM2 @ 732 GB/s
12 GB HBM2 @ 549 GB/s
16 GB HBM2 @ 732 GB/s16 GB HBM2 @ 900 GB/s16 GB HBM2 @ 900 GB/s16 GB HBM2 @ 1134 GB/s
L2 Cache Size1536 KB3072 KB4096 KB4096 KB6144 KB6144 KB6144 KB
TDP235W250W250W300W250W300W250W


將Tesla V100S與Tesla V100 PCIe進行比較,可以將計算性能提高約17%。這是一個不錯的增長,服務器用戶將其視為升級的原因。唯一需要考慮的是AMD Instinct部件具有PCIe Gen 4.0兼容性,並且在2020年將有許多主要的服務器廠商轉而使用PCIe 4.0平台時,NVIDIA需要開發自己的PCIe Gen 4.0實施方案,我相信這是他們自己的地方。安培GPU進來了。目前尚無關於Tesla V100S的價格或可用性的消息,但預計其價格將超過6000美元。

Comments