NVIDIA TESLA V100S

NVIDIA Tesla V100s低調發布:全面提速變身土豪金

SC 2019超算大會期間,NVIDIA低調發布了新款頂級計算卡“ Tesla V100S ”,自然就是此前Tesla V100的升級版本。

Tesla V100最早發佈於2017年5月份的GTC 2017圖形大會上,基於全新的Volta伏特架構、GV100大核心,台積電12nm工藝製造,集成210億個晶體管,面積達815平方毫米,擁有5120個CUDA核心、640個Tensor張量核心,最初基於SXM2形態(300GB/s NVLink總線),很快又增加了PCIe形態(32GB/s PCIe總線)。

兩年多過去了,Tesla V100的地位依然無可撼動,而最新的Tesla V100S更進一步,核心、顯存雙雙提速,但功耗卻沒變。

Tesla V100S只有PCIe擴展卡一種形態,雙精度浮點性能8.2TFlops(萬億次浮點計算),單精度浮點性能16.4TFlops,深度學習性能130TFlops,相比於PCIe、SXM2版本的Tesla V100分別提升了最多17%、5%。

顯存方面,依然採用HBM2,容量固定在32GB而不再提供16GB版本,位寬仍為4096-bit,頻率從1.75GHz加速到2.21GHz,帶寬也從900GB/s增加到1134GB/s。

不過大幅提速的同時,Tesla V100S的功耗依然維持在250W,顯然無論製造工藝還是核心架構都更加成熟。

此外,從現場展示看,Tesla V100S的“肩部”底色從草綠色變成了土豪金色,很容易分辨。

了解更多TESLA V100S歡迎加line或者來電來信洽詢,很樂意提供您們意見與規劃

業務窗口 蔡先生

行動電話:0910-218-322 Line ID: tsaicm1011 wechat微信ID: tsaicm

公司電話:02-2929-9388 #10

公司傳真:02-2929-7579

Email: sales1@honghutech.com

====

NVIDIA Tesla V100s低調發布:全面升速,變身土豪金

SC 2019大會期間,NVIDIA低調發布了新款頂級計算卡“ Tesla V100S ”,自然就是此前Tesla V100的升級版本。

Tesla V100最早發佈於2017年5月份的GTC 2017大會上,採用全新的Volta架構、GV100大核心,台積電12nm製程,整合210億個電晶體管,面積達815mm2,擁有5120個CUDA核心、 640個Tensor核心,最初採用SXM2形態(300GB/s NVLink匯流排),很快又增加了PCIe形態 (32GB/s PCIe匯流排)。兩年多過去了,Tesla V100的地位依然無可撼動,而最新的Tesla V100S更進一步,核心、記憶體雙雙提速,但功耗卻沒變。

Tesla V100S只有PCIe卡一種形態,雙精度浮點性能8.2TFlops,單精度浮點性能16.4TFlops,深度學習性能130TFlops,相比於PCIe、SXM2版本的Tesla V100分別提升了最多17%、5%。記憶體方面依然採用HBM2,容量固定在32GB而不再提供16GB版本,記憶體匯流排仍為4096-bit,頻率從1.75GHz加速到2.21GHz,頻寬也從900GB/s增加到1134GB/s。不過大幅提速的同時,Tesla V100S的功耗依然維持在250W,顯然無論製程還是核心架構都更加成熟。

此外從現場展示看,Tesla V100S的“肩部”底色從草綠色變成了土豪金色,很容易分辨

===

NVIDIA Tesla V100s基於Volta的圖形卡具有更高的GPU時鐘,可進行超過16個TFLOP的計算,並且存儲帶寬超過1 TB / s

NVIDIA已發布其基於Volta的Tesla圖形卡的新變種,稱為Tesla V100S。這種針對服務器的新解決方案具有與完整的Volta GPU相同的規格,但是為GPU和內存提供了更快的時鐘頻率,從而使其性能在單精度計算工作負載中超過16個TFLOP。

NVIDIA Tesla V100S Volta GPU為服務器帶來16個以上的TFLOP和超過1 TB / s的內存帶寬

在配置方面,Tesla V100S具有相同的GV100 GPU,該GPU基於12nm FinFET工藝節點。規範包括5120個CUDA內核,640個Tensor內核和32 GB的HBM2內存。如您所知,這些規格與現有的Tesla V100非常相似,但是GPU和內存時鐘速度都進行了一些重大更改。

NVIDIA Tesla V100S提供更高的計算和內存性能。

Tesla V100S僅採用PCIe尺寸,但比300W Tesla V100 SMX2(NVLINK)解決方案提供更高的時鐘。與SMX2型號的1533 MHz相比,它具有1601 MHz的GPU時鐘速度,還為HBM2 DRAM提供了更高的1.1 Gbps頻率。內存和圖形時鐘的綜合提升使該Tesla變體成為最快的針對HPC和服務器的圖形解決方案。

以上述時鐘速度,Tesla V100S能夠提供理論上的FP32計算性能16.4 TFLOP,FP64計算性能8.2 TFLOP和DNN / DL計算130 TFLOP。該卡還抽出了超過1 TB的內存帶寬(1134 GB / s),而Tesla V100的每秒帶寬為900GB。Tesla V100S採用250W設計,比AMD Radeon Instinct MI60(基於7nm Vega 20 GPU架構)具有更高的計算性能,但在300W的TDP下可提供14.75 TFLOP的最大FP32計算性能。

NVIDIA Volta Tesla V100S Specs:

將Tesla V100S與Tesla V100 PCIe進行比較,可以將計算性能提高約17%。這是一個不錯的增長,服務器用戶將其視為升級的原因。唯一需要考慮的是AMD Instinct部件具有PCIe Gen 4.0兼容性,並且在2020年將有許多主要的服務器廠商轉而使用PCIe 4.0平台時,NVIDIA需要開發自己的PCIe Gen 4.0實施方案,我相信這是他們自己的地方。安培GPU進來了。目前尚無關於Tesla V100S的價格或可用性的消息,但預計其價格將超過6000美元。