NVIDIA Tesla S2050 1U

張貼者:2010年6月29日 上午1:22蔡長明   [ eddie liu 已於 2013年1月10日 下午11:24 更新 ]

NVIDIA® Tesla™ S2050 1U運算系統以十分之一的成本與二十分之一的功耗,提供給使用者強大的超級運算威力,以最有彈性地將GPU能力擴展到現有的部門叢集和資料中心中。


Tesla S2050 1U運算系統的宗旨為提供給使用者絕佳的高效能運算結果,利用代號為”Fermi”的新一代NVIDIA CUDA™ GPU架構從頭量身打造而成。 Tesla S2050 1U運算系統支援技術和商業運算單位所需的「必要」功能,包括錯誤修正檢查碼的記憶模組(ECC memory)支援,以提供絕佳的精確度和擴充性,以及較Tesla 10-系列GPU運算產品高出7倍的雙精密度效能。相較於傳統的四核心CPU,Tesla 20-系列運算系統能以十分之一的成本和二十分之一的功耗提供同等的效能表現。 

在一個標準型的1U底座中設計搭載4顆以Fermi為基礎的的Tesla運算處理器,透過Tesla S2050運算系統的效力解決世界上最重大的運算挑戰絕對綽綽有餘---而且更為快速和精確。

    

  


 鴻鵠國際代理資訊 歡迎來電詢問相關產品資訊、技術支援

聯絡信箱:
marketing@honghutech.com
聯絡地址:台北縣永和市保生路 2 號 10 樓之 1


功能

由Fermi世代的CUDA架構挹注強大威力的繪圖處理器

相較於傳統的四核心CPU,能以十分之一的成本和二十分之一的功耗提供叢集效能。 

448個運算核心

在每一顆GPU中傳輸高達515 Gigaflops的雙精密度最高效能,讓每一個1U空間可提供2 Teraflop的雙倍精密度效能。每一顆繪圖處理器的單精密度最高效能可超越1 Teraflop。

錯誤修正檢查碼(ECC) 的記憶模組支援

透過絕佳的運算精確性和信賴度,達到應用程式的嚴格要求。提供記憶體的資料防護,強化應用所需資料的完整度和可靠度。註冊文件、L1/L2快取、共享記憶體,以及DRAM等皆受到ECC保護。

系統監控功能

透過NVSMI簡化管理和遙控的後安裝程序。裝置前後的狀態指示燈可讓IT人員即使是在機架的另一方,仍能看見設備的狀態。

每一GPU具有高達6GB的GDDR5記憶體容量

透過將龐大資料集保存於直接與繪圖處理器接取的私屬記憶體中,將效能提升至最佳狀態,並減低資料傳輸速度。Tesla S2050的每顆GPU擁有3GB。

NVIDIA平行DataCache™

加速如物理解答器(physics solvers)、光線追蹤及稀疏矩陣乘法(sparse matrix multiplication)等演算法,其數據位址無法事先得知。這其中包括每塊流式多處理器中的可配置L1快取記憶體,以及所有處理器核心的統一L2快取。

NVIDIA GigaThread™ 引擎

藉由比前一代架構快10倍之更快速的上下文切換、並存核心執行,以及加強的執行緒封鎖排程,進而將吞吐率最大化。

異步傳輸

在運算核心忙碌時同時透過PCIe匯流排執行數據傳輸,如此可大幅強化系統效能。即使是像地震處理等需要大量資料傳輸的應用程式,亦可透過在需求出現之前將資料傳輸至私屬記憶體中,將運算效率提升至絕佳狀態。

支援廣泛編程語言和應用程式介面(API)的CUDA編程環境

可選擇C、C++、OpenCL、DirectCompute或Fortran表達應用並行機制,並可妥善利用“Fermi”繪圖處理器的創新架構。

高速、PCI-Express Gen 2.0數據傳輸

最大化主系統和Tesla處理器之間的頻寬。讓Tesla系統能和具有開放PCI-E 插槽(x8 或x16)、PCIe相容的任一主系統共同實際運作。


規格尺寸

1U

Tesla繪圖處理器數量

4

GPU記憶體速度

1.55 GHz

GPU記憶體介面

384位元

GPU 記憶體頻寬

148 GB/sec

雙重精密浮點效能(最高)

2. Tflops

單一精密浮點效能(最高)

4.13 Tflops

專屬記憶體總容量*

12GB GDDR5

功耗 (一般狀態)

900W TDP

系統介面

PCIe x16 Gen2

軟體開發工具

CUDA C/C++/Fortran, OpenCL, DirectCompute 工具組 
NVIDIA平行 Nsight™ 

* 注意:開啟錯誤修正程式碼(ECC)功能後,有一部分的專屬記憶體將用於ECC位元,因此可用記憶體將減少12.5%。(例如:3 GB的記憶體總量將擁有2.68 GB的可用記憶體。)

Comments