Nvidia Products


NVIDIA Tesla S2050 1U

張貼者:2010年6月29日 上午1:22蔡長明   [ eddie liu 已於 2013年1月10日 下午11:24 更新 ]

NVIDIA® Tesla™ S2050 1U運算系統以十分之一的成本與二十分之一的功耗,提供給使用者強大的超級運算威力,以最有彈性地將GPU能力擴展到現有的部門叢集和資料中心中。


Tesla S2050 1U運算系統的宗旨為提供給使用者絕佳的高效能運算結果,利用代號為”Fermi”的新一代NVIDIA CUDA™ GPU架構從頭量身打造而成。 Tesla S2050 1U運算系統支援技術和商業運算單位所需的「必要」功能,包括錯誤修正檢查碼的記憶模組(ECC memory)支援,以提供絕佳的精確度和擴充性,以及較Tesla 10-系列GPU運算產品高出7倍的雙精密度效能。相較於傳統的四核心CPU,Tesla 20-系列運算系統能以十分之一的成本和二十分之一的功耗提供同等的效能表現。 

在一個標準型的1U底座中設計搭載4顆以Fermi為基礎的的Tesla運算處理器,透過Tesla S2050運算系統的效力解決世界上最重大的運算挑戰絕對綽綽有餘---而且更為快速和精確。

    

  


 鴻鵠國際代理資訊 歡迎來電詢問相關產品資訊、技術支援

聯絡信箱:
marketing@honghutech.com
聯絡地址:台北縣永和市保生路 2 號 10 樓之 1


功能

由Fermi世代的CUDA架構挹注強大威力的繪圖處理器

相較於傳統的四核心CPU,能以十分之一的成本和二十分之一的功耗提供叢集效能。 

448個運算核心

在每一顆GPU中傳輸高達515 Gigaflops的雙精密度最高效能,讓每一個1U空間可提供2 Teraflop的雙倍精密度效能。每一顆繪圖處理器的單精密度最高效能可超越1 Teraflop。

錯誤修正檢查碼(ECC) 的記憶模組支援

透過絕佳的運算精確性和信賴度,達到應用程式的嚴格要求。提供記憶體的資料防護,強化應用所需資料的完整度和可靠度。註冊文件、L1/L2快取、共享記憶體,以及DRAM等皆受到ECC保護。

系統監控功能

透過NVSMI簡化管理和遙控的後安裝程序。裝置前後的狀態指示燈可讓IT人員即使是在機架的另一方,仍能看見設備的狀態。

每一GPU具有高達6GB的GDDR5記憶體容量

透過將龐大資料集保存於直接與繪圖處理器接取的私屬記憶體中,將效能提升至最佳狀態,並減低資料傳輸速度。Tesla S2050的每顆GPU擁有3GB。

NVIDIA平行DataCache™

加速如物理解答器(physics solvers)、光線追蹤及稀疏矩陣乘法(sparse matrix multiplication)等演算法,其數據位址無法事先得知。這其中包括每塊流式多處理器中的可配置L1快取記憶體,以及所有處理器核心的統一L2快取。

NVIDIA GigaThread™ 引擎

藉由比前一代架構快10倍之更快速的上下文切換、並存核心執行,以及加強的執行緒封鎖排程,進而將吞吐率最大化。

異步傳輸

在運算核心忙碌時同時透過PCIe匯流排執行數據傳輸,如此可大幅強化系統效能。即使是像地震處理等需要大量資料傳輸的應用程式,亦可透過在需求出現之前將資料傳輸至私屬記憶體中,將運算效率提升至絕佳狀態。

支援廣泛編程語言和應用程式介面(API)的CUDA編程環境

可選擇C、C++、OpenCL、DirectCompute或Fortran表達應用並行機制,並可妥善利用“Fermi”繪圖處理器的創新架構。

高速、PCI-Express Gen 2.0數據傳輸

最大化主系統和Tesla處理器之間的頻寬。讓Tesla系統能和具有開放PCI-E 插槽(x8 或x16)、PCIe相容的任一主系統共同實際運作。


規格尺寸

1U

Tesla繪圖處理器數量

4

GPU記憶體速度

1.55 GHz

GPU記憶體介面

384位元

GPU 記憶體頻寬

148 GB/sec

雙重精密浮點效能(最高)

2. Tflops

單一精密浮點效能(最高)

4.13 Tflops

專屬記憶體總容量*

12GB GDDR5

功耗 (一般狀態)

900W TDP

系統介面

PCIe x16 Gen2

軟體開發工具

CUDA C/C++/Fortran, OpenCL, DirectCompute 工具組 
NVIDIA平行 Nsight™ 

* 注意:開啟錯誤修正程式碼(ECC)功能後,有一部分的專屬記憶體將用於ECC位元,因此可用記憶體將減少12.5%。(例如:3 GB的記憶體總量將擁有2.68 GB的可用記憶體。)

NVIDIA TESLA M2050/M2070 GPU

張貼者:2010年6月29日 上午1:14蔡長明   [ eddie liu 已於 2013年1月10日 下午11:25 更新 ]

Tesla M2050 / M2070 GPU運算模組

由NVIDIA® Tesla™ M2050/M2070 GPU運算模組挹注強悍威力的NVIDIA合作夥伴解決方案,能夠利用二十分之一的功耗與十分之一的成本,提供給使用者強大的超級運算威力,並同時為部門叢集和資料中心的佈署帶來全球首屈一指的高運算密度 。


採用代號為”Fermi”的新一代CUDA架構 ,Tesla M2050和M2070運算模組為GPU運算和主系統帶來完美無瑕的整合 ,進而滿足用戶對高效能運算、大型資料中心以及向外擴展的佈署需求。20-系列的Tesla繪圖處理器為第一款可提供較四核心x86 CPU高出10倍的雙精密度效能,同時也是第一款帶來錯誤修正檢查碼的記憶模組(ECC memory)支援的產品。Tesla M2050和M2070模組除了完美提供GPU運算的標準優勢之外,更透過其系統監控與管理工具實現最高的信賴度以及最緊密的整合效果。如此一來,資料中心的IT人員在GPU布署上將擁有更大的選擇空間,其中包括機架式和刀鋒系統。除此之外,這樣的功能也將滿足他們對遠端監控和遠端管理能力的需求。 

相較於僅裝有CPU的系統,搭載Tesla 20-系列GPU運算模組的伺服器能在提供最高運算密度的同時,以十分之一的成本和二十分之一的功耗帶來令人驚艷的超級運算效能。 


   鴻鵠國際代理資訊
 聯絡信箱:
marketing@honghutech.com
 聯絡地址:台北縣永和市保生路 2 號 10 樓之 1

功能

由Fermi世代的CUDA架構挹注強大威力的繪圖處理器相較於採用最新四核心CPU的純CPU系統,能以十分之一的成本和二十分之一的功耗提供叢集效能。
448個CUDA核心在每一顆GPU中傳輸高達515 Gigaflops的雙精密度最高效能,讓產業領導OEM推出之伺服器皆能在1 RU的空間內提供1 Teraflop或以上的雙精密度效能。每一顆繪圖處理器的單精密度最高效能可達1 Teraflop。
錯誤修正檢查碼(ECC) 的記憶模組支援符合資料中心和超級運算中心的運算精確性和信賴度的嚴格要求。提供記憶體的資料防護,強化應用所需資料的完整度和可靠度。註冊文件、L1/L2快取、共享記憶體,以及DRAM等接受到ECC保護。
每一GPU具有高達6GB的GDDR5記憶體容量透過將龐大資料集保存於直接與繪圖處理器接取的私屬記憶體中,將效能提升至最佳狀態,並減低資料傳輸速度。
系統監控功能將GPU子系統和主系統的監控和管理功能完美整合。如此一來, IT 人員便能透過如IPMI或OEM 專利工具等常見的管理介面來管理運算系統的所有重要零件。
專為提供最高信賴度而量身打造被動式散熱器設計將轉動的零件和電纜移除。
NVIDIA平行DataCache™加速如物理解答器(physics solvers)、光線追蹤及稀疏矩陣乘法(sparse matrix multiplication)等演算法,其數據位址無法事先得知。這其中包括每塊流式多處理器中的可配置L1快取記憶體,以及所有處理器核心的統一L2快取。
NVIDIA GigaThread™ 引擎藉由比前一代架構快10倍之更快速的上下文切換、並存核心執行,以及加強的執行緒封鎖排程,進而將吞吐率最大化。
異步傳輸在運算核心忙碌時同時透過PCIe匯流排執行數據傳輸,如此可大幅強化系統效能。即使是像地震處理等需要大量資料傳輸的應用程式,亦可透過在需求出現之前將資料傳輸至私屬記憶體中,將運算效率提升至絕佳狀態。
支援廣泛編程語言和應用程式介面(API)的CUDA編程環境可選擇C、C++、OpenCL、DirectCompute或Fortran表達應用並行機制,並可妥善利用“Fermi”繪圖處理器的創新架構。
高速、PCI-Express Gen 2.0數據傳輸最大化主系統和Tesla處理器之間的頻寬。讓Tesla系統能和具有開放PCI-E 插槽(x8 或x16)、PCIe相容的任一主系統共同實際運作。


規格尺寸9.75吋PCIe x16
Tesla繪圖處理器數量1
雙重精密浮點效能(最高)515 Gflops
單一精密浮點效能(最高)1.03 Tflops
專屬記憶體總容量*

Tesla M2050
Tesla M2070


3GB GDDR5
6GB GDDR5
記憶體速度1.55 GHz
記憶體介面384位元
記憶體介面頻寬148 GB/sec
功耗225W TDP
系統介面PCIe x16 Gen2
散熱系統利用主系統空氣流進行散熱的被動式散熱器
軟體開發工具CUDA C/C++/Fortran, OpenCL, DirectCompute 工具組專為Visual Studio 打造的NVIDIA平行 Nsight™

* 注意:開啟錯誤修正程式碼(ECC)功能後,有一部分的專屬記憶體將用於ECC位元,因此可用記憶體將減少12.5%。(例如:3 GB的記憶體總量將擁有2.68 GB的可用記憶體。)

 


NVIDIA TESLA C2050 C2070

張貼者:2010年6月29日 上午1:09蔡長明   [ eddie liu 已於 2013年1月10日 下午11:25 更新 ]

NVIDIA Tesla™ C2050和C2070運算處理器利用平行運算加快轉換速度,並將小型叢集的強大效能完整地轉移到桌上型電腦中。採用代號為”Fermi”的新一代CUDA架構,Tesla 20系列的繪圖處理器產品家族支援技術和商業運算單位所需的「必要」功能,包括C++ 支援、錯誤修正檢查碼的記憶模組(ECC memory),可提供絕佳的精確度和擴充性,以及較Tesla 10-系列繪圖處理器高出7倍的雙精密度效能。Tesla™ C2050和C2070運算處理器的設計宗旨為賦予高效能運算全新定義,並使得所有用戶都能享受超級運算的優質體驗。

相較於最新的四核心CPU,Tesla C2050和C2070運算處理器能以二十分之一的功耗和十分之一的成本提供同等的超級運算效能。 







鴻鵠國際代理資訊
聯絡信箱:
marketing@honghutech.com
聯絡地址:台北縣永和市保生路 2 號 10 樓之 1

功能

由Fermi世代的CUDA架構挹注威力的繪圖處理器

相較於採用最新四核心CPU的純CPU系統,能以二十分之一的功耗和十分之一的成本提供叢集效能。

448個CUDA核心

在每一顆GPU中傳輸高達515 Gigaflops的雙精密度最高效能,讓每一台獨立工作站可提供超越1 Teraflop的效能。每一顆繪圖處理器的單精密度最高效能可達1 Teraflop。

錯誤修正檢查碼(ECC) 的記憶模組支援

符合工作站的運算精確性和信賴度的嚴格要求。提供記憶體的資料防護,強化應用所需資料的完整度和可靠度。註冊文件、L1/L2快取、共享記憶體,以及DRAM等接受到ECC保護。

桌上型電腦叢集效能

透過多重繪圖處理器,可比單一工作站中的小型伺服器叢集更快速地解決大量問題。

每一GPU具有高達6GB的GDDR5記憶體容量

透過將龐大資料集保存於直接與繪圖處理器接取的私屬記憶體中,將效能提升至最佳狀態,並減低資料傳輸速度。

NVIDIA平行DataCache™

加速如物理解答器(physics solvers)、光線追蹤及稀疏矩陣乘法(sparse matrix multiplication)等演算法,其數據位址無法事先得知。這其中包括每塊流式多處理器中的可配置L1快取記憶體,以及所有處理器核心的統一L2快取。

NVIDIA GigaThread™ 引擎

藉由比前一代架構快10倍之更快速的上下文切換、並存核心執行,以及加強的執行緒封鎖排程,進而最大化吞吐率。

異步傳輸

在運算核心忙碌時同時透過PCIe匯流排執行數據傳輸,如此可大幅強化系統效能。即使是像地震處理等需要大量資料傳輸的應用程式,亦可透過在需求出現之前將資料傳輸至私屬記憶體中,將運算效率提升至絕佳狀態。

支援廣泛編程語言和應用程式介面(API)的CUDA編程環境

可選擇C、C++、OpenCL、DirectCompute或Fortran表達應用並行機制,並可利用“Fermi”繪圖處理器的創新架構。NVIDIA平行Nsight工具已針對Microsoft Visual Studio開發者開放。

高速、PCI-Express Gen 2.0數據傳輸

最大化主系統和Tesla處理器之間的頻寬。讓Tesla系統能和具有開放PCI-E x16插槽、PCIe相容的任一主系統共同實際運作。


規格尺寸

9.75吋 PCIe x16插槽

Tesla繪圖處理器數量

1

CUDA核心數量

448

CUDA核心頻率

1.15 GHz

雙重精密浮點效能(最高)

515 Gflops

單一精密浮點效能(最高)

1.03 Tflops

專屬記憶體總容量*

Tesla C2050
Tesla C2070

 

3GB GDDR5
6GB GDDR5

記憶體速度

1.5 GHz

記憶體介面

384-bit

記憶體頻寬

144 GB/sec

耗電量

247W TDP

系統介面

PCIe x16 Gen2

散熱解決方案

主動式風扇散熱器

軟體開發工具

CUDA C/C++/Fortran, OpenCL, DirectCompute 工具組
專為Visual Studio 打造的NVIDIA平行 Nsight™

* 注意:開啟錯誤修正程式碼(ECC)功能後,有一部分的專屬記憶體將用於ECC位元,因此可用記憶體將減少12.5%。(例如:3 GB的記憶體總量將擁有2.68 GB的可用記憶體。)






1-3 of 3