張貼者:2010/6/29 上午1:22Cm Tsai
[
已更新 2010/6/29 上午4:33
]
 NVIDIA® Tesla™ S2050 1U運算系統以十分之一的成本與二十分之一的功耗,提供給使用者強大的超級運算威力,以最有彈性地將GPU能力擴展到現有的部門叢集和資料中心中。
Tesla S2050 1U運算系統的宗旨為提供給使用者絕佳的高效能運算結果,利用代號為”Fermi”的新一代NVIDIA CUDA™ GPU架構從頭量身打造而成。 Tesla S2050 1U運算系統支援技術和商業運算單位所需的「必要」功能,包括錯誤修正檢查碼的記憶模組(ECC memory)支援,以提供絕佳的精確度和擴充性,以及較Tesla 10-系列GPU運算產品高出7倍的雙精密度效能。相較於傳統的四核心CPU,Tesla 20-系列運算系統能以十分之一的成本和二十分之一的功耗提供同等的效能表現。
在一個標準型的1U底座中設計搭載4顆以Fermi為基礎的的Tesla運算處理器,透過Tesla S2050運算系統的效力解決世界上最重大的運算挑戰絕對綽綽有餘---而且更為快速和精確。 鴻鵠國際代理資訊 歡迎來電詢問相關產品資訊、技術支援 聯絡接洽:陳先生 ZYE 聯絡電話:(02)8231-5565 分機 18 聯絡手機:0921-037-911 聯絡信箱:zye@honghutech.com 聯絡地址:台北縣永和市保生路 2 號 10 樓之 1
功能 由Fermi世代的CUDA架構挹注強大威力的繪圖處理器 | 相較於傳統的四核心CPU,能以十分之一的成本和二十分之一的功耗提供叢集效能。 | 448個運算核心 | 在每一顆GPU中傳輸高達515 Gigaflops的雙精密度最高效能,讓每一個1U空間可提供2 Teraflop的雙倍精密度效能。每一顆繪圖處理器的單精密度最高效能可超越1 Teraflop。 | 錯誤修正檢查碼(ECC) 的記憶模組支援 | 透過絕佳的運算精確性和信賴度,達到應用程式的嚴格要求。提供記憶體的資料防護,強化應用所需資料的完整度和可靠度。註冊文件、L1/L2快取、共享記憶體,以及DRAM等皆受到ECC保護。 | 系統監控功能 | 透過NVSMI簡化管理和遙控的後安裝程序。裝置前後的狀態指示燈可讓IT人員即使是在機架的另一方,仍能看見設備的狀態。 | 每一GPU具有高達6GB的GDDR5記憶體容量 | 透過將龐大資料集保存於直接與繪圖處理器接取的私屬記憶體中,將效能提升至最佳狀態,並減低資料傳輸速度。Tesla S2050的每顆GPU擁有3GB。 | NVIDIA平行DataCache™ | 加速如物理解答器(physics solvers)、光線追蹤及稀疏矩陣乘法(sparse matrix multiplication)等演算法,其數據位址無法事先得知。這其中包括每塊流式多處理器中的可配置L1快取記憶體,以及所有處理器核心的統一L2快取。 | NVIDIA GigaThread™ 引擎 | 藉由比前一代架構快10倍之更快速的上下文切換、並存核心執行,以及加強的執行緒封鎖排程,進而將吞吐率最大化。 | 異步傳輸 | 在運算核心忙碌時同時透過PCIe匯流排執行數據傳輸,如此可大幅強化系統效能。即使是像地震處理等需要大量資料傳輸的應用程式,亦可透過在需求出現之前將資料傳輸至私屬記憶體中,將運算效率提升至絕佳狀態。 | 支援廣泛編程語言和應用程式介面(API)的CUDA編程環境 | 可選擇C、C++、OpenCL、DirectCompute或Fortran表達應用並行機制,並可妥善利用“Fermi”繪圖處理器的創新架構。 | 高速、PCI-Express Gen 2.0數據傳輸 | 最大化主系統和Tesla處理器之間的頻寬。讓Tesla系統能和具有開放PCI-E 插槽(x8 或x16)、PCIe相容的任一主系統共同實際運作。 |
|
規格尺寸 | 1U | Tesla繪圖處理器數量 | 4 | GPU記憶體速度 | 1.55 GHz | GPU記憶體介面 | 384位元 | GPU 記憶體頻寬 | 148 GB/sec | 雙重精密浮點效能(最高) | 2. Tflops | 單一精密浮點效能(最高) | 4.13 Tflops | 專屬記憶體總容量* | 12GB GDDR5 | 功耗 (一般狀態) | 900W TDP | 系統介面 | PCIe x16 Gen2 | 軟體開發工具 | CUDA C/C++/Fortran, OpenCL, DirectCompute 工具組 NVIDIA平行 Nsight™
|
* 注意:開啟錯誤修正程式碼(ECC)功能後,有一部分的專屬記憶體將用於ECC位元,因此可用記憶體將減少12.5%。(例如:3 GB的記憶體總量將擁有2.68 GB的可用記憶體。) |
張貼者:2010/6/29 上午1:14Cm Tsai
[
已更新 2010/6/29 上午1:17
]
 Tesla M2050 / M2070 GPU運算模組由NVIDIA® Tesla™ M2050/M2070 GPU運算模組挹注強悍威力的NVIDIA合作夥伴解決方案,能夠利用二十分之一的功耗與十分之一的成本,提供給使用者強大的超級運算威力,並同時為部門叢集和資料中心的佈署帶來全球首屈一指的高運算密度 。
採用代號為”Fermi”的新一代CUDA架構 ,Tesla M2050和M2070運算模組為GPU運算和主系統帶來完美無瑕的整合 ,進而滿足用戶對高效能運算、大型資料中心以及向外擴展的佈署需求。20-系列的Tesla繪圖處理器為第一款可提供較四核心x86 CPU高出10倍的雙精密度效能,同時也是第一款帶來錯誤修正檢查碼的記憶模組(ECC memory)支援的產品。Tesla M2050和M2070模組除了完美提供GPU運算的標準優勢之外,更透過其系統監控與管理工具實現最高的信賴度以及最緊密的整合效果。如此一來,資料中心的IT人員在GPU布署上將擁有更大的選擇空間,其中包括機架式和刀鋒系統。除此之外,這樣的功能也將滿足他們對遠端監控和遠端管理能力的需求。
相較於僅裝有CPU的系統,搭載Tesla 20-系列GPU運算模組的伺服器能在提供最高運算密度的同時,以十分之一的成本和二十分之一的功耗帶來令人驚艷的超級運算效能。
鴻鵠國際代理資訊 聯絡接洽:陳先生 ZYE 聯絡電話:(02)8231-5565 分機 18 聯絡手機:0921-037-911 聯絡信箱:zye@honghutech.com 聯絡地址:台北縣永和市保生路 2 號 10 樓之 1 功能 | 由Fermi世代的CUDA架構挹注強大威力的繪圖處理器 | 相較於採用最新四核心CPU的純CPU系統,能以十分之一的成本和二十分之一的功耗提供叢集效能。 | | 448個CUDA核心 | 在每一顆GPU中傳輸高達515 Gigaflops的雙精密度最高效能,讓產業領導OEM推出之伺服器皆能在1 RU的空間內提供1 Teraflop或以上的雙精密度效能。每一顆繪圖處理器的單精密度最高效能可達1 Teraflop。 | | 錯誤修正檢查碼(ECC) 的記憶模組支援 | 符合資料中心和超級運算中心的運算精確性和信賴度的嚴格要求。提供記憶體的資料防護,強化應用所需資料的完整度和可靠度。註冊文件、L1/L2快取、共享記憶體,以及DRAM等接受到ECC保護。 | | 每一GPU具有高達6GB的GDDR5記憶體容量 | 透過將龐大資料集保存於直接與繪圖處理器接取的私屬記憶體中,將效能提升至最佳狀態,並減低資料傳輸速度。 | | 系統監控功能 | 將GPU子系統和主系統的監控和管理功能完美整合。如此一來, IT 人員便能透過如IPMI或OEM 專利工具等常見的管理介面來管理運算系統的所有重要零件。 | | 專為提供最高信賴度而量身打造 | 被動式散熱器設計將轉動的零件和電纜移除。 | | NVIDIA平行DataCache™ | 加速如物理解答器(physics solvers)、光線追蹤及稀疏矩陣乘法(sparse matrix multiplication)等演算法,其數據位址無法事先得知。這其中包括每塊流式多處理器中的可配置L1快取記憶體,以及所有處理器核心的統一L2快取。 | | NVIDIA GigaThread™ 引擎 | 藉由比前一代架構快10倍之更快速的上下文切換、並存核心執行,以及加強的執行緒封鎖排程,進而將吞吐率最大化。 | | 異步傳輸 | 在運算核心忙碌時同時透過PCIe匯流排執行數據傳輸,如此可大幅強化系統效能。即使是像地震處理等需要大量資料傳輸的應用程式,亦可透過在需求出現之前將資料傳輸至私屬記憶體中,將運算效率提升至絕佳狀態。 | | 支援廣泛編程語言和應用程式介面(API)的CUDA編程環境 | 可選擇C、C++、OpenCL、DirectCompute或Fortran表達應用並行機制,並可妥善利用“Fermi”繪圖處理器的創新架構。 | | 高速、PCI-Express Gen 2.0數據傳輸 | 最大化主系統和Tesla處理器之間的頻寬。讓Tesla系統能和具有開放PCI-E 插槽(x8 或x16)、PCIe相容的任一主系統共同實際運作。 |
| 規格尺寸 | 9.75吋PCIe x16 | | Tesla繪圖處理器數量 | 1 | | 雙重精密浮點效能(最高) | 515 Gflops | | 單一精密浮點效能(最高) | 1.03 Tflops | 專屬記憶體總容量*
Tesla M2050 Tesla M2070 | 3GB GDDR5 6GB GDDR5 | | 記憶體速度 | 1.55 GHz | | 記憶體介面 | 384位元 | | 記憶體介面頻寬 | 148 GB/sec | | 功耗 | 225W TDP | | 系統介面 | PCIe x16 Gen2 | | 散熱系統 | 利用主系統空氣流進行散熱的被動式散熱器 | | 軟體開發工具 | CUDA C/C++/Fortran, OpenCL, DirectCompute 工具組專為Visual Studio 打造的NVIDIA平行 Nsight™ |
* 注意:開啟錯誤修正程式碼(ECC)功能後,有一部分的專屬記憶體將用於ECC位元,因此可用記憶體將減少12.5%。(例如:3 GB的記憶體總量將擁有2.68 GB的可用記憶體。) - 支援Tesla M2050/M2070的作業系統
- Linux 32位元和64位元
- Windows Server 2003和2008
- 垂直解決方案和軟體網頁
- 軟體
|
張貼者:2010/6/29 上午1:09Cm Tsai
[
已更新 2010/6/29 上午1:13
]
NVIDIA Tesla™ C2050和C2070運算處理器利用平行運算加快轉換速度,並將小型叢集的強大效能完整地轉移到桌上型電腦中。採用代號為”Fermi”的新一代CUDA架構,Tesla 20系列的繪圖處理器產品家族支援技術和商業運算單位所需的「必要」功能,包括C++ 支援、錯誤修正檢查碼的記憶模組(ECC memory),可提供絕佳的精確度和擴充性,以及較Tesla 10-系列繪圖處理器高出7倍的雙精密度效能。Tesla™ C2050和C2070運算處理器的設計宗旨為賦予高效能運算全新定義,並使得所有用戶都能享受超級運算的優質體驗。
相較於最新的四核心CPU,Tesla C2050和C2070運算處理器能以二十分之一的功耗和十分之一的成本提供同等的超級運算效能。
鴻鵠國際代理資訊 聯絡接洽:陳先生 ZYE 聯絡電話:(02)8231-5565 分機 18 聯絡手機:0921-037-911 聯絡信箱:zye@honghutech.com 聯絡地址:台北縣永和市保生路 2 號 10 樓之 1
功能 由Fermi世代的CUDA架構挹注威力的繪圖處理器 | 相較於採用最新四核心CPU的純CPU系統,能以二十分之一的功耗和十分之一的成本提供叢集效能。 | 448個CUDA核心 | 在每一顆GPU中傳輸高達515 Gigaflops的雙精密度最高效能,讓每一台獨立工作站可提供超越1 Teraflop的效能。每一顆繪圖處理器的單精密度最高效能可達1 Teraflop。 | 錯誤修正檢查碼(ECC) 的記憶模組支援 | 符合工作站的運算精確性和信賴度的嚴格要求。提供記憶體的資料防護,強化應用所需資料的完整度和可靠度。註冊文件、L1/L2快取、共享記憶體,以及DRAM等接受到ECC保護。 | 桌上型電腦叢集效能 | 透過多重繪圖處理器,可比單一工作站中的小型伺服器叢集更快速地解決大量問題。 | 每一GPU具有高達6GB的GDDR5記憶體容量 | 透過將龐大資料集保存於直接與繪圖處理器接取的私屬記憶體中,將效能提升至最佳狀態,並減低資料傳輸速度。 | NVIDIA平行DataCache™ | 加速如物理解答器(physics solvers)、光線追蹤及稀疏矩陣乘法(sparse matrix multiplication)等演算法,其數據位址無法事先得知。這其中包括每塊流式多處理器中的可配置L1快取記憶體,以及所有處理器核心的統一L2快取。 | NVIDIA GigaThread™ 引擎 | 藉由比前一代架構快10倍之更快速的上下文切換、並存核心執行,以及加強的執行緒封鎖排程,進而最大化吞吐率。 | 異步傳輸 | 在運算核心忙碌時同時透過PCIe匯流排執行數據傳輸,如此可大幅強化系統效能。即使是像地震處理等需要大量資料傳輸的應用程式,亦可透過在需求出現之前將資料傳輸至私屬記憶體中,將運算效率提升至絕佳狀態。 | 支援廣泛編程語言和應用程式介面(API)的CUDA編程環境 | 可選擇C、C++、OpenCL、DirectCompute或Fortran表達應用並行機制,並可利用“Fermi”繪圖處理器的創新架構。NVIDIA平行Nsight工具已針對Microsoft Visual Studio開發者開放。 | 高速、PCI-Express Gen 2.0數據傳輸 | 最大化主系統和Tesla處理器之間的頻寬。讓Tesla系統能和具有開放PCI-E x16插槽、PCIe相容的任一主系統共同實際運作。 |
規格尺寸 | 9.75吋 PCIe x16插槽 | Tesla繪圖處理器數量 | 1 | CUDA核心數量 | 448 | CUDA核心頻率 | 1.15 GHz | 雙重精密浮點效能(最高) | 515 Gflops | 單一精密浮點效能(最高) | 1.03 Tflops | 專屬記憶體總容量* Tesla C2050 Tesla C2070 | 3GB GDDR5 6GB GDDR5 | 記憶體速度 | 1.5 GHz | 記憶體介面 | 384-bit | 記憶體頻寬 | 144 GB/sec | 耗電量 | 247W TDP | 系統介面 | PCIe x16 Gen2 | 散熱解決方案 | 主動式風扇散熱器 | 軟體開發工具 | CUDA C/C++/Fortran, OpenCL, DirectCompute 工具組 專為Visual Studio 打造的NVIDIA平行 Nsight™ |
* 注意:開啟錯誤修正程式碼(ECC)功能後,有一部分的專屬記憶體將用於ECC位元,因此可用記憶體將減少12.5%。(例如:3 GB的記憶體總量將擁有2.68 GB的可用記憶體。)
- 支援Tesla C2050/C2070 的作業系統
- Linux 32-位元和64-位元
- Windows XP, Windows Vista, Windows 7 (32位元和64位元)
- 垂直解決方案和軟體
- Tesla C2050 / C2070專屬軟體
|
|