NVIDIA TESLA C2050 C2070

    張貼者:2010/6/29 上午1:09Cm Tsai   [ 已更新 2010/6/29 上午1:13 ]
    NVIDIA Tesla™ C2050和C2070運算處理器利用平行運算加快轉換速度,並將小型叢集的強大效能完整地轉移到桌上型電腦中。採用代號為”Fermi”的新一代CUDA架構,Tesla 20系列的繪圖處理器產品家族支援技術和商業運算單位所需的「必要」功能,包括C++ 支援、錯誤修正檢查碼的記憶模組(ECC memory),可提供絕佳的精確度和擴充性,以及較Tesla 10-系列繪圖處理器高出7倍的雙精密度效能。Tesla™ C2050和C2070運算處理器的設計宗旨為賦予高效能運算全新定義,並使得所有用戶都能享受超級運算的優質體驗。

    相較於最新的四核心CPU,Tesla C2050和C2070運算處理器能以二十分之一的功耗和十分之一的成本提供同等的超級運算效能。 


        鴻鵠國際代理資訊
     聯絡接洽:陳先生 ZYE 
     聯絡電話:(02)8231-5565 分機 18
     聯絡手機:0921-037-911
     聯絡信箱:
    zye@honghutech.com
     聯絡地址:台北縣永和市保生路 2 號 10 樓之 1

    功能

    由Fermi世代的CUDA架構挹注威力的繪圖處理器

    相較於採用最新四核心CPU的純CPU系統,能以二十分之一的功耗和十分之一的成本提供叢集效能。

    448個CUDA核心

    在每一顆GPU中傳輸高達515 Gigaflops的雙精密度最高效能,讓每一台獨立工作站可提供超越1 Teraflop的效能。每一顆繪圖處理器的單精密度最高效能可達1 Teraflop。

    錯誤修正檢查碼(ECC) 的記憶模組支援

    符合工作站的運算精確性和信賴度的嚴格要求。提供記憶體的資料防護,強化應用所需資料的完整度和可靠度。註冊文件、L1/L2快取、共享記憶體,以及DRAM等接受到ECC保護。

    桌上型電腦叢集效能

    透過多重繪圖處理器,可比單一工作站中的小型伺服器叢集更快速地解決大量問題。

    每一GPU具有高達6GB的GDDR5記憶體容量

    透過將龐大資料集保存於直接與繪圖處理器接取的私屬記憶體中,將效能提升至最佳狀態,並減低資料傳輸速度。

    NVIDIA平行DataCache™

    加速如物理解答器(physics solvers)、光線追蹤及稀疏矩陣乘法(sparse matrix multiplication)等演算法,其數據位址無法事先得知。這其中包括每塊流式多處理器中的可配置L1快取記憶體,以及所有處理器核心的統一L2快取。

    NVIDIA GigaThread™ 引擎

    藉由比前一代架構快10倍之更快速的上下文切換、並存核心執行,以及加強的執行緒封鎖排程,進而最大化吞吐率。

    異步傳輸

    在運算核心忙碌時同時透過PCIe匯流排執行數據傳輸,如此可大幅強化系統效能。即使是像地震處理等需要大量資料傳輸的應用程式,亦可透過在需求出現之前將資料傳輸至私屬記憶體中,將運算效率提升至絕佳狀態。

    支援廣泛編程語言和應用程式介面(API)的CUDA編程環境

    可選擇C、C++、OpenCL、DirectCompute或Fortran表達應用並行機制,並可利用“Fermi”繪圖處理器的創新架構。NVIDIA平行Nsight工具已針對Microsoft Visual Studio開發者開放。

    高速、PCI-Express Gen 2.0數據傳輸

    最大化主系統和Tesla處理器之間的頻寬。讓Tesla系統能和具有開放PCI-E x16插槽、PCIe相容的任一主系統共同實際運作。


    規格尺寸

    9.75吋 PCIe x16插槽

    Tesla繪圖處理器數量

    1

    CUDA核心數量

    448

    CUDA核心頻率

    1.15 GHz

    雙重精密浮點效能(最高)

    515 Gflops

    單一精密浮點效能(最高)

    1.03 Tflops

    專屬記憶體總容量*

    Tesla C2050
    Tesla C2070

     

    3GB GDDR5
    6GB GDDR5

    記憶體速度

    1.5 GHz

    記憶體介面

    384-bit

    記憶體頻寬

    144 GB/sec

    耗電量

    247W TDP

    系統介面

    PCIe x16 Gen2

    散熱解決方案

    主動式風扇散熱器

    軟體開發工具

    CUDA C/C++/Fortran, OpenCL, DirectCompute 工具組
    專為Visual Studio 打造的NVIDIA平行 Nsight™

    * 注意:開啟錯誤修正程式碼(ECC)功能後,有一部分的專屬記憶體將用於ECC位元,因此可用記憶體將減少12.5%。(例如:3 GB的記憶體總量將擁有2.68 GB的可用記憶體。)