最強通用計算卡NVIDIA Tesla M2090發布

張貼日期:May 30, 2011 7:10:5 PM

在針對遊戲市場發佈GeForce GTX 560的同一天,NVIDIA針對通用計算、高性能計算的Tesla產品線也進行了近一年來的首次更新。針對科學計算、超級電腦等大型用戶,NVIDIA發佈了目前市場上性能最強的通用計算卡Tesla M2090。

Fermi架構Tesla早在2009年就已經發佈,不過由於供電、散熱等方面的限制,當時針對工作站的Tesla C2070/C2050以及針對數據中心、超級電腦的Tesla M2070/M2050都對GPU進行了限制,遮蔽了兩組SM僅啟用448個CUDA核心。而今,遊戲市場的GeForce GTX 580通過使用GF110改進核心已經開啟了完整的512個CUDA核心,Tesla M2090就是它對應的高性能計算版本。

Tesla M2090提供512個並行處理核心,雙精度浮點峰值性能665GFlops,單精度浮點峰值性能1331GFlops。搭配6GB GDDR5 VRAM,關閉ECC校驗狀態下的VRAM頻寬為177GB/s。由於是針對數據中心、超級電腦等用戶,M2090和M2070/M2050一樣,在散熱設計上沒有使用風扇,僅用熱管散熱器依靠SERVER機架內風扇進行散熱。當然,顯示輸出接口在這樣的通用計算卡上也肯定不會存在。

根據NVIDIA的官方測試,4塊Tesla M2090加4顆CPU的系統可在AMBER 11分子模擬運算中,每天完成69納秒的模擬。而之前僅使用CPU的超級電腦,最高記錄也不過每天46納秒。

目前,Tesla M2090已經被裝配在惠普的HP ProLiant SL390 G7高性能計算4U伺服器中,該機最高可搭載8塊Tesla M2090以及兩顆CPU。

Hi all,

NVIDIA has unveiled the Tesla M2090 GPU, the world’s fastest parallel processor for high performance computing. In addition, the Tesla M2090 GPU achieved the fastest-ever performance in a key measure of scientific computation.

Equipped with 512 CUDA parallel processing cores, the Tesla M2090 GPU delivers 665 gigaflops of peak double-precision performance, enabling application acceleration by up to 10x compared to using a CPU alone.

In the latest version of AMBER 11, one of the most widely used applications for simulating behaviors of biomolecules, four Tesla M2090 GPUs coupled with four CPUs delivered record performance of 69 nanoseconds of simulation per day. The fastest AMBER performance recorded on a CPU-only supercomputer is 46 ns/day.

Attached is the Slide with full details.

pls contact:

沈昊威 ,Mike Shen Business Manager


E-Mail:mike@honghutech.com , MSN:michael71220@msn.com

2011台灣CUDA程式設計比賽報名網站上線(2011 Taiwan CUDA Contest) http://nvidia.ithome.com.tw/cuda/index.html