當今 GPU 市場上為數據中心打造的精尖之作
全新的NVIDIA Pascal™ 架構讓Tesla P100 能夠為HPC 和超大規模工作負載提供超高的性能。憑藉每秒超過20 萬億次的FP16 浮點運算性能,經過優化的Pascal 為深度學習應用程序帶來了令人興奮的新可能。 通過採用 HBM2 的 CoWoS 技術實現更高效率 通過加入採用HBM2 的CoWoS(晶圓基底芯片)技術,Tesla P100 將計算和數據緊密集成在同一個程序包內,其內存性能是上一代解決方案的3 倍以上。這讓數據密集型應用程序的問題解決時間實現了跨時代的飛躍。 使用 NVIDIA NVLink 的大規模應用程序 計算性能常常受到互聯的限制。革新性的NVIDIA NVLink™高速互聯專為擴展跨多個GPU的應用程序而設計,與目前一流的技術相比,其性能提高了5倍。 注意:適用於PCIe的Tesla P100無法使用此技術 頁面遷移引擎讓編程更簡單 頁面遷移引擎解放了開發者,讓他們能夠更專注於優化計算性能,在管理數據移動方面少花些精力。目前,應用程序可能超過GPU 的物理內存大小,其內存超級高能達到兩兆兆字節。 適用於具備強擴展能力HPC的NVIDIA TESLA P100 加速器 利用搭載NVIDIA NVLink™ 技術的Tesla P100,快速節點可以顯著縮短為具備強擴展能力的應用程序提供解決方案的時間。採用NVLink 技術的服務器節點可以5 倍的PCIe 帶寬互聯多達八個Tesla P100。這種設計旨在幫助解決擁有極大計算需求的HPC 和深度學習領域的全球超級重大挑戰。 適用於混合工作負載HPC 的NVIDIA TESLA P100 適用於PCIe 的Tesla P100 使混合工作負載HPC 數據中心能在節省資金的同時,大幅提升吞吐量。例如,一個由四個與PCIe 互聯的Tesla P100 驅動的GPU 加速節點,可以為各種應用程序替代多達32 個通用CPU 節點。利用數量大幅減少而性能強大的節點完成各種作業,意味著客戶可以節省多達70% 的整體數據中心成本。 NVIDIA TESLA P100 加速器性能規格 |