NVIDIA News


NVIDIA推出Kepler架構Tesla GPU開創運算全新標準

張貼者:2012年5月16日 下午8:28eddie liu   [ terence liao 已於 2012年11月15日 下午7:30 更新 ]

NVIDIA(輝達)宣布發表全新系列Tesla®繪圖處理器(GPU),並搭載革命性的NVIDIA®Kepler GPU 運算架構,不僅讓GPU加速運算更加簡易,也讓更廣泛的高效能運算(HPC)科學和科技應用能加以運用。 


新款NVIDIA Tesla K10與K20 GPU是專為處理全球最複雜的HPC運算難題打造的加速器。Kepler架構專為高效能與超高省電效率設計,其效率是前一代NVIDIA Fermi™架構的3倍。NVIDIA Fermi™架構在兩年前推出時,曾在平行運算樹立全新性能標竿。 

NVIDIA(輝達)公司首席科學家Bill Dally表示:「Fermi是運算領域中的一大躍進,它在高效能運算領域的第一線確立了GPU加速運算的價值,並吸引數十萬開發者加入GPU運算平台。由於GPU不僅容易運用、應用領域廣泛且具有高效率的特性,全新的Kepler架構將發揮相同的顛覆性,把GPU帶入廣大的運算領域。」 

Tesla K10與K20 GPU已於本周登場的GPU技術大會(GTC)上發表。其他重大發布,皆可至GTC 線上新聞室參閱。 

NVIDIA(輝達)開發了一套創新架構技術,讓Kepler GPU具備高效能與高能源效率,並適合更多的開發者及更廣泛的應用。各項重大創新包括: 
SMX串流多重處理器:作為每個GPU的基本建構元件,SMX串流多重處理器須重新設計,藉以達到高效能與能源效率的目標。它能提供較Fermi串流多重處理器快高達3倍的每瓦效能,能實現在僅10個伺服器機架的空間中,打造一部運算效能達1 petaflop的超級電腦。SMX能達到如此高的能源效率,是因為CUDA核心增加了4倍,同時又降低每個核心的時脈速度,並且在閒置模式時透過電源閘控的方法關掉部分GPU電路,盡可能使作為平行處理核心的GPU範圍最大化,而非僅作為控制邏輯電路。 

Dynamic Parallelism:這項功能讓GPU執行緒能機動跨越到新的執行緒,讓GPU能針對資料進行動態調整。它大幅簡化了平行處理的程式撰寫工作,讓GPU能針對更廣泛的熱門演算法提供加速,例如自適性網格精緻化、快速多偶極演算法、以及多重格點演算法等。 
Hyper-Q:這項技術讓多個CPU核心能同時運用單一Kepler GPU內的多個CUDA核心。如此即可大幅提高GPU使用率,縮減CPU的閒置時間並促進可編程性。Hyper-Q非常適合用在採用MPI訊息傳遞介面的叢集應用程式。 

NVIDIA(輝達)公司GPU工程部資深副總裁暨Kepler首席工程師Jonah Alben表示:「我們在設計Kepler時鎖定三項目標: 效能、效率及可及性。它代表GPU加速運算的一大里程碑,並將帶動下一波運算研究的突破發展。」 

NVIDIA Tesla K10 與K20 繪圖處理器 
NVIDIA Tesla K10 GPU能針對訊號、影像及地震資料處理等應用提供全球最高的資料吞吐量。專為油氣探勘與國防工業等客戶進行最佳化的單Tesla K10加速板,內含兩顆GK104 Kepler GPU,能使單精度浮點運算尖峰效能達4.58 teraflop,並提供每秒320 GB的記憶體頻寬。 

NVIDIA Tesla K20 GPU是Tesla GPU產品系列的全新旗艦產品,專為運算密度最高的高效能運算環境量身打造。Tesla K20預期將成為全球最高效能、最省電的GPU,預計將於2012年第四季問市。 

Tesla K20搭載GK110 Kepler GPU,這款GPU的雙精度運算速度較搭載Fermi架構的Tesla產品快3倍以上,並支援Hyper-Q與Dynamic Parallelism功能。GK110 GPU預計將被運用在由美國田納西橡樹嶺國家實驗室打造的全新Titan超級電腦,以及伊利諾州立大學香檳分校的國家超級電腦應用中心打造的Blue Waters系統。 

IDC高效能運算部門專案副總裁Earl C. Joseph表示:「自Fermi發表後兩年以來,各界開始廣泛運用混合運算技術,讓眾多關鍵的高效能運算應用能達到更高的效能。在未來兩年,我們估計將有越來越多的GPU運用,讓GPU在許多應用中發揮更高的效能。」 

CUDA 5平行編程平台預覽版 
除了Kepler架構外,NVIDIA(輝達)同時發表CUDA 5平行編程平台的預覽版。此平台將提供給超過2萬個NVIDIA GPU運算註冊開發者計畫的會員,將讓開發者開始探索各種方法利用新款Kepler GPU的各項優勢,包括動態平行處理。 

CUDA 5平行編程模型預計在2012年第三季全面供應。開發者可至CUDA網站加入GPU運算註冊開發者計畫,即可取得預覽試用版。 

關於Tesla GPU 
NVIDIA Tesla GPU是以NVIDIA CUDA®平行運算平台打造的密集型平行運算加速器。Tesla GPU專為節能的高效能運算、運算型科學和超級運算設計,相較於僅搭載CPU的途徑,可針對廣泛的科學類和商用應用提供大幅提升的應用加速。目前全球全5大超級電腦中就有3部系統搭載NVIDIA Tesla GPU。 

欲瞭解更多關於Tesla GPU的資訊,請瀏覽Tesla網站。歡迎至Twitter(@NVIDIATesla)追蹤Tesla的最新消息。 

關於GTC 
GPU技術大會促進全球對於GPU運算及視覺化的認識,以及其對於未來科學和創新的重要性。欲知NVIDIA及其夥伴的最新消息,請瀏覽GTC新聞室。 

關於NVIDIA (輝達) 
NVIDIA(輝達)公司在1999年發明了繪圖處理器(GPU)後,便讓全世界認識到電腦繪圖功能的威力;如今,其處理器啟動從智慧型手機到超級電腦等廣泛的產品。NVIDIA(輝達)的行動處理器,普遍應用於手機、平板電腦以及車用資訊娛樂系統中。PC遊戲玩家仰賴GPU,享受真正身歷其境的世界。專業人士利用GPU創造電影中精采的3D繪圖和視覺效果,也設計出從高爾夫俱樂部到大型噴射客機等各種物件。而研究員運用GPU,可以透過高效能電腦促進科學新領域的發展。NVIDIA(輝達)擁有超過4,500項已核發、認可或申請中之專利,其中包括現代運算技術基礎之設計與深入研究。欲瞭解更多NVIDIA(輝達)詳細資訊,請瀏覽NVIDIA網站。

更多解決方案:
鴻鵠國際股份有限公司 
住址:新北市永和區保生路1號10樓之2。 
電話:代表號02- 29299388 
傳真:02-29297579
Email:marketing@honghutech.com


2012 GPU運算里程碑(NAB 2012 - Landmark Year for GPU Computing )

張貼者:2012年5月9日 下午9:15eddie liu   [ 已更新 2012年5月9日 下午9:18 ]


Hello Partners,

National Association of Broadcasters (NAB) begins today in Las Vegas and is expected to draw over 90,000 people from a range of industries focused on content creation including - film, broadcast and post production. NAB is the premiere show worldwide for media & entertainment and this year our message is that the power of NVIDIA Quadro and Tesla GPUs is fundamentally transforming content creation workflows across the industry.

 

We have a tremendous footprint on the show floor with a small but impactful booth lined with demos showcasing how GPUs are delivering real and significant business value by accelerating Animation, Rendering, Encoding, Finishing, Editing, Motion Graphics and the entire creative process. But our reach and story extends well beyond our booth and into over 40 partner booths as well where there are companies from startup to long standing industry icons using GPUs to re-invent their businesses.

 

The amazing work done across the company has resulted in:

-         15 new applications driven by GPU computing, including a landmark release from Adobe with CS6 now including GPU computing in 4 different applications in their suite

-         4 new Maximus success stories which demonstrate how the power of multi-gpu computing is changing business workflows from small independents through to major studios and delivering significant new business value.

-         6 new GPU Direct for Video partners highlighting the importance of the GPU for video processing

 

Please also stick with our GPU Genius website for more info.

 

Any feedback is welcome.

 

BRs,

 

PSG Team

Tesla Advantage(Tesla與GeForce比較)

張貼者:2010年6月29日 上午12:55蔡長明   [ eddie liu 已於 2013年1月10日 下午11:06 更新 ]

Tesla系列擁有更快速的雙精準的浮點運算速度,可以達到將近515 GigaFlops,
Tesla系列擁有更快速的PCI-E通訊,擁有兩個DMA引擎,針對bi-directional 通訊。而GeForce系列僅有一個DMA引擎。
Tesla系列擁有更大的記憶體,高達3GB&6GB的選擇,針對HPC的應用程式可以發揮更大的功效。GeForce系列最大的記憶體為1.5GB
相關優勢如下表比較
   




Advantages

Tesla

GeForce

Faster Double Precision Performance

515 GigaFlops

Much lower at 1/8th  single precision

Faster PCI-E Communication

Two DMA engines for bi-directional communication

Only one DMA engine available

Larger Memory Size

3GB & 6GB available for HPC apps

Largest memory is 1.5GB

Optimized for InfiniBand

NVIDIA GPUDirect for accelerated communication

Extra memory copies and context switching

Performance Drivers

TCC driver on Windows reduces CUDA kernel overhead

Kernel launch overhead reduces GPU performance




Advantages

Tesla

GeForce

ECC Protection

All internal and external memories protected

No memories protected

Zero Error Stress Tested

Stress tested for several days with zero tolerance for error

Tested only for graphics apps

Manufactured by NVIDIA

Guaranteed by NVIDIA to be of highest quality

Manufactured by 3rd party board makers

Enterprise Level Support

Three year warranty and prioritized support for bugs and feature requests

Consumer level support

ISV Certification

HPC software vendors certify only on Tesla

Functionality/performance risk with software



Advantages

Tesla

GeForce

Integrated Systems

Innovative servers and workstations

System design and support not on consumer products

18-24 Month Availability

Longer life cycle for investment protection

Supply depends on consumer demand

Cluster management and GPU monitoring

Access GPUs in clusters for temperature, power, and usage

No support for datacenter features

HPC Expertise

Total solution expertise provided by CUDA/OpenCL engineers and technical staff

No HPC expertise or support









NVIDIA發表多項GPU高速運算應用成果

張貼者:2010年1月26日 上午7:25Admin strator   [ eddie liu 已於 2013年1月10日 下午11:06 更新 ]

沈欣蓓/報導
2010/01/22 下午6:51

GPU的高平行運算能力在近幾年來成為研究單位以及具高速運算需求的廠商們不斷研究與討論的議題。NVIDIA於今日(1/22)即舉辦一研討會,發表各領域運用GPU所研發出來的成果,其中包括中國清華大學研究利用GPU運算開發新一代搜尋引擎和電子設計自動化、台灣大學透過GPU進行氣象模式的平行化運算、工研院電光所展示其在開發3D影像系統的進展、以及澳洲科學研究機構CSIRO利用GPU強化即時醫療影像的應用。

除此之外,台灣優必達科技更是利用了GPU的高速運算能力造了一朵雲(Cloud Computing)。台灣優必達科技執行長郭榮昌即表示,該公司打造一多媒體雲端運算平臺,專為終端裝置廠商、電信業者以及多媒體與遊戲廠商們提供多媒體內容檔案的轉檔以及供應的服務,「因此我們對於網路延遲性與即時性需求較高,NVIDIA的GPU解決方案即可滿足我們這方面的需求。」

另外,澳洲科學研究機構CSIRO運算和模擬科學研究部門Dr. John A. Taylor表示,該組織利用GPU讓醫療影像處理更加快速,「舉例來說,傳統叢集系統處理同步輻射X光斷層掃描至少要10到20個小時才能完成,而採用GPU高速運算能力之後,可將時間縮短到數分鐘之內完成。我們也希望未來GPU能夠讓醫療影像處理更加即時並具互動性,透過網路即可做到遠距醫療的願景。」

而中國清華大學陳文光教授表示,高速運算對於搜尋引擎來說有其一定的需求,但以Yahoo所使用的Hadoop框架為例來說,其應用的程式語言與GPU有所不同,因此若要將GPU應用在搜尋引擎技術上,其撰寫程式上必須下更多功夫,「目前我們正在和百度洽談這方面的開發應用,未來在部分大量密集運算需求上有GPU發揮的可能。」

此次研討會除了展示與發表各領域在GPU的應用進程之外,NVIDIA也發表各項更新軟體功能與工具,包括專為CUDA C編譯器所做的更新有對C++的支援、對下一世代「Fermi」GPU產品的支援性等;另外也釋出了R195驅動程式以及整合在微軟Microsoft Visual Studio的開發環境NVIDIA Nexus beta版,其提供密集式的平行運算開發。

新聞來源:網路資訊雜誌
http://news.networkmagazine.com.tw/server-and-storage/2010/01/22/17218/


Nvidia積極以GPU佈局高效能運算市場

張貼者:2010年1月26日 上午7:23Admin strator   [ 已更新 2010年1月26日 上午7:53 ]

/蘇文彬 (記者) 2010-01-22

Nvidia與業者合作釋出更多支援Nvidia CUDA平行運算技術的開發工具,並與產業、教育單位合作,積極向高效能運算市場進軍。 

Nvidia以與產業合作釋出軟體開發工具的方式,積極推動支援CUDA平行運算架構的GPU,搶進高效能運算市場。 
Nvidia
今天在台舉辦GPU運算與趨勢研討會,向外界展示各項Nvidia GPU協同運算與國內外產業的合作成果,針對國內高效能運算用戶推廣GPU協同運算技術,藉由GPUCPU協同運算提昇運算效能,用於3D影像製作、搜尋技術,甚至架構在雲端的線上遊戲等等。 

目前已有一些軟體支援GPU協同運算功能,例如訊連科技的PowerDVD、魅力四射等等,能以GPU協同運算加速影片轉檔及影像人臉辨識速度,而在數值計算、模擬等高效能運算軟體上也提供支援。 

例如優必達今天在研討會現場展示運用GPU架構的雲端線上遊戲平台,讓手機或MID等隨身的口袋行動裝置即使沒有很高的運算效能,也能透過網路傳輸在手機上原本需要高效能才能玩的線上遊戲。另外工研院電光所也將GPU協同運算用在3D立體影像製作上,而中國清華大學則用在搜尋引擎技術。 

不只專業領域的高效能運算市場,目前Nvidia的消費級GPU產品如GeForce繪圖晶片也都支援CUDA平行運算架構,能以GPU協助CPU運算。Nvidia認為,未來CPUGPU分工,CPU適合作業系統等一般的序列運算,而GPU則能以平行運算加速應用程式處理,分散傳統CPU的工作負載。 

未來GPU平行運算效能,Nvidia已發表了採用下一代繪圖運算架構FermiGF100繪圖處理器,內建30億顆電晶體,內建較目前Nvidia GPU240個還多的512CUDA核心與384位元記憶體介面,並支援GDDR5 DRMA提昇繪圖記憶體效能。但可惜的是,GPUCPU的協同運算仍透過較慢的PCI G2連接,在GPUCPU協同運算上無法加速資料傳輸速度,未來還有待較更快的PCI G3推出。 

在軟體開發工具方面,Nvidia除了新版CUDA Toolkit 3.0 Beta可支援Fermi繪圖架構,也推出可整合於Microsoft Visual Studio中的Nvidia Nexus GPU平行運算開發環境。另外Porland則推出第一個支援CUDAFortran編譯器,AllineaTotal View則推出專供HPC應用程式除錯的工具。

 



何謂GPU運算?

張貼者:2010年1月26日 上午7:06Admin strator   [ eddie liu 已於 2013年1月10日 下午11:07 更新 ]

 
Tesla: GPU Computing

何謂GPU運算?

GPU運算為使用GPU(繪圖處理器)去執行一般的科學和技術的運算。 

GPU運算的模式為在一個異質模型中同時使用CPU和GPU。其中有關應用程式的連續部分在CPU上運作,重度計算的部分則在GPU由GPU負責。就使用者的角度而言,由於採用了GPU的高效能去強化處理能力,因此應用程式的運作速度得以加快。 
GPU Computing

應用程式開發者必需修改他們的應用程式以將其重度計算的核心分配至GPU。應用程式的其他部分則仍在CPU上運作。欲將某功能分配至GPU,則必需重寫此功能,以執行此功能中的平行運算,並增加”C”關鍵字,如此才能在應用程式和GPU間傳輸數據。 

GPU運算能力來自於由NVIDIA的龐大平行架構,其被稱為CUDA架構。此CUDA架構包含100多個處理器核心,這些核心經由協同運作以處理應用程式中的數據集。 

Tesla 10-series GPU為第二代的CUDA架構,其功能針對科學應用進行最佳化,例如IEEE標準雙重精密浮點硬體支援;分佈在GPU中以分享記憶體形式存在的本地端數據數據快速緩衝儲存;以及合併記憶體接取等。

"繪圖處理器經過不斷的發展,已能輕易地執行許多實際應用,且其運作速度較多核心系統加快許多。
未來的運算架構將是複合式系統,由平行核心和多核心中央處理器共同運作。"

Prof. Jack Dongarra
創新運算實驗室主任
田納西大學

GPU運算的歷史

繪圖晶片最初是被做為固定功能繪圖管線。隨著時間進展,這些繪圖晶片的可程式化程度日益增加,讓NVIDIA得以推出全球第一顆GPU,或稱為繪圖處理器。在1999至2000年間,特別是電腦科學家,以及在醫療成像和電磁學等領域中的研究者開始採用GPU去運作一般的運算應用程式。他們發現GPU優異的浮點運算效能讓許多科學應用的效能大幅提昇,而這也帶動了科學界廣泛使用所謂的GPGPU;以GPU進行一般運算蔚為風潮。

NVIDIA深知讓廣大科學界使用GPU的高效能大有可為,因此決定投入資源修改GPU,使其能完全的程式化,以利科學領域的應用,並增加對於高階語言,例如C 和C++的支援。這些努力造就了GPU的CUDA架構

CUDA平行架構及程式化模型

CUDA平行硬體架構搭配有CUDA平行程式模型,其提供一抽象指令集,能夠表達精細等級不同的數據,以及平行任務。程式設計者可選擇以高階語言,例如C, C++, Fortran或是驅動程式API,例如OpenCL™ 和DirectX-11 Compute去表達平行任務。

Programming Model

NVIDIA首先針對C語言提供語言支援。CUDA的C語言軟體發展工具套件讓GPU能採用C語言,以最少的關鍵字或延伸指令進行程式化。針對Fortran, OpenC等程式語言的支援即將推出。

CUDA平行程式化模型導引程式設計者將問題劃分為數個粗略的子問題,這些子問題能被分別以平行的方式進行處理。之後再針對子問題進行精細的平行處理,以確保能以平行方式協同處理每一子問題。

CUDA GPU架構以及相對應的CUDA平行運算模型現已使用於100餘種應用中,且有將近1000篇的研究論文論及此架構及模型。 CUDA 專區列出多項應用及多篇文章。

OpenCL是蘋果公司之商標,經由Khronos集團授權使用。

    
   鴻鵠國際代理資訊 歡迎來電洽詢


01/22/2010: Accelerating the Pace of Drug Discovery using GPUs

張貼者:2010年1月25日 下午9:14Admin strator

By Sumit Gupta, posted Jan 22 2010 at 02:37:39 PM

This post is an entry in The World Isn’t Flat, It’s Parallel series running on nTersect, focused on the GPU’s importance and the future of parallel processing. Today, GPUs can operate faster and more cost-efficiently than CPUs in a range of increasingly important sectors, such as medicine, national security, natural resources and emergency services. For more information on GPUs and their applications, keep your eyes on The World Isn’t Flat, It’s Parallel.

Every time I hear about some little boy or girl who has a life-threatening disease, I get reenergized to promote the opportunities that computers offer in helping reduce disease and finding cures for human ailments. The exciting new developments on this frontier have to do with using parallel computing to speed up research and create the breakthrough discoveries that will save lives.

Finding new drugs is a complex and laborious task. Biochemists have to try millions of compounds before they can figure out which ones are effective against a particular virus or bacteria or which cause a desired reaction in the human body. To narrow the field, scientists use automated tools for high-throughput screening. But at some point, they have to test the remaining biochemical compounds in time-consuming manual experiments in a “wet” laboratory. (See our recent piece on the Tesla BioWorkbench for more information on how we’re helping researchers in the life sciences use GPU computing in their work.)

Drug_Discovery_Process_in__Wet_Labs_

Testing compounds is an iterative process, and it can take up to more than five years before a new drug is finally discovered. Then there are five or more years of clinical trials and so on as part of the FDA approval process. Obviously, anything that can accelerate the testing process makes a significant difference in the speed with which a potentially lifesaving new drug gets on the market.

Computation-based_Drug_Discovery

Computer simulations of biochemical reactions help point scientists in the right direction and improve their productivity. The problem is, the computer simulations necessary for this type of research are so compute-intensive they’re typically done on supercomputers. It can take weeks or months on a supercomputer to simulate just one biochemical reaction. For example, in order to simulate how tiny cellular mechanisms called ribosomes work to build proteins out of amino acids, it took scientists at Los Alamos National Laboratory more than eight months of supercomputer time to recreate a process that in reality takes about 2 nanoseconds.

With about 15 million to 20 million researchers who could benefit from supercomputer access and roughly a couple thousand supercomputers, there’s just not enough computing resources to go around. Right now biochemists have to request time on these supercomputers a year in advance, and not all researchers even get access.

But if the right tools are available, scientists don’t have to wait to test their new ideas. This is where parallel computing can accelerate innovation, by removing the compute bottleneck represented by traditional supercomputers.

The tremendous parallel processing capability of GPUs accelerates life-sciences applications by an order of magnitude. For example, a popular molecular simulation applications called NAMD (nanoscale molecular dynamics) gets the same performance out of four GPUs as it does out of 16 CPUs. The speed-up is a result of the parallel architecture of GPUs, which enables NAMD developers to port compute-intensive portions of the application using the CUDA C toolkit.

The shift to parallel computing in the life sciences means that biochemists can use a desktop Tesla Personal Supercomputer with four GPUs and outperform a large cluster of CPU servers in a data center. If they need more compute for their simulations, they can easily scale by using GPU-based clusters.

Scientists can thus augment their PCs and departmental servers with GPUs and start doing large biomolecular simulations without requiring a supercomputer. (Of course, GPUs are also being added to the supercomputers soon.)

By giving scientists greater access to computing resources, GPU-based computer simulations are helping to fulfill the promise of using computers to accelerate the pace of drug discovery. 

1-7 of 7