仁達(dá)敬談到:英特爾目前一顆CPU能支持10個(gè)線程進(jìn)行工作, 現(xiàn)在我們正在研發(fā)新的芯片,我們將提到眾核架構(gòu),能在一顆芯片里面支持200多個(gè)線程同時(shí)工作,為廣大的應(yīng)用開(kāi)發(fā)人員帶來(lái)新的機(jī)會(huì)和挑戰(zhàn),更好地去做并行編程。我們可以看到,現(xiàn)在大多數(shù)的設(shè)備,無(wú)論是超級(jí)本還是一些智能手機(jī),我們都可以看到它們現(xiàn)在已經(jīng)實(shí)現(xiàn)了兩核,甚至一些設(shè)備上已經(jīng)實(shí)現(xiàn)了四核的架構(gòu)。
接下來(lái)我們會(huì)推出一個(gè)新款的架構(gòu),叫做Knights Corner,這個(gè)還沒(méi)有正式上市,但是我們已經(jīng)做了很多的演示,包括在上面跑一些應(yīng)用。這個(gè)新的架構(gòu)對(duì)于很多開(kāi)發(fā)人員來(lái)說(shuō),我想面臨的問(wèn)題就是:您的應(yīng)用已經(jīng)為英特爾這個(gè)新的架構(gòu)準(zhǔn)備好了沒(méi)有。我們可以看到,這個(gè)設(shè)備新的架構(gòu)是可以同時(shí)處理200多個(gè)線程。所以對(duì)于并行編程來(lái)說(shuō),這是一個(gè)新的挑戰(zhàn)和機(jī)會(huì)。這僅僅是針對(duì)一些大型應(yīng)用,如果只是開(kāi)發(fā)了基于雙核或者四核的架構(gòu)的話,其實(shí)這個(gè)架構(gòu)上200多個(gè)線程同時(shí)跑的應(yīng)用也要做更深一步的考慮和準(zhǔn)備。
我們可以看一下,并行就是同時(shí)做多件事情,這個(gè)以前只有人可以做到,比如說(shuō)同時(shí)可以做多件事情,現(xiàn)在實(shí)際上隨著新的芯片技術(shù)的發(fā)展,機(jī)器也可以做到這一點(diǎn)。對(duì)于很多事情的處理來(lái)說(shuō)就變得非常方便和容易。針對(duì)絕大部分的軟件開(kāi)發(fā)人員來(lái)說(shuō),他們需要相應(yīng)的工具,包括培訓(xùn)等等措施來(lái)幫助他們實(shí)現(xiàn)并行。目前大多數(shù)處理器都是基于兩核、四核或者是八核的架構(gòu),但是眾核MIC架構(gòu)來(lái)說(shuō)是采用了比較新的架構(gòu),可以支持50個(gè)核。所以這種架構(gòu)對(duì)于絕大多數(shù)的數(shù)據(jù)中心和高性能中心是非常重要的。
我們可以從這張PPT上展示的世界上最大的500家超級(jí)計(jì)算機(jī)的圖當(dāng)中可以看到,英特爾的架構(gòu)仍然是最多的。這個(gè)圖最后的更新是從去年11月份 (2011 年11月份)。我們可以從11月份的數(shù)據(jù)里看到,93%中國(guó)新建的超級(jí)計(jì)算中心都是基于英特爾架構(gòu)。對(duì)于英特爾來(lái)說(shuō),中國(guó)仍然是非常重要的市場(chǎng),因?yàn)橹袊?guó)市場(chǎng)的業(yè)務(wù)量仍然是我們?cè)鲩L(zhǎng)最快的。另外我們可以看一下,和我們的合作伙伴來(lái)講,對(duì)于英特爾在中國(guó)的業(yè)務(wù)也是非常重要,并且我們也有很多很優(yōu)秀的員工,在英特爾中國(guó)開(kāi)發(fā)了一些很好的新技術(shù)。
下面我們可以談一下新舊兩種英特爾架構(gòu)的發(fā)展歷史。左邊是在15年前制造的機(jī)器,當(dāng)時(shí)是世界上首臺(tái)達(dá)到了每秒1萬(wàn)億次浮點(diǎn)運(yùn)算的機(jī)器,去年11月份,我們展示了Knights Corner這個(gè)眾核架構(gòu),我們可以看一下,這么一個(gè)小小的芯片,運(yùn)算能力已經(jīng)超過(guò)了1萬(wàn)億次浮點(diǎn)運(yùn)算。在15年以后,可能這個(gè)芯片也會(huì)裝到我們的手機(jī)上面。我們很高興地可以看到,英特爾一直在致力于推動(dòng)這個(gè)并行的進(jìn)展,在硬件方面我們有多核和眾核的架構(gòu),另外我們也能提供一些很好的開(kāi)發(fā)軟件產(chǎn)品推動(dòng)這個(gè)并行。英特爾實(shí)際上一直在做一件事情,就是用我們通用的技術(shù),比如用同一套軟件的工具和平臺(tái)去支持多核和眾核的架構(gòu)。
現(xiàn)在我們知道,目前有這兩種情況可以幫助到大家:一是細(xì)化到每一個(gè)核上的性能,二是看到核與核之間通訊的情況。這樣為大家提供了一個(gè)很大的方便,我們不單是針對(duì)單核的性能進(jìn)行調(diào)優(yōu),我們還可以針對(duì)核與核之間的通訊進(jìn)行優(yōu)化。對(duì)于很多開(kāi)發(fā)人員來(lái)說(shuō),他們既可以看到單個(gè)核上運(yùn)行的情況,另外一方面,他們也可以看到核與核之間通訊的情況,這樣對(duì)他們來(lái)說(shuō)是變成了非常容易的一件事情??赡苡泻芏嚅_(kāi)發(fā)人員他們還沒(méi)有意識(shí)到這種技術(shù)的重要性,但是對(duì)于英特爾來(lái)說(shuō),我們已經(jīng)提前預(yù)知到這個(gè)技術(shù)的重要性,所以我們不光是可以幫助你去看單個(gè)核上的計(jì)算能力,另外一方面,我們還可以看到核與核之間的通信效率到底怎么樣。
對(duì)于應(yīng)用來(lái)說(shuō),編譯器的性能效率是非常高效的,我們可以非常高興地為大家宣布,到目前為止,英特爾的編譯器編輯的性能仍然是最佳的。除了編譯器以外,我們提供了相應(yīng)的高性能庫(kù),這些庫(kù)同樣可以為我們的應(yīng)用帶來(lái)極大的性能提升。這是一個(gè)關(guān)于加解密算法的情況,加解密對(duì)于大家來(lái)說(shuō),在智能手機(jī)上,保護(hù)銀行帳號(hào),保護(hù)銀行信息是非常重要的。另外一個(gè)我們面臨的挑戰(zhàn)就是把大規(guī)模的數(shù)據(jù)量進(jìn)行傳輸和移動(dòng),對(duì)于大規(guī)模數(shù)據(jù)量的處理來(lái)說(shuō),壓縮和解壓的效率是非常關(guān)鍵的。像英特爾高性能的數(shù)學(xué)庫(kù),也提供了針對(duì)各種領(lǐng)域的科學(xué)運(yùn)算的絕佳效率和性能。除了剛才的編譯器和高性能數(shù)學(xué)庫(kù)、IPV庫(kù)提供的高性能的計(jì)算和處理能力來(lái)說(shuō),由于提供了高性能的處理效率。需要強(qiáng)調(diào)一點(diǎn),剛才提到的那些軟件技術(shù)和軟件產(chǎn)品,都可以同時(shí)支持現(xiàn)有和將來(lái)的多核,另外還可以針對(duì)眾核MIC架構(gòu)支持。 應(yīng)用的另外一個(gè)重要性就是面向未來(lái)的可擴(kuò)展性,如何擴(kuò)展到更多的核和更大的機(jī)器上。英特爾的軟件和硬件的完美結(jié)合,就確保了以后性能加速的增長(zhǎng)。這個(gè)圖是我們想給大家提供的一個(gè)例子,就是英特爾的Threading Building Blocks(TBB)在多核上絕佳的性能加速比。另外,英特爾MPI提供的是絕佳的通訊效率, 還減少了通訊的延遲。英特爾多性能構(gòu)建模塊是提供了絕佳的可擴(kuò)展性,特別是針對(duì)C++的開(kāi)發(fā)人員來(lái)說(shuō),是最好的并行編程方案。接下來(lái)我會(huì)重點(diǎn)詳細(xì)介紹 TBB,在之前要首先確保應(yīng)用者的可靠性。
我們可以看到阻礙計(jì)算效率的因素,比如一些等待是阻礙了正常計(jì)算的效率。我們做很多的工作,包括調(diào)試和分析,無(wú)非就是解決通訊和計(jì)算的效率問(wèn)題。我們?cè)谇懊嫣岬蕉嗑€程構(gòu)建庫(kù)這個(gè)技術(shù),所以目前這個(gè)技術(shù)已經(jīng)支持了多種操作系統(tǒng),并且可以運(yùn)行在不同的平臺(tái)上面,另外也是在我們應(yīng)用開(kāi)發(fā)人員當(dāng)中非常流行的,它對(duì)于很多C++的開(kāi)發(fā)人員做并行編程來(lái)說(shuō)是一個(gè)完整的解決方案。在過(guò)去幾年我們也不斷地對(duì)多線程構(gòu)建模塊進(jìn)行了進(jìn)一步的開(kāi)發(fā),無(wú)論讓你的TBB應(yīng)用于嵌入式設(shè)備,或者是針對(duì)圖形圖像的處理,都是做了很多的工作。
針對(duì)剛才提到的英特爾多性能構(gòu)建庫(kù)TBB,在幾年前就有一本書(shū)講授這個(gè)技術(shù),并且這本書(shū)已經(jīng)翻譯成了中文。我也和另外兩個(gè)同事在寫(xiě)一本新書(shū),是講述如何用TBB和Cilk? Plus進(jìn)行并行編程的,希望這個(gè)書(shū)可以在明年7月份出版。用一句話來(lái)說(shuō),英特爾是一直致力于軟件和硬件上面推行并行化技術(shù)的。無(wú)論是基于多核的架構(gòu)還是將要發(fā)布的50個(gè)核的眾核架構(gòu)來(lái)說(shuō),并行化是非常重要的一件事情。英特爾會(huì)提供一些工具,幫助我們開(kāi)發(fā)人員實(shí)現(xiàn)并行這個(gè)技術(shù)。