與一年半以前推出的Sun UltraSPARC T1和去年冬天推出的Intel雙核安騰Montecito相比,將與本月20號(hào)左右終于正式面向市場(chǎng)發(fā)布的Power6,給高端處理器產(chǎn)業(yè)未來(lái)的走向、趨勢(shì)以及高端處理器的設(shè)計(jì)思想帶來(lái)了種種復(fù)雜的猜想,使得這一局面迷霧重重。
多核一統(tǒng)江湖
單芯片多處理器(CMP)的處理器設(shè)計(jì)思路,似乎已經(jīng)被業(yè)界認(rèn)可為近幾年唯一可行的微處理器設(shè)計(jì)方法,來(lái)有效應(yīng)對(duì)性能提升帶來(lái)的巨大的功耗挑戰(zhàn)。
可以看到,無(wú)論是早就采納了CMP思路的RISC處理器(主要是IBM的Power系列、Sun的UltraSPARC系列、HP的RA-RISC系列),還是近年來(lái)將多核炒得沸沸揚(yáng)揚(yáng)的x86處理器(主要是Intel的至強(qiáng)系列、AMD的皓龍系列),抑或是處理器產(chǎn)業(yè)的后來(lái)者如Intel的安騰和IBM的Cell,無(wú)一不是在往“更多核心”的方向走。
業(yè)界也似乎一致認(rèn)可,下一代的處理器將沿著4核、8核、32核甚至幾百個(gè)核的方向亦步亦趨走下去。
Sun的UltraSPARC T1最早印證了這種思路。
2005年11月份,UltraSPARC T1面市。每顆UltraSPARC T1處理器中包含8個(gè)處理器內(nèi)核,每核有4個(gè)線程,這是全球第一款能夠同時(shí)運(yùn)行32個(gè)并行線程的低功率、低熱的處理器。Sun還表示,擁有CoolThreads芯片多線程技術(shù)的UltraSPARC T1處理器具有極佳的環(huán)保特性的處理器,每個(gè)線程僅僅消耗2瓦功率,每一顆UltraSPARC T1處理器僅消耗功率70瓦。這個(gè)數(shù)字,在功耗問(wèn)題引起全球重視的氛圍中,顯得格外令人振奮,且再次印證了單芯片多核心設(shè)計(jì)思路在微處理器設(shè)計(jì)上的巨大優(yōu)勢(shì)。
后來(lái),在x86領(lǐng)域,Intel和AMD也開(kāi)始摒棄沿襲了多年的“更高主頻”思路,向多核轉(zhuǎn)型。尤其是在Intel推出4核至強(qiáng)系列處理器后,在功耗降低和性能提升方面顯示出了較雙核處理器更明顯的提升,使得“更多核心”的思路再度受到肯定。
之后不久,Intel也將多核心思路移植到處于尷尬處境的安騰平臺(tái)上,在2006年7月推出了第一款雙核安騰。雖然相比較傳統(tǒng)的RISC處理器和x86處理器,安騰在多核路上落在了后面,但是向多核轉(zhuǎn)型的思路卻是再明確不過(guò)了。
IBM在正統(tǒng)的Power之外與索尼、東芝共同開(kāi)發(fā)的另一款處理器Cell,也以1個(gè)主核、8個(gè)輔核的設(shè)計(jì)思路以及產(chǎn)品問(wèn)世后出色的性能,印證了單芯片多核心的勢(shì)不可擋。
一句話以蔽之,就是目前的微處理器設(shè)計(jì)中,多核心之所以能夠“一統(tǒng)江湖”,代表業(yè)界不再單純追求單個(gè)處理器或者單個(gè)處理器核心的計(jì)算主頻,而是強(qiáng)調(diào)系統(tǒng)單元的整體計(jì)算吞吐量。
所有的游戲場(chǎng)里,都會(huì)有一兩個(gè)與眾不同、獨(dú)樹(shù)旗幟者。
在多核心幾乎一統(tǒng)江湖的游戲場(chǎng)里,Power6就扯出了一面與眾不同的大旗,引來(lái)猜疑無(wú)數(shù)??高達(dá)5GHz的主頻,是驚世駭俗的大膽創(chuàng)新,還是迫于無(wú)奈的緩兵之計(jì)?
Power6的高主頻謎局
單芯片多核心(CMP)思路的確很好。
然而,它并不萬(wàn)能。實(shí)際上,早在2005年就有微處理器技術(shù)方面的理論專家指出,“雖然在未來(lái)的兩至三代CPU上,CMP能夠減輕功率效率方面we難題,但是單憑CMP并不能解決功率效率方面的挑戰(zhàn)。從長(zhǎng)遠(yuǎn)趨勢(shì)上來(lái)看,只有在基本線路和架構(gòu)上創(chuàng)新才是解決這類問(wèn)題的根本出路?!?/P>
IBM對(duì)于Power6的高主頻設(shè)計(jì),是否就是在基本線路和架構(gòu)上創(chuàng)新的一種思路?讓我們看看目前能夠拿到的一些技術(shù)參數(shù)吧。
去年冬天,IBM公司的Brad McCredie博士在微處理器論壇上透露了Power6架構(gòu)方面的細(xì)節(jié)??主頻在4GHz~5GHz之間,采用65納米絕緣硅(SOI)、10層金屬層工藝制造。“與90納米工藝相比,在同樣的功率下,性能提高了30%,這主要是由于使用了應(yīng)變硅技術(shù)。IBM的65納米工藝提供了0.65微米的高性能SRAM單元和0.45微米的單元以提高密度。存儲(chǔ)陣列單元使用了比邏輯元件更低的電壓,以減少功耗?!盡cCredie博士說(shuō)。
與前兩代產(chǎn)品一樣,Power6著重于系統(tǒng)架構(gòu)的搭建。每個(gè)微處理器單元(MPU)作為2路單芯片多處理器(CMP)設(shè)計(jì)來(lái)實(shí)現(xiàn),340平方毫米的芯片上集成了兩個(gè)同步多線程處理器,每個(gè)核心都配有專用二級(jí)高速緩存。下圖顯示了Power5+和Power6架構(gòu)的異同。
Power5+和Power6架構(gòu)比較圖
實(shí)際上,引起關(guān)注的不僅僅是Power6的高主頻,應(yīng)該看到IBM為此而進(jìn)行的微架構(gòu)調(diào)整。例如,Power6有極高帶寬可提供給處理器,比Power5+增加了一倍。在5GHz主頻下,每個(gè)MPU都有300GB/s的帶寬。另外,Power6還有一個(gè)內(nèi)存控制器和MCM內(nèi)的結(jié)構(gòu)線路,從而把I/O頻率從CPU頻率的三分之一提高到了二分之一。同時(shí),每個(gè)內(nèi)存控制器使用IBM的第三代同步內(nèi)存接口連接到內(nèi)存。與全緩沖DIMM一樣,這些共存內(nèi)存接口(SMI)芯片能夠配置更大的內(nèi)存空間、使用不同類型的內(nèi)存。
McCredie博士表示,Power6的系統(tǒng)架構(gòu)完全經(jīng)過(guò)了重新設(shè)計(jì),比前幾代產(chǎn)品先進(jìn)許多。 例如,Power6的一級(jí)數(shù)據(jù)高速緩存(L1D)增加了一倍,增至64KB; 聯(lián)合并行處理架構(gòu)也增加到了8路。因而, L1D時(shí)延增加到了4個(gè)周期,而POWER5及大多數(shù)其他高性能MPU卻是3個(gè)周期。Power6還對(duì)緩存進(jìn)行了技術(shù)革新。兩個(gè)4MB大小的專用二級(jí)高速緩存之間,有一個(gè)快速輸出緩沖器(cast-out buffer),便于兩者之間快速通信。三級(jí)高速緩存也得到了改進(jìn)。這些改進(jìn)能夠提高聯(lián)合并行處理能力,對(duì)多線程執(zhí)行極其有利,并且?guī)椭鶬BM對(duì)Power6的同步多線程(SMT)實(shí)現(xiàn)了比前幾代產(chǎn)品更大幅度的提升。
對(duì)于Power6,IBM更強(qiáng)調(diào)的是可靠性、可用性及可服務(wù)性(RAS)。例如最多可以將將一個(gè)Power6處理器劃分為1024個(gè)分區(qū),添加了內(nèi)存分區(qū)和遷移功能,以縮短用于修復(fù)的系統(tǒng)停運(yùn)時(shí)間等。
這些技術(shù)創(chuàng)新加在一起的結(jié)果,就是IBM對(duì)于市場(chǎng)的這句承諾:“Power6的性能可以比上一代產(chǎn)品提高兩倍,而功耗幾乎維持原來(lái)的水平?!?/P>
不管怎樣,IBM對(duì)于看上去與“多核時(shí)代”格格不入的Power6充滿了信心,對(duì)于業(yè)界的猜疑也不置可否,這就使得高端微處理器的未來(lái)走向顯得更加迷霧重重。
迷霧重重
假如執(zhí)意要走“高主頻”道路的Power6的性能比Power5+提升兩倍而功率維持不變,也許IBM在高端服務(wù)器市場(chǎng)的地位會(huì)得到進(jìn)一步加強(qiáng)。然而,在“多核心”之路上已經(jīng)嘗到了甜頭的Sun和Intel,似乎也是信心百倍。
明年,Sun采用大規(guī)模多線程技術(shù)的Rock處理器和英特爾備受期待的Tukwila(4核安騰)處理器將雙雙問(wèn)世。Power6、Rock和Tukwila誰(shuí)將更勝一籌?