64位處理器是指處理器內(nèi)部的通用寄存器的寬度為64比特,支持整數(shù)為64比特寬度的算術(shù)與邏輯運(yùn)算。歷史上出現(xiàn)了4位、8位、12位、16位、32位、以及128位(比如1976年亮相的Comparator)等類(lèi)型的處理器。
現(xiàn)在我們通常說(shuō)的64位處理器,常常被用來(lái)描述CPU與外部進(jìn)行通信的數(shù)據(jù)總線(xiàn)和地址總線(xiàn)為64比特位寬。相比目前廣泛使用的32位處理器,64位處理器占用相同的數(shù)據(jù)會(huì)消秏更多的存儲(chǔ)器空間(更龐大的指針),從而增加進(jìn)程對(duì)存儲(chǔ)器的需求,且可能會(huì)影響高性能處理器高速緩存的使用。
然而,由于64位處理器采用的是64比特的位寬,一次可提取64位數(shù)據(jù),比32位提高了一倍,擁有更大的尋址能力,性能自然也會(huì)提升1倍,而且它還支持更大的內(nèi)存管理。
當(dāng)然,這種性能提升和實(shí)際應(yīng)用,是需要借助相應(yīng)的操作系統(tǒng)和軟件系統(tǒng)來(lái)支撐的,也即是俗稱(chēng)的64位操作系統(tǒng)。另外,還需要有專(zhuān)門(mén)的硬件驅(qū)動(dòng)程序(不同架構(gòu)需要有不同的驅(qū)動(dòng)),而常見(jiàn)的32位驅(qū)動(dòng)并不能在64位架構(gòu)平臺(tái)上進(jìn)行兼容。
在大家對(duì)64位處理器有了初步了解之后,下面,我們來(lái)回顧歷史上最為經(jīng)典的64位處理器。
1961年,IBM推出了IBM 7030 Stretch超級(jí)計(jì)算機(jī),這款超級(jí)計(jì)算機(jī)所搭載的技術(shù)仍然被沿用至今,也是1961年至1964年間,全世界運(yùn)行速度最快的計(jì)算機(jī)。
這款超級(jí)計(jì)算機(jī)應(yīng)用領(lǐng)域包括核彈開(kāi)發(fā)、氣象、國(guó)家安全和阿波羅登月計(jì)劃的開(kāi)展。它擔(dān)負(fù)如此重任,當(dāng)然與其超過(guò)的計(jì)算性能息息相關(guān)。而在當(dāng)時(shí)堪稱(chēng)世界上最快運(yùn)行速度的這款超級(jí)計(jì)算機(jī),其實(shí)主要得益于采用了大量?jī)?nèi)存(256000個(gè)64位字節(jié))和64位處理器模組。
IBM 7030 Stretch超級(jí)計(jì)算機(jī)
在當(dāng)時(shí),它可以執(zhí)行650000的浮點(diǎn)和1秒內(nèi)完成35萬(wàn)次乘法運(yùn)算。多達(dá)6個(gè)指令可被用在索引單元,5個(gè)指令專(zhuān)門(mén)用在并行運(yùn)算單元。因此,在某些情況下可提供最多11條指令來(lái)執(zhí)行運(yùn)算。
IBM 7030 Stretch數(shù)據(jù)處理系統(tǒng)
IBM 7030 Stretch超級(jí)計(jì)算機(jī)采用的是7101型CPU,它包含有大約169000個(gè)晶體管。整個(gè)IBM 7030數(shù)據(jù)處理系統(tǒng)的尺寸為67.5英寸*64.25英寸*29.5英寸(相當(dāng)于1.7145m*1.63195m*0.7493m)。該系統(tǒng)包含了 7101型CPU、7803功耗分布單元、7302 Core Storage、7619交換通道(提供8個(gè)I/O通道)、7620通道擴(kuò)展、353磁盤(pán)存儲(chǔ)單元、磁盤(pán)控制器、磁帶控制器、打印機(jī)控制器、以及卡片穿孔機(jī)、控制臺(tái)等模塊組成,功耗為21.6KW。
IBM 7030 Stretch數(shù)據(jù)處理系統(tǒng)一角
為了讓如此龐大的數(shù)據(jù)處理系統(tǒng)能夠充分發(fā)揮它的動(dòng)能,該超級(jí)計(jì)算機(jī)配備有Master Control Program(MCP)主控程序,STRAP II assembler(STRetch Assembly Program)延伸匯編程序、FORTRAN IV編譯器和Autocoder 2。
剛才介紹的是首開(kāi)64位計(jì)算先河的超級(jí)計(jì)算機(jī),其搭載的并不是真正意義上的64位處理器。全球首個(gè)商用的64位處理器應(yīng)該屬M(fèi)IPS公司于1991年推出的R4000。
R4000并不是無(wú)中生有而被創(chuàng)建出來(lái),而是MIPS早期32位R2000、R3000和R6000的擴(kuò)展——它們都在處理器發(fā)展史上獲得突破,但最大不同的地方是,R4000增加了內(nèi)外部的數(shù)據(jù)通道帶寬,也就是將尋址、寄存器和ALU算術(shù)邏輯單元增加到了64位。
NEC D30400RJ-40(40MHz,左)和東芝TC85R4000SC-50(50MHz)
雖然這種擴(kuò)展帶來(lái)的處理器面積的增加,但其擁有更加顯著的優(yōu)勢(shì)。首先,它支持更大的尋址空間,允許操作系統(tǒng)對(duì)TB級(jí)以上的文件直接進(jìn)行存入到內(nèi)存中進(jìn)行訪(fǎng)問(wèn)。相比之下, 32位尋址空間只能支持不超過(guò)4GB的容量。
另外,64位數(shù)據(jù)通道能夠在單個(gè)字節(jié)組中支持8位長(zhǎng)的單精度IEEE浮點(diǎn)數(shù)值和字符串。在更為重要的數(shù)字加密特定的算法中,更大的數(shù)據(jù)通道自然會(huì)有更好的性能表現(xiàn)。
R4000擁有六種不同的指令——兩種非條件轉(zhuǎn)移和4中條件轉(zhuǎn)移——它們又可被稱(chēng)為subroutines子程序。一旦啟動(dòng)執(zhí)行,這些指令就會(huì)返回一個(gè)鏈接或者返回地址。
東芝生產(chǎn)的TC86R4400MC-200 9636YJA(R4400)
另外,MIPS在推出R4000的時(shí)候,還兼顧到了之前的32位MIPS架構(gòu)直接的代碼兼容性。在1992年,MIPS在R4000的基礎(chǔ)上推出了 R4400處理器,它擁有更高的主頻(100MHz、133MHz、150MHz、200MHz和250MHz),而且緩存也從R4000的8KB提升到 16KB,包括230萬(wàn)個(gè)晶體管。
上世紀(jì)九十年代后,64位處理器發(fā)展如火如荼,各大芯片廠商都陸續(xù)推出了各自的看家本領(lǐng),或直接推出64位處理器,或者宣布64位處理器架構(gòu)加快市場(chǎng)布局。
在MIPS科技公司推出首個(gè)純正版64位處理器之后,DEC、英特爾、Sun、惠普、IBM相繼推出了相應(yīng)的產(chǎn)品和架構(gòu)方案。DEC公司在1992年,引入純64位 Alpha 架構(gòu),并于次年發(fā)布64位OSF/1 AXP 類(lèi)Unix 操作系統(tǒng)(后來(lái)改名為 Tru64 UNIX)和 OpenVMS操作系統(tǒng)給Alpha系統(tǒng)。
1994年,半導(dǎo)體巨頭英特爾宣布了64位IA-64 架構(gòu)的進(jìn)度表(與HP共同開(kāi)發(fā))作為其32位IA-32處理器的繼承者,路線(xiàn)圖定位在1998-1999期間。
IA-32向IA-64架構(gòu)演進(jìn)
1995年,Sun推出64位SPARC處理器UltraSPARC。UltraSPARC是一款superscalar超標(biāo)量體系架構(gòu)的微處理器,以順序形式執(zhí)行指令。
主頻為200MH的UltraSPARC處理器
該處理器擁有主次兩級(jí)緩存,主緩存有兩個(gè),分別對(duì)應(yīng)指令和數(shù)據(jù),總共容量為16KB。UltraSPARC需要有外部的次級(jí)緩存(L2),容量為 512KB至4MB,而且是直接影射(direct-mapped)緩存。外部緩存與同步SRAM(SSRAM)會(huì)以處理器的頻率進(jìn)行同步。
1997年,IBM推出了RS64全64位PowerPC處理器,并于次年發(fā)布了POWER3全64位PowerPC/POWER處理器。
PowerPC的歷史可以追溯到早在1990年隨RISC System/6000一起被介紹的IBM POWER架構(gòu)。該設(shè)計(jì)是從早期的RISC架構(gòu)(比如IBM 801)與MIPS架構(gòu)的處理器得到靈感的。
1990年,IBM、Apple和Motorola開(kāi)發(fā)PowerPC芯片成功,并制造出基于PowerPC的多處理器計(jì)算機(jī)。PowerPC架構(gòu)的特點(diǎn)是可伸縮性好、方便靈活。第一代PowerPC采用0.6微米的生產(chǎn)工藝,晶體管的集成度達(dá)到單芯片300萬(wàn)個(gè)。
IBM PowerPC 601處理器
2000年,IBM開(kāi)始大批推出采用銅芯片的產(chǎn)品,如RS/6000的X80系列產(chǎn)品。銅技術(shù)取代了已經(jīng)沿用了30年的鋁技術(shù),使硅芯片多CPU的生產(chǎn)工藝達(dá)到了0.20微米的水平,單芯片集成2億個(gè)晶體管,大大提高了運(yùn)算性能;而1.8V的低電壓操作(原為2.5V)大大降低了芯片的功耗,容易散熱,從而提高了系統(tǒng)的穩(wěn)定性。
IBM PowerPC 604e(主頻200MHz)
PowerPC 處理器有廣泛的實(shí)現(xiàn)范圍,包括從諸如 Power4 那樣的高端服務(wù)器CPU 到嵌入式 CPU 市場(chǎng)(PowerPC 任天堂Gamecube使用了PowerPC)。PowerPC 處理器有非常強(qiáng)的嵌入式表現(xiàn),因?yàn)樗哂袃?yōu)異的性能、較低的能量損耗以及較低的散熱量。除了象串行和以太網(wǎng)控制器那樣的集成 I/O,該嵌入式處理器與臺(tái)式機(jī)CPU 存在非常顯著的區(qū)別。PowerPC處理模型要從內(nèi)存檢索數(shù)據(jù)、在寄存器中對(duì)其進(jìn)行操作,然后將其存儲(chǔ)到內(nèi)存中。
早在1994年,英特爾宣布推出64位IA-64架構(gòu)的進(jìn)度表(與惠普共同開(kāi)發(fā))作為其32位IA-32處理器的繼承者。并在2001年,正式推出了英特爾自己的64位處理器產(chǎn)品Itanium(安騰)。
Itanium處理器代號(hào)為 Merced,是英特爾第一款專(zhuān)門(mén)應(yīng)用在高端企業(yè)級(jí)64位技術(shù)環(huán)境中的產(chǎn)品(Intel Architecture 64,簡(jiǎn)稱(chēng)IA-64架構(gòu))。這是為頂級(jí)、企業(yè)級(jí)服務(wù)器及工作站設(shè)計(jì)的,在Itanium處理器中體現(xiàn)了一種全新的設(shè)計(jì)思想,完全是基于平行并發(fā)計(jì)算而設(shè)計(jì)(EPIC) 。對(duì)于最苛求性能的企業(yè)或者需要高性能運(yùn)算功能支持的應(yīng)用(包括電子交易安全處理、超大型數(shù)據(jù)庫(kù)、電腦輔助機(jī)械引擎、尖端科學(xué)運(yùn)算等)而言,Itanium處理器正是大展身手的好舞臺(tái)。
Intel Itanium內(nèi)核
Intel Itanium
2002年,英特爾對(duì)Itanium進(jìn)行了更新,推出Itanium 2。得益于其平行處理架構(gòu)(Parallel Computing Microarchitecture),在同樣工作頻率下其效能約為CISC與RISC的八倍。
Itanium 2
Itanium 2處理器專(zhuān)為要求苛刻的企業(yè)和技術(shù)應(yīng)用而設(shè)計(jì)。基于Itanium 2處理器的平臺(tái)以較低的成本,提供了業(yè)界領(lǐng)先的性能 ,以及比專(zhuān)有RISC技術(shù)更廣泛的選擇空間,可幫助企業(yè)和機(jī)構(gòu)最大地提高其投資回報(bào)。Itanium 2處理器得到了廣泛生態(tài)系統(tǒng)的 支持,包括由40多家領(lǐng)先硬件廠商的具有出色可擴(kuò)充的開(kāi)放標(biāo)準(zhǔn)64位解決方案,諸如Windows Server 2003、HP-UX和Linux等的 超過(guò)5款操作系統(tǒng),以及數(shù)百種應(yīng)用和工具。
Poulson內(nèi)核
近日,英特爾與惠普宣布推出新一代的安騰9500,該芯片的研發(fā)代號(hào)為“Poulson”。Itanium 9500的片上內(nèi)存容量為54MB,包含8 個(gè)內(nèi)核、31億個(gè)晶體管;在4插座配置下,可以支持最高2TB的低電壓內(nèi)存條。
2003年,AMD推出Opteron皓龍?zhí)幚砥鳌pteron處理器主要用于多路服務(wù)器的領(lǐng)域上。較早期的 Opteron 處理器采用了K8微處理器架構(gòu),及至2007年后期逐步過(guò)渡至K10微處理器架構(gòu)。
AMD在64位處理器領(lǐng)域,其實(shí)有賴(lài)于AMD64位架構(gòu)的出爐。Opteron和Athlon 64也都屬于其64位處理器,后者更傾向于消費(fèi)級(jí)市場(chǎng)。
Opteron六核心處理器透視圖
首批Opteron的產(chǎn)品型號(hào)使用了三位數(shù)字,第一位代表服務(wù)器與工作站的路(1路, 2路, 4路和8路),第二和第三位代表處理器的時(shí)鐘頻率速度。其后推出的Socket F及AM2腳位的 產(chǎn)品改用四位數(shù)字,開(kāi)頭數(shù)字越大代表性能越好。
Opteron 170(早期皓龍產(chǎn)品采用3位數(shù)字命名規(guī)則)
Opteron的優(yōu)點(diǎn)是能以正常速度來(lái)運(yùn)行現(xiàn)有的32比特程序,以及能運(yùn)行新的64位程序,它們當(dāng)中可直接訪(fǎng)問(wèn)多于4GB的存儲(chǔ)器。Opteron集成了存儲(chǔ)器控制器,訪(fǎng)問(wèn)RAM的數(shù)據(jù)不需通過(guò)北橋。
Opteron 6300晶圓
前不久,AMD推出了基于下一代"打樁機(jī)"核心架構(gòu)的全新AMD皓龍6300系列服務(wù)器處理器。Opteron 6300系列產(chǎn)品線(xiàn)的基頻最高達(dá)到了3.5GHz,智能超頻模式最高可達(dá)3.8GHz。全線(xiàn)提供對(duì)頻率為1866Mhz的四通道內(nèi)存支持,并且是目前x86架構(gòu)處理器中僅有的超低壓至1.25V的內(nèi)存支持。所有產(chǎn)品均支持最高達(dá)384GB的內(nèi)存容量,覆蓋12條DIMM槽,最多支持4條x16的HyperTransport總線(xiàn)(每條帶寬為6.4GT/s)。
在AMD推出64位處理器取得巨大成功后,英特爾公司也不甘示弱,并著手開(kāi)發(fā)AMD64的替代品,也就是稱(chēng)為IA-32e——后來(lái)改名為EM64T的處理器產(chǎn)品。
2005年,英特爾公司推出了90納米Nocona至強(qiáng)處理器,支持EM64T技術(shù)的Nocona核心Xeon處理器,這是第一個(gè)64位至強(qiáng)處理器核心。它采用Prescott核心,90nm工藝,配備1MB L2緩存。Nocona Xeon頻率包括2.8/3.0/3.2/3.4/3.6GHz等幾款,能動(dòng)態(tài)調(diào)整功率并降低處理器的耗電需求。
Nocona至強(qiáng)處理器
Nocona至強(qiáng)兼容32、64位運(yùn)算模式,支持市場(chǎng)上所有的基于16位和32位軟件,同時(shí)對(duì)64位架構(gòu)下開(kāi)發(fā)的應(yīng)用軟件也能夠完全兼容。
Opteron與Nocona至強(qiáng)處理器
從內(nèi)存尋址來(lái)說(shuō),它打破了以往純32位架構(gòu)最大232字節(jié)尋址能力的極限,最高可實(shí)現(xiàn)近4.5TB的尋址能力,如此大量的內(nèi)存足以滿(mǎn)足當(dāng)前高端工作站、網(wǎng)絡(luò)服務(wù)器、數(shù)據(jù)服務(wù)器的處理需求以及未來(lái)軟件應(yīng)用的需求。
Opteron與Nocona至強(qiáng)處理器針腳
從技術(shù)角度來(lái)看,Nocona新至強(qiáng)處理器比傳統(tǒng)的32位增加了8組寄存器,可減少CPU對(duì)L1、L2緩存以及內(nèi)存的訪(fǎng)問(wèn)次數(shù),從而提高CPU的工作速度;再加上英特爾處理器既有的耗電低、體積小、輻射少、兼容性強(qiáng)等特點(diǎn),促成了Nocona新至強(qiáng)處理器在計(jì)算平臺(tái)上無(wú)可比擬的優(yōu)勢(shì),可為諸如媒體和游戲等應(yīng)用帶來(lái)出色的系統(tǒng)響應(yīng)能力。
至強(qiáng)融核協(xié)處理器
作為當(dāng)今企業(yè)級(jí)市場(chǎng)上,應(yīng)用最廣的處理器,至強(qiáng)一直深受用戶(hù)青睞。今年,英特爾進(jìn)一步更新了SNB架構(gòu)的至強(qiáng)E5-2600以及IVB架構(gòu)的至強(qiáng) E3-1200 V2、SNB-EP架構(gòu)至強(qiáng)E5-4600。并且,協(xié)同去年的至強(qiáng)E7以及今日發(fā)布的至強(qiáng)融核產(chǎn)品,為企業(yè)計(jì)算打造無(wú)縫的應(yīng)用方案。
以上,就是筆者介紹了最為經(jīng)典的幾款64位處理器,當(dāng)然,在整個(gè)64位處理器發(fā)展長(zhǎng)河中,還有很多其他富有代表意義的產(chǎn)品。這些64位處理器的發(fā)展,也需要有相應(yīng)的操作系統(tǒng)和應(yīng)用程序的支持,在運(yùn)算速度方面,以及多任務(wù)處理、應(yīng)力測(cè)試、簇等都需要有更寬的算術(shù)與邏輯運(yùn)算,從而更好地支撐這些應(yīng)用并帶來(lái)更高的性能。