Opteron242雙路處理器
詳情見下表:
不過,同年稍晚的六月,不甘落后的AMD又推出了“Sledgehammer”的單路和四路服務器版本的處理器:單路處理器主要針對底端方面的應用如個人計算機,而高端針對一些大型的科學計算。
單路:
四路:
AMD做事情仿佛有點拖拉,這也成了以后一貫的風格,在其后的8,9,11月以及次年的5月,斷斷續(xù)續(xù)的發(fā)布了更高頻率單路,雙路,四路的處理器。
同時,市場上出現(xiàn)了一些低功耗版本的opteron處理器,例如單路的opteron140EE,雙路的opteron240EE ,四路的opteron840EE,功耗僅僅只有30W,另外還有55W功耗的 opteron146HE,opteron246HE,opteron846HE。
AMD第一個使用90nm制造工藝的Venus(維納斯)核心
第一代的AMD 皓龍?zhí)幚砥?,都使用了相同代號核心,只是支持處理器的?shù)量不同,而到了2005年8月,AMD發(fā)布了第一個使用90nm制造工藝的Venus(維納斯)核 心、它是在Sledgehammer基礎上增添了多項新技術而來的,為單路的939針腳,擁有128K一級緩存和1MB (1,024 KB)二級緩存。使用200MHz外頻,支持1000MHz的HyperTransprot總線,集成了內(nèi)存控制器,支持雙通道DDR 400內(nèi)存,并且可以支持ECC 內(nèi)存。另外核心還提供了對SSE-3的支持,產(chǎn)品命名方式也是opteron1XX。這一系列的單路皓龍,能在普通的PC主板提供完美的支持,所以,深受 電腦發(fā)燒友的追捧,用這個來搭配家用電腦或者游戲平臺,性能強勁, 被譽為“平民的法拉利”,經(jīng)久不衰,堪稱經(jīng)典。
詳情見下表:
維納斯(2005年):
另外,單路的opteron還有一些代號為“SanDiego(圣地亞哥)”,其技術參數(shù)和Venice非常近似,我們也可以把這個看成是Venice可以將SanDiego看作是Venice核心的高級版本。具體型號,筆者無法考證。
同時,AMD還發(fā)布了代號為“Troy(特洛伊)” 的雙路、以及支持4路以上的800系列叫做Athens(雅典)的核心。
特洛伊: opteron 242―opteron 256,頻率從1600MHz-3000MHz-雅 典: opteron842-opteron856,頻率從1600MHz-3000MHz
當然還有一些低功耗版本(55W)的皓龍?zhí)幚砥?,如雙路的opteron246HE 、opteron248HE、opteron250HE,四路的opteron846HE、opteron848HE、opteron850HE。
2005年下半年,AMD發(fā)布了代號為Denmark(丹麥,采用Socket 939),持雙顆架構(gòu)代號為Italy(意大利 、940接口),代號為Egypt(埃及、940接口)。這些處理器都是雙核心處理器,采用了90納米制程,SOI工藝,主要面向服務器和工作站領域的應 用,支持AMD64位技術。支持單顆架構(gòu)的Opteron 165(1.8GHz)、170(2GHz)、175(2.2GHz)以及180(2.4GHz);支持雙路的Opteron 260(1.6GHz)、265(1.8GHz)、270(2GHz)、275(2.2GHz)以及280(2.4GHz);以及支持8顆串接的 Opteron 860(1.6GHz)、865(1.8GHz)、870(2GHz)、875(2.2GHz)以及880(2.4GHz)。當然,雙路主板也會支持 opteron800系列的CPU。以上算是opteron服務器處理器的第二代產(chǎn)品(K9)?!?/p>
作為早期的AMD進軍服務器市場的皓龍?zhí)幚砥鳎捎谏a(chǎn)工藝的影響,在頻率上遠不及intel同時期的XEON處理器,但是AMD憑借先進的設計理 念,采用了直連架構(gòu),也就是在opteron處理器上內(nèi)部集成了內(nèi)存控制器,減少CPU訪問內(nèi)存數(shù)據(jù)的時間,從而在處理性能上和intel不分伯仲。從而 奠定了服務器市場的堅實基礎。
AMD新款皓龍(Opteron)處理器
2006年8月15日,AMD發(fā)布了新款皓龍(Opteron)處理器。新款的opteon處理器還是處于雙核的階段,接口也和K9架構(gòu)的處理器有 了很大的改變,我們稱之為SocketF1207接口,皓龍包括Budapest(布達佩斯)和SantaRosa(圣羅莎)核心兩種,都采用采用 90nm的Rev.F工藝,Budapest核心實際上基于和桌面處理器一樣的AM2接口,同樣也能用普通的PC主板來提供支持,,他主要面向于個人工作 站以及底端的服務器市場。核心為SantaRosa為1207針腳,雙路和多路均采用了這個核心。功耗方面,除低功耗版55W及正常版本95W,還有超低 功耗的30W版。另外,還將有重視性能的140W版本。外頻提高到1333MHz,支持DDR2533/667/800ECC內(nèi)存。
當然,還有一些高功耗的版本處理器出現(xiàn),不過筆者以為,這些都是經(jīng)過超頻而來的。作為單路處理器的補充,Santa Ana(圣安娜)在2007年的2月份發(fā)布,功耗只有65W的圣安娜,全部為低功耗版本,型號從皓龍1210-1218,頻率從1800-2600。
2007年的9月,AMD高調(diào)發(fā)布了采用K10架構(gòu)、代號為Barcelona 巴塞羅那的皓龍?zhí)幚砥?,它采用?5納米的SOI制造工藝,Socket F接口(CPU的底部沒有傳統(tǒng)的針腳,而代之以1207個觸點,即并非針腳式而是觸點式,通過與對應的Socket F插槽內(nèi)的1207根觸針接觸)。包含Opteron 2300、Opteron 8300系列的標準版以及HE版,主頻在1.7GHz-2.0GHz,標準版為95瓦,HE的功耗僅68瓦。Opteron 2300包括2350、2347、2347 HE、2346 HE和2344 HE 五款產(chǎn)品;Opteron 8300系列包括8350、8347、8347 HE、8346 HE 四款產(chǎn)品。
但是,由于巴塞羅核心的緩存中的緩沖器(TLB)出現(xiàn)了問題,導致了皓龍市場的嚴重損失,這不能說是AMD的悲哀,在緊急處理后的B3版本皓龍?zhí)幚?器,修正了TLB錯誤,于2008年的3月開始生產(chǎn) 投放市場,但是受到前期事件的影響,皓龍?zhí)幚砥鱽G失了服務器芯片市場的半壁江山。這是一個令AMD神傷的產(chǎn)品,呵呵,一家之言。
單路方面,AMD繼續(xù)延用了Budapest(布達佩斯)的核心,不過由雙核的升級到了四核,2×1024K的二級緩存分割成4×512K,然后增 加了2048K的三級緩存,型號也比較少,只有opteron1352、1354、1356,市場也少見,以至于筆者也沒有見過這個CPU。
2008年12月,AMD正式發(fā)布了代號“上海”的新一代四核心Opteron服務器處理器,型號有同此前的“巴塞羅那”同樣基于直連架構(gòu)原生四核 心設計。生產(chǎn)工藝從65nm SOI改進為45nm SOI沉浸式光刻技術,三級緩存從2MB擴容至6MB,增強在虛擬化、數(shù)據(jù)庫和Java等內(nèi)存密集型應用的性能。內(nèi)存方面,拋棄了DDR667而支持 DDR2-800內(nèi)存,大幅提高存儲帶寬。真正支持HyperTransport 3.0總線技術,處理器間通信帶寬提高到17.6GB/s。AMD-V虛擬化技術改進:增強的快速虛擬化索引,主機與客戶機切換速度加快25%,同時可關 閉三級緩存索引,保證數(shù)據(jù)完整性。上海與巴塞羅那一樣繼續(xù)采用Socket F 1207插槽,因此實現(xiàn)了平臺的向下兼容,有利于數(shù)據(jù)中心的平穩(wěn)移植和升級。上海核心的皓龍?zhí)幚砥饔须p路opteron2376 -2384,以及多路的opteeron8378-8384。
根據(jù)生產(chǎn)一代,研發(fā)一代,計劃一代的指導思想,雄心勃勃的AMD計劃在2009年下半年會發(fā)布代號Istanbul (伊斯坦布爾)的原生六核心處理器,仍基于Socket F平臺,支持雙路、四路配置,現(xiàn)在使用的服務器平臺可以在更新BIOS之后,實現(xiàn)順利升級。
之后的2010年,AMD計劃全新的Maranello(馬拉內(nèi)羅)平臺登場,改用新的Socket G34接口,并轉(zhuǎn)向DDR3內(nèi)存和四通道HyperTransport 3.0總線。該平臺的處理器包括六核心SaoPaulo(圣保羅)和十二核心MagnyCours(馬尼庫爾)兩種,均采用45nm工藝生產(chǎn),集成 6/12MB三級緩存,支持新的硬件溫控和功耗管理功能。
AMD重點核心級產(chǎn)品詳解
AMD“伊斯坦布爾”(Istanbul)六核心服務器
在2009年的 Computex上,AMD發(fā)布了代號“伊斯坦布爾”(Istanbul)的六核心服務器,型號為Opteron 2400/8400系列。
據(jù)悉,“伊斯坦布爾”采用直連架構(gòu)的原生六核心設計,全面適合雙路、四路、八路服務器市場,支持AMD-V虛擬化技術和AMD-P電源管理技術套裝,繼續(xù)采用Socket F 1207平臺和低價高能效DDR2內(nèi)存架構(gòu),性能每瓦特相比上代四核心“上海”最多提升34%。
“Istanbul ”六核AMD皓龍?zhí)幚砥?/p>
AMD公司美國時間2009年6月1日宣布推出世界上首款采用直連架構(gòu)的六核服務器處理器,面向雙路、四路和八路服務器。代號為“Istanbul”的六核AMD皓龍?zhí)幚砥餮永m(xù)了AMD致力于以各種價位和無與倫比的平臺靈活性為客戶帶來卓越價值的承諾。
通過同一個平臺,AMD新的六核皓龍?zhí)幚砥髂軌驖M足對更多的核心和更高擴展性的需要,而AMD四核皓龍?zhí)幚砥鲃t可以提供經(jīng)濟高效和更節(jié)能的解決方 案。Cray、戴爾、惠普、IBM和 Sun等領先的OEM廠商,預計從本月開始提供基于AMD六核皓龍?zhí)幚砥鞯南到y(tǒng),同時該處理器還得到了主板和基礎架構(gòu)合作伙伴的支持。AMD六核皓龍?zhí)幚?器的HE、SE和EE版本計劃于2009年下半年推出。
AMD六核皓龍?zhí)幚砥鞒浞掷昧爽F(xiàn)有的平臺基礎架構(gòu)以及低成本、高能效的DDR-2內(nèi)存,有助于降低系統(tǒng)的采購成本。
高性能計算、虛擬化和數(shù)據(jù)庫工作負載等將從提升高達60% 的4P STREAM內(nèi)存帶寬中受益匪淺,這歸功于超傳輸總線HT Assist技術,它可以幫助降低處理器到處理器之間的延遲和數(shù)據(jù)流量。
AMD虛擬化技術(AMD-V)和AMD-P套件電源管理特性廣泛應用于各個性能和功耗段,確??蛻舨粫鎸π阅芎凸牡膬呻y選擇。
在完全相同的平臺上,與前一代四核處理器相比,新款AMD六核皓龍?zhí)幚砥鞯拿客咝阅芴岣哌_34%。(AMD 皓龍™處理器2435 型號與AMD 皓龍™處理器2382型號相比,前者的SPECpower_ssj™2008測試成績?yōu)椋嚎偡?297 ssj_ops/watt,287W、100% 目標承載時為501,246 ssj_ops;后者的SPECpower_ssj™2008測試成績?yōu)椋嚎偡?970 ssj_ops/watt,272W、100% 目標承載時為376,878 ssj_ops)
AMD代號為“Maranello”的6000系列平臺
AMD代號為“Maranello”的6000系列平臺,該平臺采用代號為“Magny- Cours”的處理器產(chǎn)品,該處理器是全世界首款8核心和12核心的x86處理器,面向2路以及2路以上市場,能夠滿足企業(yè)和主流計算苛刻的數(shù)據(jù)密集型工 作負載,并具有先進的虛擬化和能源效率的特點。
而對于另外的一部分用戶,他們更關心的可能是能效和成本的優(yōu)化,6000高端市場平臺顯然無法 滿足這部分客戶的需求,針對這一來用戶的產(chǎn)品將是代號“San Marino” 和“Adelaide”的4000系列平臺。據(jù)Gina解釋,4000系列處理器主打市場包含三部分,第一部分是需要低功耗、高密度計算以及高性價比的第 二部分是要求易用性一級擴展性的中小企業(yè);第三部分則面向要求高能效、一致性的企業(yè)基礎架構(gòu)市場。在4000平臺上,我們將會看到X86架構(gòu)下首款也是目 前唯一一款單核心功耗小于6瓦的產(chǎn)品。
首批適用于4000系列平臺的4100系列處理器在2010年第二季度上市,其主要針對于單路以及入門級的雙路市場,處理器擁有4個或者是6個運算核心。
AMD的4000系列平臺將會使用新的C32接口,該接口在設計上與現(xiàn)有的Socket F接口擁有同樣的1207針腳,只是重新定義了針腳,使得新平臺可以支持更高容量和速度的DDR3內(nèi)存,AMD 4000系列平臺支持2條內(nèi)存通道頻率最高支持1333MHz,HT總線的速率會上升到6.4GT/S,該平臺規(guī)格與2011年將推出的Valencia 實現(xiàn)兼容。
與4000系列不同,6000系列主打的是高端市場,因此在系統(tǒng)性能上將會有更好的表 現(xiàn),6000系列列將使用全球首款8核心與12核心的X86服務器用處理器。這一系列產(chǎn)品可以應對苛刻的數(shù)據(jù)密集型工作負荷,并提供令人難以置信的效率和 線程處理能力。AMD皓龍6000系列可以提供4個內(nèi)存通道數(shù)量,比競爭對手高出33%。
在接口上,6000系列將會使用新的G34系列接口,該接口將會擁有更多的針腳,有傳言針腳數(shù)為1974個,但AMD官方并未證實。
6000系列產(chǎn)品有全新的能效特性和全新的虛擬化功能,這點在產(chǎn)品發(fā)布時會給大家做詳細介紹。和4000系列一樣,6000系列平臺也具有一致性和可兼容性,能兼容AMD在2011年推出的下一代產(chǎn)品。
6000系列平臺的性能非常不錯,其增強的內(nèi)存架構(gòu)帶來了明顯的產(chǎn)品性能優(yōu)勢,與上一代產(chǎn)品相 比其基準帶寬提高了2.5倍。這為虛擬化、數(shù)據(jù)中心和高性能計算帶來非常高的性能,由于虛擬化程度上升,AMD皓龍6000系列可以使用更多的虛擬機,借 此使相關應用程序能夠獲得更好的性能,此外內(nèi)存帶寬和不同功耗產(chǎn)品之間具有一致性,內(nèi)存帶寬不會因功耗降低而受到影響和犧牲。
AMD在新產(chǎn)品推出時也充分考慮到了OEM合作伙伴的需求,4000系列和6000系列產(chǎn)品還 有很多功能點,可以使產(chǎn)品達到非常好的兼容性。新的平臺具有相同的芯片組和南橋芯片,相同的BIOS基礎代碼和編程接口,相同的驅(qū)動程序。對OEM客戶來 說,這使得他們的設計和驗證支持更加容易,便于客戶管理和維護系統(tǒng)。
AMD新的產(chǎn)品布局給人耳目一新的感覺,不過,新的劃分方式是否更加科學呢?換句話 說,4000系列平臺與6000系列平臺由于都涵蓋了雙路市場會不會發(fā)生自相競爭的尷尬呢?對于這樣的疑問,Gina顯然很有信心,她表示不排除兩個平臺 會有競爭的情況出現(xiàn),但二者重疊空間不大,競爭力度不大。但真的不需要有這種擔心嗎,Atom擠壓常規(guī)處理器從而造成利潤率下降的問題在AMD的競爭對手 Intel身上目前體現(xiàn)無疑,這種有重疊空間的產(chǎn)品劃分方式是否科學看來還需要經(jīng)過市場的檢驗,在這里,我們先祝AMD好運,畢竟,一個競爭力充分的市場 才能帶給用戶最大的利益。
AMD“英特拉格斯”(Interlagos)、“巴倫西亞”(Valencia)處理器
推土機架構(gòu)將在很長時間內(nèi)成為AMD服務器平臺的基石。2011年下半年,AMD會推出“英特 拉格斯”(Interlagos)、“巴倫西亞”(Valencia)處理器,升級新架構(gòu)的同時繼續(xù)分別兼容現(xiàn)在的Socket G34/C32封裝接口。這時候,處理器、芯片組、顯卡還是各自為政的。
大概到2012年(或者更晚一些),AMD會把處理器和芯片組、I/O控制器整合到一起,平臺 接口也因此改為新的Socket G42/G44。屆時,顯卡會針對服務器應用進行優(yōu)化,處理器架構(gòu)初期仍是推土機,但稍后會升級到新的“下一代推土機”(Bulldozer NG),或者也可以稱之為推土機的2.0版。
再往后,2014-2016年間,最激動人心的事情要發(fā)生了:AMD將采用模塊化的SoC設計 理念,把處理器、芯片組、I/O控制器、顯卡全部融合到一顆芯片之中,從而實現(xiàn)真正的異構(gòu)計算架構(gòu)。到那個時候,處理器部分的核心架構(gòu)首先還是推土機 2.0,但后期會再次升級。當然了,這種巨大的變化必然又會帶來新的封裝接口。
現(xiàn)在想分析AMD中遠期發(fā)展的具體細節(jié)顯然是不現(xiàn)實的,事實上AMD在路線圖上也多處含糊其 辭,表明很多地方仍處于初期規(guī)劃階段,但毫無疑問的是大方向已經(jīng)確定,那就是多核心x86處理器、多核心圖形芯片、芯片組和控制器的全方位融合,這也順應 了AMD公司的企業(yè)口號“The Future is Fusion”。
在日前的一份遠景路線圖上,AMD展示了處理器、顯卡、芯片組完全大融合的構(gòu)想,并且披露了推土機之后的又一代全新架構(gòu),暫且稱之為“Bulldozer NG”。
不過這個推土機2.0版并非只是一種幻想,實際研發(fā)工作已經(jīng)悄然開始了?,F(xiàn)在就有細心人發(fā)現(xiàn),AMD最近向GNU操作系統(tǒng)補丁集中添加了多種新的擴展,用于所謂的“upcoming bdver2 processors”,顯然就是即將推出的推土機2.0版處理器。
根據(jù)這一發(fā)現(xiàn),推土機2.0將會支持的新擴展有:
- BMI:Bit Manipulation Instructions,位操作類指令
- TBM:Trailing Bit Manipulation,追蹤位操作
- FMA3:three operand FMA [fused multiply-add] instructions,三操作乘加指令
我們知道,推土機將會支持四操作乘加指令的FMA4,實現(xiàn)非破壞性DEST并降低寄存器的壓力,今后再增加FMA3應該是為了實現(xiàn)與Intel Sandy Bridge/Ivy Bridge的兼容性,后者都支持FMA3。
FMA4指令可以允許a、b、c、d處于四種不同的寄存器狀態(tài),F(xiàn)MA3指令則要求d必須與a、b、c其中之一處于相同的寄存器狀態(tài)。前者可以提供更好的編程彈性,后者則可以縮短代碼長度,硬件支持也稍微簡單一些。AMD服務器架構(gòu)未來的路
2012年首先是Terramar(西班牙加泰羅尼亞的古老F1賽道)、Sepang(馬來西 亞雪邦),其中前者隸屬于Opteron6000系列,支持單路、雙路、四路并行,最多20個核心,支持四通道DDR3、PCI-E3.0,封裝接口改用 SocketG2012,平臺代號Porto(波爾圖);后者隸屬于Opteron 4000系列,支持單路、雙路并行,最多10個核心,支持三通道DDR3、PCI-E3.0,封裝接口改為SocketC2012,平臺代號 Luxembourg(盧森堡)。
它們將不再分別兼容現(xiàn)有的Socket G34/C32平臺,芯片組也會從南北橋雙芯片形式改為單芯片設計。
2013年,Opteron6000、4000系列分別迎來“Dublin”(都柏林)、 “Macau”(澳門),仍是最多20個和10個核心,只是制造工藝均升級為28nm。它們的接口繼續(xù)分別沿用SocketG2012/C2012,搭配 芯片組也不變,因此保持向下兼容,事實上平臺代號都不變。
這也就是說,Dublin、Macau將基本只是新工藝升級版,本身在架構(gòu)方面不會有多大變化,還是第二代增強版推土機內(nèi)核。