圖示一
內存控制器中的探聽過濾器"snoop filter"為了獲取更佳的性能也進行了擴展。探聽過濾器為了適應24GB的雙路Harpertown處理器中較大的高速緩沖存儲器,也進行了擴充。作為一種特別的緩沖器,探聽過濾器Snoop Filter中儲存了緩存Tag結構。由于使用了MESI協(xié)議,為確保多核平臺中緩存的一致性,每一個處理器必須時刻注意另一顆處理器的總線情況,而使用探聽過濾器Snoop Filter將有助于減少處理器總線發(fā)生數據堵塞情況的發(fā)生。
當出現高速緩存未中時,探聽過濾器Snoop Filter將增加到發(fā)起的CPU總線上。隨后,探聽過濾器攔截探聽,并確定是否必須將探聽傳遞到四核中的另一個總線線段上。如果讀取請求同一總線上的另一個處理器得到滿足,則取消探聽過濾器訪問;如果沒有得到滿足,探聽過濾器訪問的結果將確定是否進行下一個操作。當然,也有可能在讀取請求過程中丟失探聽過濾器,此時就直接從內存返回數據,進入下一個循環(huán)。
從終端用戶透視圖上可以看到最顯著的變化來自于輸入/輸出I/O系統(tǒng)。Seaburg芯片集采用兩塊x86 PCI-Express Gen2顯卡,對圖形圖像處理和視頻編輯有較大幫助。上一代工作站芯片集Greencreek還不夠完善,只能用于單圖形顯卡。這些通道可以支持4×8 PCI-E Gen1或者8×4插槽來連接不同種類的存儲子系統(tǒng)或者高性能網絡,諸如10GB以太網。
系統(tǒng)配置情況
讓我們對基于Stoakley服務器平臺的超微2U系統(tǒng)和的基于Bensley平臺(使用過時的65納米四核Clovertown處理器)的英特爾系統(tǒng)做一個比較。在一種理想狀態(tài)下,我們使用相同頻率的MPU能更直觀的看到Harpertown處理器和Seaburg芯片組的進步,但不幸的是這根本是不可能做到的。仔細的分析和推論或許能彌補頻率上的差異。但是卻會引發(fā)更多不確定的因素。
Stoakley服務器平臺采用雙獨立前端總線,8個雙列直插內存模組,16GB內存。但是我們只選取了一半的內存用于測試,這顯然無法充分發(fā)揮Stoakley服務器平臺的優(yōu)勢而使得測試結果顯得有失公允。SPECjbb2005也能受益于額外的容量。多數的測試由于每個信道增加了多重雙列直插內存模組,也能充分利用額外的帶寬。FB-DIMM信道能同時對獨立的雙列直插內存模組進行讀寫,因此每個信道使用兩組雙列直插內存模組就能提升可使用的帶寬容量。
下面所有基準性能測試我們都運行了3次,最后結果取3次結果的平均值。初始循環(huán)數據通常會棄置不用來保證循環(huán)運算的準確性。我們特意擴大了基準測試的數量和范圍。在此先特別感謝技術支持部門的斯科特.沃森與我們分享多線程程序MyriMatch和循環(huán)運算測試軟件Euler3D。全套基準測試的軟件包括:
POV-Ray3.7測試版22 (64位)
FlamMap(64位)
Valve VRAD地圖生成測試(秒)
Sungard金融風險分析軟件(62位)
Euler3D循環(huán)運算測試軟件
MyriMatch多線程程序
SPECjbb2005 BEA JRockit 6 R27.4(Java服務器商業(yè)測算基準)
XMLMark數據結構
這些基準涵蓋了多類應用軟件領域:有三個主要用于傳統(tǒng)的高性能計算領域,兩個是JAVA服務器基準,還有兩個是內容創(chuàng)建基準。
POV Ray
POV-Ray 3.7測試版作為我們的標準透視圖基準已經最新升級到版本22.根據每秒的像素(Pixels/Sec)來反映在基準場景中的性能。
圖示二:POV Ray性能
對于POV Ray圖形軟件來說,Harpertown處理器在單時鐘基礎上比Clovertown處理器速度提高了大約2.3%。這并不讓人驚訝,因為POV Ray圖形軟件能夠對多線程技術提供原生支持。但芯片組額外的帶寬和高速緩存對微體系架構的改變沒什么幫助。
大體來說,在2.33兆赫茲和3兆赫茲的芯片之間對IPC進行比較并不完全準確。只有在POV Ray性能測試考慮到頻率,內核數量等因素才能提供更準確的線性測量。這種比較關系就是有效的。