Nehalem
其中,計算內核方面,Nehalem相較此前的微架構,在支持超線程、虛擬化設備輸入/輸出以及內核加速模式等方面有改進和加強。在支持超線程,Nehalem重新啟用超線程技術,它具有四個核心,最多可以支持八個線程。針對虛擬化技術的支持,Nehalem引入了虛擬化設備輸入/輸出(VT-d),在虛擬化CPU為主的基礎上,增加了設備輸入/輸出的虛擬化,以進一步提升虛擬機性能和效率。在內核加速模式(Turbo Mode)方面,用戶可以根據(jù)需要開啟、關閉以及加速單個內核的運行。對于一些具體應用而言。有些任務只需要兩個內核,采用Nehalem處理器,用戶就可以關閉另外兩個內核的運行,與此同時,提升兩個工作內核的主頻,以追求更高的性能。這種動態(tài)調整所帶來的靈活性,可以使得用戶的應用更加具有針對性,改善系統(tǒng)和CPU整體的能效。此外,Nehalem還新增了SSE 4.2指令集等。
與計算內核相比,Nehalem非計算內核的設計更為引人注目。其中,最為顯著的變化是拋棄了傳統(tǒng)的前端總線。我們知道,受限于前端總線(FSB)的共享設計方式,即使用戶購買了昂貴DDR3-2000頂級內存也無濟于事。此前所采用的前端總線,1066MHz只能提供8.53GB/s的帶寬,1333MHz和1600MHz也不過10.66GB/s和12.8GB/s,遠遠低于雙通道內存所能帶來的真正帶寬,以DDR2-800為例,其帶寬可以達到12.8GB/s(對應1600MHz前端總線),DDR3-2000更是高達32GB/s. 這就意味著,如果想要發(fā)揮兩條DDR3-2000的威力,必須把前端總線的頻率提高到4GHz(外頻1GHz),這顯然是不可能的。
在Nehalem的設計中,在處理器內部集成了內存控制器(IMC),也就是將其從芯片組上移開,集成到了處理器內部,從而徹底消除前端總線瓶頸,因此其內存讀取的延遲大幅度減少,內存帶寬大幅提升,最多可達三倍。此外,在緩存的設計上,Nehalem采用了三級全內含式Cache設計,其中,L1緩存的設計和此前的酷睿微架構一樣;L2緩存采用了超低延遲的設計,每個內核256KB;L3采用共享式設計,被片上所有內核共享。