QPI
intel的全新架構,Bloomfield將采用全新的LGA 1366 Socket,Package Size為42.5 x 45mm,散熱器設計雖然和LGA 775類似,但Mounting Holes為80mm,相較LGA775的72mm2更大,因此散熱器不能另相兼容,VRM采用全新的11.1版本,最高TDP為130W 。
利用雙向串聯點對點傳輸,它可提供與FSB相近的Latency,可讓軟件及操作系統管理,并且針對部份Streams(Threading、ISOC、LT/VT)及out of order requests作出了優化,單向最高速度暫 定為6.4GT/s,雙向最高速合共10.8GT/s,相比AMD采用的Hyper-Transport 3.0的速度更高。
Intel的QuickPath Interconnect技術縮寫為QPI,譯為快速通道互聯。事實上它的官方名字叫做CSI,Common System Interface公共系統界面,用來實現芯片之間的直接互聯,而不是在通過FSB連接到北橋,矛頭直指AMD的HT總線。無論是速度、帶寬、每個針腳的帶寬、功耗等一切規格都要超越HT總線。
QPI最大的改進是采用單條點對點模式下,QPI的輸出傳輸能力非常驚人,在4.8至6.4GT/s之間。一個連接的每個方向的位寬可以是5、10、20bit。因此每一個方向的QPI全寬度鏈接可以提供12至16BG/s的帶寬,那么每一個QPI鏈接的帶寬為24至32GB/s。(不過,這仍是遜色于AMD的Hypertransport3---單條連接最大傳輸帶寬可以達到45GB/s,但我們相信未來英特爾仍會對QPI進行進一步提速改進。)在早期的Nehalem處理器中,Intel預計使用20bit的鏈接位寬,大約能提供25.6GB/s的數據傳輸能力。這個數字是Intel在上一季IDF中公布的。舉例來說,在X48芯片組中,FSB的速度為1600MHz,這是目前為止規格最高的FSB總線了。不過最初的QPI總線具備25.6GB/s的吞吐量,這個值相當于1600MHz FSB帶寬的2倍。
QPI技術特點——效率更高
此外,QPI另一個亮點就是支持多條系統總線連接,Intel稱之為multi-FSB。系統總線將會被分成多條連接,并且頻率不再是單一固定的,也無須如以前那樣還要再經過FSB進行連接。根據系統各個子系統對數據吞吐量的需求,每條系統總線連接的速度也可不同,這種特性無疑要比AMD目前的Hypertransport總線更具彈性。
例如,針對服務器的Nehalem處理器將擁有至少4組QPI傳輸,可至少組成包括4枚處理器的4路高端服務器系統(也就是16枚運算內核至少32線程并行運作)。而且在多處理器作業下,每顆處理器可以互相傳送資料,并不需經過芯片組,從而大幅提升整體系統性能。隨著未來Nehalem架構的處理器集成內存控制器、PCI-E 2.0圖形接口乃至圖形核心,QPI架構的優勢將進一步發揮出來。
為了降低QPI總線的延遲,Intel打算在4路處理器以上的系統中使用一種叫做粘貼緩存的技術。它主要是倚靠更大容量的二級高速緩存來存儲南橋和北橋的數據,使處理器不必反復通過QPI總線來讀取南北橋信息。同時,為了更高提升數據處理效率,英特爾還將在處理器內部集成內存控制器(IMC)。QPI和IMC結合,可以讓Intel更輕松地擴展多路系統和高性能計算(HPC)應用,而Intel現有的處理器架構更關注于指令執行引擎和緩存架構,以便在單線程應用中提高性能,導致雙路服務器平臺性能受限,也無法在對內存帶寬需求甚高的HPC中發揮作用。對于第一代采用QPI總線的Nehalem Xeon來說,集成了3通道的DDR3內存控制器,這樣在搭配DDR3 1066的情況下,每個處理器自己就能得到25.6GB/s的內存帶寬,大概是現在Tigerton系統的5倍,并且這個帶寬數量隨著處理器插座的增長而增長,對于四插座系統,總的帶寬將增長到恐怖的102.4GB/s。強大的內存性能將保證即使每個插座上邊采用8核心的處理器,內存帶寬也不會成為性能發揮的瓶頸。需要說明的是在QPI中,對于四路系統來說,任何兩個處理器之間都可以直接通信,這樣,一個處理器可以很方便的訪問到其他處理器控制的內存,這可以大大提升效率。另外,由于在QPI系統下不同處理器可以直接通信,同步緩存稱為很方便的事情,再也不用通過北橋的內存讀寫來進行了。