全面剖析2012 AMD伺服器平臺處理器 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
AMD去年底推出的Opteron 6200系列與4200系列處理器,核心全面採用新的Bulldozer架構,以6200系列而言,最多內建16核心 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
在2011年11月,AMD推出了新一代伺服器專用,代號為Interlagos的Opteron 6200與4200系列處理器,接續先前的Opteron 6100及4100系列,並且一舉將最高的內含核心數增加到16核心。 除了Opteron 6200與4200系列之外,AMD在3月20日發表3款代號為Zurich 的Opteron 3200系列,主要針對微型伺服器、網站主機代管與網路伺服器等低功耗需求。這系列處理器也和上述Opteron處理器一樣,繼續採用Bulldozer架構,而且內建8或4核心,但處理器插槽是AMD在桌上型電腦處理器所採用的AM3+規格。 處理器全面使用32奈米製程,並採用Bulldozer核心架構 在核心架構上,新一代Opteron系列處理器最大的改變,就是Bulldozer核心架構,並且將製程從45奈米提高為32奈米,而且增加處理器核心數量的同時,也延續、加強前一代所擁有的HyperTransport,並新增動態超頻技術Turbo Core。在採用的插槽上,Opteron 6200系列處理器採用G34規格,而4200系列則採用C32規格,而採用G34插槽的6200系列處理器,在外觀上呈現特殊的長方形,而不是一般常見的正方形。 而主機板相容性部分,從上一代Opteron 6100與4100開始,就開始各自使用G34與C32處理器插槽,因此即使是採用上述處理器的伺服器,換CPU後可以直接升級,且根據AMD的規畫,目前這些插槽規格,會延續使用到下一代採用Piledriver核心架構的處理器,所以這段期間並不會因為採用不同的處理器插槽,讓伺服器無法升級。 Bulldozer核心架構 在新的Bulldozer核心架構下,每個處理器核心模組都內建兩個擁有獨立L1快取記憶體的整數運算核心,以及與浮點運算排程器(使用2個128位元乘法累加器),並共用讀取器、編譯器與L2快取記憶體,而L3快取記憶體是由整顆處理器共用。 AMD伺服器平臺處理器推出規畫(2012-2013) 在AMD規畫的下一代伺服器處理器,依然採用G34、C32與AM3+的處理器插槽,並採用Piledriver核心架構,現有的Bulldozer核心架構的伺服器不必擔心升級的問題,另外還新增針對網頁代管以及微型伺服器架構的Opteron 3000系列。 產品定位涵蓋範圍廣,選擇較單純 在AMD 的Opteron處理器定位中,4000系列向來是針對單路與2路伺服器所搭配的處理器,而6000系列則使用於2路與4路伺服器,而最新發表的3200系列則是單路,但主打的是低功耗的環境,這和Intel Xeon推出E3、E5與E7等系列處理器的分類方式不大相同。 如果將Opteron 6000系列與Intel Xeon E7相提並論,或許是比較恰當的,因為它們同樣都支援2路與4路伺服器的架構。不過,Xeon E7系列處理器在配置上,若要將它們安裝在2路或4路的伺服器上,必須選用針對2路或以上規格的處理器,也就是說必須選擇更高規的處理器,例如E7-2860就只能用在2路,E7-4820就可以用在4路以及2路的架構(4插槽僅安裝2顆處理器),而Opteron 6200系列沒有這種限制,因為全系列都支援4路架構,也同樣可向下相容2路、甚至單路架構,也就是同型號的處理器不論是裝2顆或4顆都可以,不必特定選用針對2路或4路架構的處理器。 在價格部分,較便宜一直都是AMD處理器的特色,根據去年發表時的價格,Opteron 6200與4200處理器中最高階、價位最貴為6282 SE,每千顆單位的報價為1,019美元,這樣的價格在Intel Xeon E5處理器中,僅有E5-2650與E5-2650L,或是更低階的處理器價格,才會接近,或低於這顆處理器。而Xeon E7處理器中,更是僅有2路的E7-2803與4路的E7-4807售價低於Opteron 6282 SE。從這結果可看出AMD Opteron處理器的價格相較於Intel Xeon處理器相對便宜許多。 綜觀伺服器廠商的產品型號與規格,可看出目前採用AMD Opteron 6200或4200處理器的產品數量,遠少於Intel Xeon系列伺服器,例如HP的20款機架式伺服器系列中,僅有6款採用AMD處理器的產品,而Dell的22款機架式伺服器中,僅有6款採用AMD Opteorn處理器,而直立式伺服器則是付之闕如。有些廠商僅推出採用Intel Xeon處理器平臺的機種,並沒有任何AMD平臺的產品(如NEC),不難看出,目前處理器市場的主流處理器平臺仍然是Intel。 最多內建16個實體核心 在這一代採用Bulldozer核心架構的AMD Opteron系列處理器,最主要的改變,就是實體核心數量的增加。 在Opteron 6100系列中,處理器內建核心數量為8核心和12核心,而4100系列處理器是4核心和6核心,到了現在,採用Bulldozer核心架構的Opteron 6200系列處理器,核心數最多16核心,且另外還有4、8、12核心的選擇,而4200系列最多到8核心。 與Intel Xeon處理器相比,「實體」核心數量較多,一直是AMD Opteron處理器所強調的,舉例來說,Intel Xeon上一代處理器中,主打2路伺服器的5600系列處理器,最多只有實體4核心與6核心。 雖然Intel在目前最新的Xeon E7系列處理器中,最高擁有10核心,且有超執行緒(Hyper Threading)使每個實體核心模擬為兩個虛擬核心,讓作業系統可運用到更多的核心,例如在2路伺服器架構下,搭配2顆4核心的處理器,你的系統就有16個運算核心,但AMD Opteron則是實體核心就可達到這個數量。 另一方面,目前Intel Xeon E7處理器中,最多擁有10核心,加上超執行緒技術,每顆處理器一共有20個執行緒,雖然同時可處理的執行緒數量上比AMD Opteron 6200系列的16核心處理器還多,不過內建10核心的處理器僅限4路以上的伺服器架構,例如E7-4850或4860以上,而AMD Opteron 6200在2路伺服器即可採用。 就時脈而言,比較特別的,是主打2路與4路的Opteron 6200系列處理器中,有一顆僅有4核心且沒有Turbo Core超頻技術的6204,雖然以這規格來看,這顆處理器規格較低,但是它的基礎時脈高達3.3GHz,居所有Opteron 6200系列處理之冠。 在I/O方面,AMD Opteron處理器從上一代6100系列開始,即採用了HyperTransport 3.1的技術,讓處理器與處理器之間可直接產生連結溝通(Direct Connect Architecture),且當中的傳輸速度達6.4GT/s。 近來因為虛擬化的需求與日漸提升,伺服器對記憶體的需求也越來越高,尤其是記憶體總容量的需求。 對AMD Opteron 6200而言,在記憶體容量的支援上,每顆處理器都可對應256GB,例如2路伺服器可支援24支記憶體(512GB),而4路伺服器的話,則可安裝32支記憶體(1TB)。另外,新一代的Opteron 6200系列處理器也繼續支援4條記憶體通道的存取方式、新支援DDR3 1600MHz的記憶體規格。 1個Bulldozer模組內建2個整數運算核心 新的Bulldozer架構與以往處理器設計的方式有很大不同,那就是它將兩個整數運算核心合併,而且這兩個核心共用一些編譯器(Decode)與讀取器(Fetch),同時共用一個浮點運算排程器(FP Scheduler)整合在同一個模組中。以16核心的Opteron而言,實際上是以8個Bulldozer所組成。 AMD認為,這種架構的好處,是在多執行緒的狀態下,可以使每個核心分別運算,並且在L2快取記憶體的部份共用運算結果,加快運算的速度。 除了前面提到的整數運算、浮點運算,以及提高處理器核心時時脈的Turbo Core技術之外,採用Bulldozer核心架構的Opteron系列處理器,也將多種常見的指令集內建其中,例如SSE4.1、SSE4.2、SSSE3等編碼標準,以及先進向量擴充指令集(AVX)與進階加密標準指令集(AES)等。 首度加入動態超頻技術 在時脈超頻的技術上,Bulldozer架構採用的是AMD 第二代的Turbo Core的技術,第一代Turbo Core技術首次出現在AMD產品,是在桌上型電腦處理器Phenom II X6上。這種超頻的方式和Intel的Turbo Boost類似,同樣可以動態調節核心的頻率,適合需要執行緒較少,但是需要高時脈來加速運算的工作。 AMD新一代核心超頻技術Turbo Core AMD Turbo Core超頻技術,讓處理器可依工作內容與負載,動態調整全部核心的運作狀態,並可在特定需要高時脈工作的狀態下,降低部分核心,提高其餘核心的時脈。 而Turbo Core的處理器頻率,變化分為3階段:所有核心都運作在基礎時脈上、所有核心加速機制都啟動的狀態,以及部分核心最大加速機制啟動。 在一般狀態下,所有的處理器核心都只運作在基礎時脈上,而這種狀態下處理器的熱設計功耗(TDP)都還有餘裕。第二種是所有核心的加速機制都啟動的狀態,每個核心的時脈速度可提高300MHz到500MHz,而TDP已經處於最高負載狀態;第三種為最大加速模式,則是讓部分核心的時脈速再提升,最高可提高1GHz,其餘核心則是處於待機狀態。 看起來和Intel Turbo Boost有些類似,但是AMD Turbo Core在超頻時,僅能集中在一半的核心上,也就是如果是16核心處理器,在最大加速模式下,可以讓8個核心的時脈速度提高,不像Intel Turbo Boost2.0可集中在單一核心上,而且很可惜的是其他核心僅處於低速狀態,無法完全關閉,因此仍會有因運作而產生的耗能。反觀Turbo Boost在超頻時,可以集中在部分,甚至單一核心時脈上,而其他核心則處於關閉狀態。 整體而言,AMD的Turbo Core在運用彈性與效能供應上,都還有進步的空間。文⊙林柏凱 2012 AMD最新Opteron處理器的規格
|
星期三, 4月 25, 2012
AMD伺服器平臺處理器 文/林柏凱
訂閱:
張貼留言 (Atom)
沒有留言:
張貼留言