新一代高密度機(jī)架優(yōu)化服務(wù)器技術(shù)剖析

---寶德PT1300R&PT2300R


寶德科技服務(wù)器研發(fā)工程師 陳振智


  從高密度機(jī)架優(yōu)化式機(jī)架式服務(wù)器問(wèn)世到現(xiàn)在已經(jīng)有兩年多時(shí)間了,其小巧緊湊的外型、主流的性能非常適合高密度機(jī)房環(huán)境,契合了企業(yè)用戶IT系統(tǒng)建設(shè)"數(shù)據(jù)集中、高效處理"的趨勢(shì),博得廣泛歡迎。現(xiàn)在,用戶不僅已經(jīng)接受了機(jī)架式服務(wù)器,而且在新購(gòu)服務(wù)器時(shí),大多數(shù)的用戶會(huì)首選機(jī)架式服務(wù)器。據(jù)賽迪咨詢2002初的調(diào)查結(jié)果顯示,機(jī)架式服務(wù)器占新購(gòu)服務(wù)器比例的49%,超過(guò)了傳統(tǒng)的塔式服務(wù)器,更有一知名公司統(tǒng)計(jì)得出其機(jī)架式服務(wù)器銷售將年增長(zhǎng)80%多的結(jié)論。


  但是,機(jī)架式服務(wù)器在內(nèi)部的設(shè)計(jì)上有其特別高要求。首先是高可用性。機(jī)架式服務(wù)器內(nèi)部狹小又應(yīng)用于高密度環(huán)境下,對(duì)散熱的要求更為苛刻;其次,它必須是易管理的。由于機(jī)架式服務(wù)器往往是幾十上百架的疊放,且不帶自己的監(jiān)視器和輸入設(shè)備,網(wǎng)管人員一是難以找到發(fā)生故障的機(jī)器,二是找到后的維護(hù)十分不便。此時(shí),WEB管理、自動(dòng)預(yù)警等管理特性就十分主要。針對(duì)這些特性,我們從客戶實(shí)際應(yīng)用的角度入手,進(jìn)行技術(shù)創(chuàng)新,完善了機(jī)架式服務(wù)器的可管理性、穩(wěn)定性與高可用性等關(guān)鍵性能,引領(lǐng)機(jī)架式服務(wù)器技術(shù)潮流。并因此獲得用戶青睞。


  現(xiàn)在就讓我們走近"新一代高密度機(jī)架優(yōu)化式服務(wù)器先鋒"---寶德PT1300R與PT2300R,一探究竟。


  真正安全的硬盤(pán)熱插拔技術(shù)


  問(wèn)題:當(dāng)插入新硬盤(pán)或拔出一個(gè)硬盤(pán)時(shí),硬盤(pán)可能會(huì)被正在工作的電源損壞。


  解決方案:寶德PT1300r/2300r硬盤(pán)熱插拔背板使用了電源隔離技術(shù),實(shí)現(xiàn)真正安全的硬盤(pán)熱插拔。在PT1300r/2300r硬盤(pán)熱插拔背板上,每個(gè)SCA硬盤(pán)接口的電源都分別被獨(dú)立的電源開(kāi)關(guān)控制。當(dāng)硬盤(pán)背板通過(guò)SCSI總線探測(cè)到一個(gè)硬盤(pán)可能存在故障時(shí),這個(gè)硬盤(pán)的電源將會(huì)被關(guān)閉,這時(shí)這個(gè)故障硬盤(pán)就可以被安全拔出,減小硬盤(pán)被損壞的可能性。當(dāng)一個(gè)新的硬盤(pán)插入時(shí),電源控制系統(tǒng)會(huì)稍等片刻,待硬盤(pán)完全插到位后,才會(huì)給硬盤(pán)上電。當(dāng)硬盤(pán)熱插拔背板探測(cè)到一個(gè)硬盤(pán)被拔出時(shí),它將會(huì)立即切斷這個(gè)硬盤(pán)槽的電源供應(yīng)。這將防止當(dāng)硬盤(pán)只是被局部拔出又重新被插回時(shí)對(duì)硬盤(pán)可能造成的損壞。同時(shí)也防止可能的供應(yīng)電壓的下降造成整個(gè)硬盤(pán)陣列的中斷。另外,PT1300r/2300r的硬盤(pán)熱插拔背板還支持熱備用硬盤(pán)的電源控制。熱備用硬盤(pán)的電源始終處于被關(guān)閉狀態(tài)直到一個(gè)硬盤(pán)發(fā)生故障。當(dāng)一個(gè)硬盤(pán)出現(xiàn)故障時(shí),熱備用硬盤(pán)的電源將會(huì)被自動(dòng)打開(kāi),并立即進(jìn)入服務(wù),而不需要操作員的干涉去更換硬盤(pán)。最后,當(dāng)插入一個(gè)短路的硬盤(pán)或一個(gè)硬盤(pán)在操作時(shí)發(fā)生短路時(shí),PT1300r/2300r硬盤(pán)熱插拔背板還支持電源控制線路的自動(dòng)旁路。這樣可以防止熱插拔SCSI背板被短路硬盤(pán)所產(chǎn)生的過(guò)大電流損壞。


  故障彈性引導(dǎo)技術(shù)


  問(wèn)題:一個(gè)故障的處理器會(huì)使服務(wù)器無(wú)法引導(dǎo),導(dǎo)致服務(wù)器宕機(jī)。


  解決方案:寶德PT1300r/2300r服務(wù)器使用故障彈性引導(dǎo)技術(shù)來(lái)徹底避免由于一個(gè)服務(wù)器CPU故障而引起的服務(wù)器當(dāng)機(jī),以保證服務(wù)器的高可用性。也就是說(shuō)如果PT1300r/2300r服務(wù)器所配置的第一個(gè)CPU在執(zhí)行引導(dǎo)過(guò)程時(shí)失敗,將會(huì)導(dǎo)致系統(tǒng)FRB1計(jì)時(shí)器超時(shí),并觸發(fā)FRB1超時(shí)事件。這時(shí)系統(tǒng)集成的專用服務(wù)器管理處理器將會(huì)發(fā)出命令把第一個(gè)CPU屏蔽,并把執(zhí)行引導(dǎo)任務(wù)轉(zhuǎn)交給第二個(gè)CPU。如果第二個(gè)CPU功能正常,系統(tǒng)將仍然可以被正常引導(dǎo)。這樣即便在系統(tǒng)的一個(gè)CPU出現(xiàn)故障的情況下,系統(tǒng)仍可被正常引導(dǎo),實(shí)現(xiàn)最大的高可用。


  著眼未來(lái)的電源及散熱系統(tǒng)設(shè)計(jì)


  問(wèn)題:當(dāng)系統(tǒng)升級(jí)到更高頻率的CPU時(shí),系統(tǒng)的電源及散熱需求也將隨之增長(zhǎng)。


  解決方案:寶德PT1300r/PT2300r 服務(wù)器包含強(qiáng)健的電源供應(yīng)、電壓調(diào)節(jié)電路及散熱系統(tǒng),它不同其它廠商所使用的標(biāo)準(zhǔn)方法,而是按照額定的功率需求來(lái)設(shè)計(jì)電源及散熱系統(tǒng)。其它標(biāo)準(zhǔn)方法一般是按照實(shí)際采樣的CPU樣品的電源及發(fā)熱來(lái)設(shè)計(jì)(一般要小于額定功率),而且使用"標(biāo)準(zhǔn)"技術(shù),將需要大量的CPU樣品,才能保證統(tǒng)計(jì)結(jié)果的有效性。寶德PT1300r/PT2300r是目前第一款上市時(shí)就能支持更高主頻的Xeon DP家族處理器產(chǎn)品功率及散熱需求的高密度機(jī)架優(yōu)化式服務(wù)器。這樣當(dāng)升級(jí)到更高主頻的處理器時(shí),機(jī)箱結(jié)構(gòu)無(wú)需任何改變,就能滿足機(jī)器散熱需求,有效保護(hù)用戶的投資及降低總保有成本TCO。



  實(shí)時(shí)散熱監(jiān)控技術(shù)


  問(wèn)題:新至強(qiáng)處理器對(duì)更高的散熱風(fēng)量的需求將增大機(jī)器噪音并會(huì)降低風(fēng)扇壽命。


  解決方案:寶德PT1300r/PT2300r服務(wù)器使用領(lǐng)先的實(shí)時(shí)散熱監(jiān)控技術(shù)。集成的專用服務(wù)器管理處理器不斷地實(shí)時(shí)地從智能前面板、CPU、硬盤(pán)熱插拔背板及其它關(guān)鍵組件傳感器處讀取溫度信息,將所讀取的溫度值與存儲(chǔ)在主板上的系統(tǒng)管理數(shù)據(jù)庫(kù)中的閾值進(jìn)行比較。如果從某組件所讀取的溫度值大于數(shù)據(jù)庫(kù)中的閾值,負(fù)責(zé)該組件散熱的風(fēng)扇會(huì)根據(jù)最低的需求級(jí)別自動(dòng)提速;反之,散熱風(fēng)扇則自動(dòng)降速,以提供合適的風(fēng)量。此過(guò)程不斷重復(fù)循環(huán),保證系統(tǒng)在涼快、安靜運(yùn)行的同時(shí),最大程度的延長(zhǎng)風(fēng)扇壽命。



  指示燈導(dǎo)向的故障診斷


  問(wèn)題:故障組件需要用很長(zhǎng)時(shí)間來(lái)診斷、識(shí)別、更換。


  解決方案:寶德PT1300r/PT2300r服務(wù)器使用指示燈導(dǎo)向的故障診斷技術(shù)來(lái)快速鎖定故障組件并快速更放,以實(shí)現(xiàn)最小的當(dāng)機(jī)時(shí)間。PT1300r/PT2300r服務(wù)器集成的專用服務(wù)器管理處理器實(shí)時(shí)監(jiān)控系統(tǒng)關(guān)鍵組件的狀態(tài),并通過(guò)各種LED指示燈來(lái)表示各組件的健康狀況。其中智能前控制面板共有5個(gè)不同指示燈可以表示15種不同的狀態(tài)級(jí)別告之管理員機(jī)器目前的運(yùn)行狀況及可能潛在的問(wèn)題;位于機(jī)器前面板及機(jī)器背后的系統(tǒng)ID識(shí)別燈,可以在機(jī)架式環(huán)境中快速定位目標(biāo)服務(wù)器;服務(wù)器主板上的各種不同的指示燈可以幫助技術(shù)人員快速鎖定故障部件如內(nèi)存槽、風(fēng)扇、處理器等,并迅速更換,實(shí)現(xiàn)最大的正常運(yùn)行時(shí)間。



  先進(jìn)的硬盤(pán)固定技術(shù)


  問(wèn)題: 高性能、高轉(zhuǎn)速的硬盤(pán)會(huì)引起更大的硬盤(pán)顫動(dòng),導(dǎo)至硬盤(pán)壽命的減少及性能的降低。
  解決方案:寶德PT1300r/PT2300r服務(wù)器使用目前最為先進(jìn)的機(jī)械工程技術(shù)來(lái)設(shè)計(jì)硬盤(pán)籠子,使用高級(jí)鋁型材嵌板來(lái)作為硬盤(pán)籠子的內(nèi)壁,用來(lái)固定硬盤(pán)。當(dāng)硬盤(pán)被插入時(shí),堅(jiān)硬的籠子嵌板會(huì)阻止硬盤(pán)被推出,減少潛在的硬盤(pán)顫動(dòng)。如果一個(gè)廠商使用不那么堅(jiān)硬的材料,硬盤(pán)籠子可能會(huì)彎曲變型,增大潛在的硬盤(pán)顫動(dòng)風(fēng)險(xiǎn)。另外PT1300r/PT2300r服務(wù)器所使用的熱插拔硬盤(pán)拖架采用僅在每個(gè)熱插拔硬盤(pán)拖架的一邊使用彈片的設(shè)計(jì)方案,這樣能更好的更長(zhǎng)久地固定硬盤(pán),避免其顫動(dòng)。而有些廠商的硬盤(pán)拖架則在其兩邊都使用彈片,這樣的設(shè)計(jì)在經(jīng)過(guò)一段時(shí)間以后將會(huì)使硬盤(pán)產(chǎn)生輕微振蕩的風(fēng)險(xiǎn)加大,最終可能導(dǎo)致硬盤(pán)性能降低并使硬盤(pán)壽命減短。



  第十代壓力測(cè)試軟件認(rèn)證測(cè)試


  問(wèn)題: 高性能系統(tǒng)中不同的數(shù)據(jù)類型及不同的數(shù)據(jù)使用模式的融合,導(dǎo)至潛在的數(shù)據(jù)損壞的風(fēng)險(xiǎn)加大。
  解決方案:寶德使用先進(jìn)的壓力測(cè)試軟件對(duì)服務(wù)器在各種主流操作系統(tǒng)平臺(tái)下進(jìn)行嚴(yán)格認(rèn)證測(cè)試,以保證服務(wù)器真正高品質(zhì)、高可靠。寶德PT1300r/2300r正是經(jīng)過(guò)Intel? 第十代壓力測(cè)試軟件認(rèn)證測(cè)試的新一代高密度機(jī)架優(yōu)化式服務(wù)器。EPSD(Enterprise platform service division)部門不斷地更新及提升僅用于內(nèi)部測(cè)試的服務(wù)器壓力測(cè)試軟件套件,認(rèn)證壓力測(cè)試軟件套件可以模擬產(chǎn)生極大的工作負(fù)載以檢驗(yàn)最新服務(wù)器的每秒幾個(gè)GB的帶寬能力。新的、產(chǎn)生更大壓力的數(shù)據(jù)格式正在被許多開(kāi)發(fā)團(tuán)體不斷地定義,只有不斷提升及改善壓力測(cè)試軟件,才可能使認(rèn)證測(cè)試更加有效,才能保證經(jīng)過(guò)認(rèn)證測(cè)試的服務(wù)器真正高質(zhì)量、高可用,經(jīng)得起各種數(shù)據(jù)壓力考驗(yàn)。



CHINA通信網(wǎng)組稿
   

微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號(hào),免費(fèi)領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):5G網(wǎng)絡(luò)AI應(yīng)用典型場(chǎng)景技術(shù)解決方案白皮書(shū)
  • 2、回復(fù)“5G6G”免費(fèi)領(lǐng)取《5G_6G毫米波測(cè)試技術(shù)白皮書(shū)-2022_03-21
  • 3、回復(fù)“YD6G”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):6G至簡(jiǎn)無(wú)線接入網(wǎng)白皮書(shū)
  • 4、回復(fù)“LTBPS”免費(fèi)領(lǐng)取《《中國(guó)聯(lián)通5G終端白皮書(shū)》
  • 5、回復(fù)“ZGDX”免費(fèi)領(lǐng)取《中國(guó)電信5GNTN技術(shù)白皮書(shū)
  • 6、回復(fù)“TXSB”免費(fèi)領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費(fèi)領(lǐng)取《中國(guó)移動(dòng)算力并網(wǎng)白皮書(shū)
  • 8、回復(fù)“5GX3”免費(fèi)領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點(diǎn)本月熱點(diǎn)

     

      最熱通信招聘

    業(yè)界最新資訊


      最新招聘信息