詞語解釋
基本體系結(jié)構(gòu)
1.機群系統(tǒng)一般結(jié)構(gòu)
機群(cluster)系統(tǒng)是互相連接的多個獨立計算機的集合,這些計算機可以是單機或多處理器系統(tǒng)(PC、工作站或SMP),每個結(jié)點都有自己的存儲器、I/O設(shè)備和操作系統(tǒng)。機群對用戶和應(yīng)用來說是一個單一的系統(tǒng),它可以提供低價高效的高性能環(huán)境和快速可靠的服務(wù)。
機群系統(tǒng)包括下列組件:
·高性能的計算結(jié)點機(PC、工作站或SMP)。
·具有較強網(wǎng)絡(luò)功能的微內(nèi)核操作系統(tǒng)。
·高效的網(wǎng)絡(luò)/交換機(如千兆位以太網(wǎng)和Myrinet)。
·網(wǎng)卡(NICs)。
·快速傳輸協(xié)議和服務(wù)。
·中間件層,其中包括某些支持硬件,如數(shù)字存儲通道、硬件分布共享存儲器及SMP技術(shù);應(yīng)用,如系統(tǒng)管理工具和電子表格;運行系統(tǒng),如軟件分布共享存儲器和并行文件系統(tǒng);資源管理和調(diào)度軟件等。
·并行程序設(shè)計環(huán)境與工具,如編譯器、語言環(huán)境、并行虛擬機(PVM)和消息傳遞接口(MPI)等。
·應(yīng)用,包括串行和并行應(yīng)用程序。
2.組建機群系統(tǒng)的需求和功能
機群組建時應(yīng)考慮下面的需求和功能:
·較高帶寬的網(wǎng)絡(luò),以支持通信需求;
·低延遲的通信機制;
·支持高帶寬的多點傳送通信方式;
·自動恢復(fù)網(wǎng)絡(luò)和結(jié)點錯誤的能力;
·標(biāo)準(zhǔn)的低級原語,支持通信、同步和時序;
·異構(gòu)的遠程過程調(diào)用,以隱藏體系結(jié)構(gòu)、協(xié)議和系統(tǒng)的不同性;
·實時性能監(jiān)視器;
·可靠的批處理工作調(diào)度程序;
·分布應(yīng)用程序開發(fā)工具;
·支持傳統(tǒng)的高級語言進行異構(gòu)計算;
·能夠開發(fā)工作站機群的應(yīng)用程序;
·新的系統(tǒng)管理工具;
·發(fā)展標(biāo)準(zhǔn)化,以保護軟件投資。
3.機群系統(tǒng)與其他系統(tǒng)的比較
一個典型機群系統(tǒng)和其他類型系統(tǒng)的對比可參看下表。
基本類型
機群系統(tǒng)可以按照應(yīng)用或結(jié)構(gòu)進行分類。
1.按應(yīng)用目標(biāo)
可分為面向科學(xué)計算型或面向關(guān)鍵任務(wù)應(yīng)用型:
·高性能機群(high performance cluster);
·高可用性機群(high availability cluster)。
2.按組成機群的處理機類型
·PC機群;
·工作站機群;
·SMP(對稱多處理器)機群。
3.按處理機操作系統(tǒng)
·Linux機群,如Beowulf;
·Solaris機群,如Berkeley NOW;
·NT機群,如HPVM;
·AIX機群,如IBM SP2;
·數(shù)字VMS(虛擬存儲機)機群;
·HP-UX機群;
·微軟Wolfpack機群。
4.按處理機的配置
·同構(gòu)型機群:所有結(jié)點擁有近似的構(gòu)造和相同的操作系統(tǒng);
·非同構(gòu)型機群:所有結(jié)點擁有不同的構(gòu)造和不同的操作系統(tǒng)。
5.按處理機的位置和數(shù)量
·組機群,結(jié)點數(shù)量為2~99,通過SANs(系統(tǒng)級網(wǎng)絡(luò)),如Myrinet,機群實際上裝入一個機箱中或存在一個范圍之內(nèi);
·部門機群,結(jié)點數(shù)量為幾十或幾百;
·企業(yè)機群,結(jié)點數(shù)量為幾百。
6.按構(gòu)筑機群的方式
·專用機群;
·非專用機群。
極高的性能價格比使專用機群深受歡迎。
專用機群
專用機群一般由一組同構(gòu)的處理機組成(有時也有異構(gòu)情況),通常安裝在一個機房內(nèi),或者將主板等安裝在一個機柜的各機箱中(商業(yè)機群常用這種方式),或像圖中那樣簡單地把PC機堆砌在機架上(Piles of PC)。在這種機群中,每個處理機都是專用的、無屬主的,由系統(tǒng)管理員統(tǒng)一管理,用戶可通過前端機進行訪問,用戶無需知道機群的詳情,就像使用MPP機一樣,易于配置和管理,不受外界干擾,通信可靠且延遲小,適合于面向加速比的并行任務(wù)和面向吞吐量批處理作業(yè)。專用機群具有相對結(jié)構(gòu)和管理簡單、易于擴展等特點,用途極廣。
專用機群的互聯(lián)結(jié)構(gòu)通常有以下兩種方式:
·I/O方式 包括普通用LAN、FDDI、ATM等網(wǎng)絡(luò)連接和共享磁盤連接兩種方式。
·共享存儲器方式 包括全局共享存儲器方式和分布式共享存儲器方式。分布式存儲器指沒有一個集中的存儲器,由各處理機內(nèi)一部分存儲器通過軟件機制形成。
1994年夏,美國的研究人員建成了第一個Beowulf機群,它由16個DX4處理機組成。1997年,又推出了16個基于PⅡ的機群,只需花費5萬美元卻具有每秒10億次的浮點運算能力,而購買具有相同能力并行機的投資數(shù)卻是它的10倍。 Berkeley的NOW系統(tǒng)也是較早的工作站機群,由上百個Sun Ultra工作站組成,集成到19 英寸機箱中,可使用Myrinet、ATM和終端集中器等多種互聯(lián)手段,每個結(jié)點自帶512K緩存、128M內(nèi)存及2個2.3G硬盤。
此外,各大公司推出的商業(yè)專用機群還有很多,如DEC 的VMS機群和TruCluster、惠普的Apollo 9000機群、IBM的Sysplex、Sun的Solaris MC 等。
在國內(nèi),曙光公司最新推出了基于NT的天潮系列機群產(chǎn)品,是采用分布式存儲的可擴展機群體系。其結(jié)點處理器為Intel PⅡ和PⅢ,通過千兆位以太網(wǎng)互聯(lián),擴展性好,結(jié)點可根據(jù)不同的應(yīng)用,動態(tài)地分為多個結(jié)點池,如可用兩個結(jié)點作為服務(wù)器、四個結(jié)點運行數(shù)據(jù)庫、其他結(jié)點用于計算等,結(jié)點數(shù)量可靈活配置。應(yīng)用范圍包括:
科學(xué)計算 支持PVM和MPI,使用優(yōu)化的BLAS庫;事務(wù)處理 在線事務(wù)處理(OLTP),如電子商務(wù)、證券交易和在線分析處理(OLAP);并行數(shù)據(jù)庫 支持Oracle、DB2等分布式數(shù)據(jù)庫應(yīng)用;
網(wǎng)絡(luò)服務(wù)器 運行各種Internet服務(wù)。
非專用機群
非專用機群是由分散互聯(lián)的處理機或在網(wǎng)上尋找到的空閑處理機組成的機群,這些處理機可能分屬于不同的個人、組織或單位。據(jù)資料統(tǒng)計,一般計算機系統(tǒng)平均使用率僅為30%左右,有的空閑率竟達91%,而許多桌面網(wǎng)絡(luò)工作站和微機的CPU利用率都小于10%,因此,人們自然想到要利用這些閑散的CPU處理能力,這被稱為CPU周期竊取。
通常,網(wǎng)絡(luò)上計算單元都是擁有者各自孤立地使用其擁有的計算單元,一般處于下列狀態(tài):
·處于空閑或等待狀態(tài),如夜間;
·文檔編輯工作,包括收發(fā)E-mail、閱讀文檔和信息等;
·開發(fā)工作,包括編輯、編程、編譯、調(diào)試等;
·完成某種定時、守候服務(wù)和功能;
·運行計算型的程序。
所謂竊取CPU周期就是要竊取上述前四類處理機的CPU 周期給最后一類工作用。顯然,被竊取CPU周期的處理機包括空閑的處理機和CPU負載較輕的處理機兩類。
非專用機群地理上分布于不同的所有者,由異構(gòu)系統(tǒng)組成,大部分通過以太網(wǎng)連接,適用于企業(yè)級局域網(wǎng)范圍,技術(shù)難度要高于專用機群。工作站的主人與需占用工作站資源運行程序的遠程用戶之間存在著矛盾,前者希望與工作站快速交互,而后者只關(guān)心能否利用所有的共享CPU來快速運行程序。機器的所有者必須具有參加機群的動機,這意味著他們相信貢獻他們的資源是有意義的。但是,這些所有者不希望在他們工作時或他們的系統(tǒng)過于飽和時,受到其他干擾,一個解決的策略是允許所有者退出機群。目前,國際上正在形成一種計算資源的買賣市場,以刺激資源擁有者加入網(wǎng)上機群。此外,由于當(dāng)前網(wǎng)絡(luò)通信速度和質(zhì)量的瓶頸所限及由通信競爭造成的網(wǎng)絡(luò)不確定性的存在,對非專用機群技術(shù)提出了更高的要求,如對進程遷移、負載平衡等技術(shù)的需求。但此類系統(tǒng)最為貼近普通用戶,可以充分利用網(wǎng)上無窮無盡的資源,而組建投資幾乎可忽略不計?梢灶A(yù)見,隨著網(wǎng)絡(luò)瓶頸問題的緩解,非專用機群必然是極有發(fā)展前途的一種計算形式。
掃碼付費即可復(fù)制
X