雷葆華 楊明川
摘 要 首先介紹了P2P技術的基本概念、特征和典型的應用情況;然后對P2P技術的幾種組網(wǎng)模式進行了分析和探討,最后對P2P技術的業(yè)務運營模式提出了一些看法。
關鍵詞 P2P分布式 集中式 混合式 業(yè)務運營模式
1 前言
對等網(wǎng)絡(P2P)技術是目前國際計算機網(wǎng)絡技術領域研究的一個熱點,被《財富》雜志譽為將改變互聯(lián)網(wǎng)未來的四大新技術之一,目前微軟、Sun、IBM等很多著名的企業(yè)和公司都投入到對P2P技術的研究之中。
P2P計算并非一種全新的技術,在20世紀70年代就已出現(xiàn),其典型代表是USENET和FidoNet兩個分散、分布的信息交換系統(tǒng),真正的P2P技術的大規(guī)模應用起源于文件交換軟件Napster。雖然“客戶/服務器”模型是目前互聯(lián)網(wǎng)上占統(tǒng)治地位的計算模型,但從某種意義來說,P2P計算可以說是一種向傳統(tǒng)互聯(lián)網(wǎng)技術的回歸,體現(xiàn)了互聯(lián)網(wǎng)的本質(zhì),因為互聯(lián)網(wǎng)最初的設計目標就是讓網(wǎng)絡上的計算機互相之間可以直接通信而不需要中介。
2 P2P技術概述
目前,業(yè)界對P2P的定義還沒有一個標準的說法,Intel將P2P技術定義為“通過系統(tǒng)間的直接交換達成計算機資源與信息的共享”,這些資源與服務包括信息交換、處理器時鐘、緩存和磁盤空間等。IBM則對P2P賦予了更廣闊的定義,把它看成是由若干互聯(lián)協(xié)作的計算機構成的系統(tǒng)并具備如下若干特性之一:系統(tǒng)依存于邊緣化(非中央式服務器)設備的主動協(xié)作,每個成員直接從其他成員而不是從服務器的參與中受益;系統(tǒng)中成員同時扮演服務器與客戶端的角色;系統(tǒng)應用的用戶能夠意識到彼此的存在而構成一個虛擬或實際的群體。
簡單地說,P2P技術是一種用于不同PC用戶之間、不經(jīng)過中繼設備直接交換數(shù)據(jù)或服務的技術,其網(wǎng)絡通信方式如圖1所示。它打破了傳統(tǒng)的Client/Server模式,在對等網(wǎng)絡中,每個節(jié)點的地位都是相同的,具備客戶端和服務器雙重特性,可以同時作為服務使用者和服務提供者。由于P2P技術的飛速發(fā)展,互聯(lián)網(wǎng)的存儲模式將由目前的“內(nèi)容位于中心”模式轉變?yōu)椤皟?nèi)容位于邊緣”模式,改變Internet現(xiàn)在的以大網(wǎng)站為中心的狀態(tài),重返“非中心化”,將權力交還給用戶。
P2P技術有著廣闊的應用領域,目前主要的應用有文件交換、分布式計算、協(xié)同工作、分布式搜索和電子商務等。
3 主要的P2P模式結構分析
P2P模式的變化經(jīng)歷了集中式、分布式和混合式3個階段。P2P技術起源于文件交換技術,在P2P的發(fā)展過程中,文件交換技術的演變最具代表性,下面我們就以典型的P2P文件交換軟件為例來研究P2P模式的幾種主要形式。
。1)集中式對等網(wǎng)絡
Napster提供的MP3下載服務就是最早的P2P實踐。它并不提供MP3音樂資源,只是提供動態(tài)刷新的MP3目錄服務。音樂資源散布在全球互聯(lián)網(wǎng)上的用戶手中,借助Napster幾乎可以找到任何一首歌曲,這是一種集中式對等網(wǎng)絡模式。
集中式P2P模式由一個中心服務器來負責記錄共享信息以及反饋對這些信息的查詢;每一個對等實體要對它所需共享的信息以及進行的通信負責,根據(jù)需要下載它所需要的其他對等實體上的信息。這種形式具有中心化的特點,但是它不同于傳統(tǒng)意義上的Client/Server模式。因為傳統(tǒng)意義上的Client/Server模式采用的是一種壟斷的手段,所有資料都存放在服務器上,客戶機只能被動地從服務器上讀取信息,并且客戶機之間不具有交互能力;而集中式P2P模式則是所有網(wǎng)上提供的資料都存放在提供該資料的客戶機上,服務器上只保留索引信息,此外服務器與對等實體以及對等實體之間都具有交互能力。
集中目錄式P2P模型還存在很多問題,主要表現(xiàn)為:
·中央服務器的癱瘓容易導致整個網(wǎng)絡的崩潰,可靠性和安全性較低;
·隨著網(wǎng)絡規(guī)模的擴大,中央目錄服務器維護和更新的費用將急劇增加,所需成本過高;
·中央服務器的存在引起共享資源在版權問題上的糾紛,這也是直接導致Napster破產(chǎn)的原因;
·缺乏有效的強制共享機制,資源可用性差。
集中式P2P可提供中心服務器目錄檢索、管理服務和標準的點到點通信,具有高效的檢索和低效的交換服務的特點。集中式P2P對小型網(wǎng)絡而言在管理和控制方面占有一定的優(yōu)勢,但對大型網(wǎng)絡并不適合。
。2)分布式對等網(wǎng)絡
Napster因為中央服務器的存在引起的版權糾紛導致了它的破產(chǎn),以Gnutella和eDonkey或eMule為代表的后來者們吸取了Napster失敗的教訓,將Napster的理念推進一步。當用戶PC安裝這些軟件后,就會立即變成一臺能夠提供完整目錄和文件服務的服務器,并會自動搜尋其他同類服務器,從而聯(lián)成一臺由無數(shù)PC組成的網(wǎng)絡超級服務器。與Napster網(wǎng)絡不同,它不存在中樞目錄服務器,或者說把所有機器都變成了服務器,這就是第二代P2P——分布式P2P。
在分布式P2P中,對等機通過與相鄰對等機之間的連接遍歷整個網(wǎng)絡體系。每個對等機在功能上都是相似的,并沒有專門的服務器,而對等機必須依靠它們所在的分布網(wǎng)絡來查找文件和定位其他對等機。
以Gnutella網(wǎng)絡為例,一臺新對等機首先通過訪問某特殊站點提供的“主機緩存服務”(Host Cache Services)機制來得到一臺活動對等機地址,通過與它建立一個連接將自己接入Gnutella網(wǎng)絡;接著,該新對等機主動探查網(wǎng)絡中的其它對等機,找到與之相鄰的對等機節(jié)點,在進行文件查找時,該對等機首先向與之相鄰的所有活動對等點發(fā)送一個查詢描述符Query,在其他對等機接收到該查詢描述符后,檢查本地是否有符合查詢請求的文件內(nèi)容,如果有,則按查詢描述符的發(fā)送路徑返回一個查詢響應描述符QueryHit,無論本地是否存在符合查詢請求的文件內(nèi)容,其他對等機都會將該查詢包通過擴散方式繼續(xù)在網(wǎng)絡中傳遞,直至查詢包中TTL(Time of Life)屬性值遞減為0時才停止繼續(xù)轉發(fā);一旦定位了響應查詢文件的對等機之后,就與響應對等機建立TCP連接,通過HTTP協(xié)議從響應對等機中下載自己查詢的文件。文件的傳輸不再經(jīng)過Gnutella網(wǎng)絡進行。
分布式對等網(wǎng)絡模型也存在很多弊端,主要表現(xiàn)在以下方面:
·搜索請求要經(jīng)過整個網(wǎng)絡或者至少是一個很大的范圍才能得到結果,因此,這種模式占用很多帶寬,而且需要花費很長時間才能有返回結果。
·隨著網(wǎng)絡規(guī)模的擴大,通過擴散方式定位對等點及查詢信息的方法將會造成網(wǎng)絡流量急劇增加,從而導致網(wǎng)絡擁塞,最終使Gnutella網(wǎng)絡被分片,使得查詢訪問只能在網(wǎng)絡很小的范圍內(nèi)進行,因此,網(wǎng)絡的可擴展性不好,不適合大型網(wǎng)絡。
·純分布式的P2P模式很難被企業(yè)所利用,因為它缺少對網(wǎng)絡上的用戶節(jié)點數(shù)以及對他們提供的資源的一個總體把握。
·安全性不高,易遭受惡意攻擊,如攻擊者發(fā)送垃圾查詢信息,造成網(wǎng)絡擁塞等。
這種無中心、純分布式系統(tǒng)的特點是:它不再是簡單的點到點通信,而是更高效、更復雜的網(wǎng)絡通信;eDonkey和eMule等軟件引入了強制共享機制,在一定程度上避免了第一代P2P純個人服務器管理帶來的隨意性和低效率。
(3)混合P2P網(wǎng)絡
集中式P2P有利于網(wǎng)絡資源的快速檢索,并且只要服務器能力足夠強大就可以無限擴展,但是其中心化的模式容易遭到直接的攻擊;分布式P2P解決了抗攻擊問題,但是又缺乏快速搜索和可擴展性;旌鲜絇2P結合了集中式和分布式P2P的優(yōu)點,在設計思想和處理能力上都得到了進一步的優(yōu)化。它在分布式模式的基礎上,將用戶節(jié)點按能力進行分類,使某些節(jié)點擔任特殊的任務。這些節(jié)點共分為3種:
·用戶節(jié)點:普通節(jié)點,它不具有任何特殊的功能。
·搜索節(jié)點:處理搜索請求,從它們的“孩子”節(jié)點中搜索文件列表,這些節(jié)點必須有128 kbit/s RAM的網(wǎng)絡連接速度,建議使用高性能的處理器。
·索引節(jié)點:連接速度快、內(nèi)存充足的節(jié)點可以作為索引節(jié)點。索引節(jié)點用于保存可以利用的搜索節(jié)點信息,并搜集狀態(tài)信息,維護網(wǎng)絡結構信息。
一個節(jié)點可以既是搜索節(jié)點又是索引節(jié)點。用戶節(jié)點可以選擇3個搜索節(jié)點作為它的“父”節(jié)點,如果“父”節(jié)點接受該用戶節(jié)點作為它的“孩子”的話,那么該用戶節(jié)點就可以提交其所要共享的列表給它的“父”節(jié)點。在缺省的情況下,搜索節(jié)點可以最多維護500個“孩子”節(jié)點。在第三代P2P的軟件體系結構中,采用了混合式P2P。這種模式的關鍵之一是引入了索引節(jié)點,索引節(jié)點不會直接連接到有版權的資料上,它就像搜索引擎一樣,只是搜索和所需資料相關的地址,至于用戶到底連接下載了什么內(nèi)容則和它無關。這種模式的關鍵之二是引入搜索節(jié)點,搜索節(jié)點管理著所屬用戶的文件列表。用戶節(jié)點通過索引節(jié)點獲得搜索節(jié)點信息,之后用戶節(jié)點就與獲得的搜索節(jié)點相連,每一次查詢都通過該搜索節(jié)點進行。當用戶發(fā)出搜索請求后,如果和用戶節(jié)點直接相連的搜索節(jié)點查詢結果達到100個(這里的100個搜索結果,可以由用戶自己來設定)就停止;如果不足100個,就向相鄰的搜索節(jié)點發(fā)出請求,如果查詢結果還不夠,就繼續(xù)向外快速發(fā)散,直到所有的搜索節(jié)點都被搜索到為止。若所有的搜索節(jié)點都被訪問過,就意味著整個網(wǎng)絡上的節(jié)點都被搜索到了,其速度要比純P2P模式快得多。
BT就是第三代混合式P2P網(wǎng)絡的典型代表,開創(chuàng)了新一代P2P的潮流,它批判地繼承了前輩產(chǎn)品的優(yōu)點,將中心目錄服務器的穩(wěn)定性同優(yōu)化的分布式文件管理結合起來,從而在效率上遠遠超出了eDonkey這類產(chǎn)品。它要求提供一個或多個統(tǒng)一的Web發(fā)布服務器,以供發(fā)布和搜尋資料。在客戶端,它通過一個IE插件提供下載、上傳管理。BT把一份大文件切割成碎片,為每一個碎片標上特殊標識,用戶無需到一個固定地點(例如傳統(tǒng)網(wǎng)絡的中心服務器)上下載完整的文件,系統(tǒng)會自動尋找、隨機下載具有相同標識的文件碎片,將其
加以整合成為完整的文件。
4 電信運營商的業(yè)務運營模式
經(jīng)過多年的發(fā)展和演進,P2P技術所蘊藏的巨大的創(chuàng)造力和應用前景正在逐步展現(xiàn),正吸引著越來越多的企業(yè)投入到這方面的研究中。但P2P的發(fā)展還面臨著很多問題:業(yè)界還沒有統(tǒng)一的標準,引發(fā)了版權糾紛、安全和管理以及對網(wǎng)絡帶寬的占用等問題。
作為電信運營商,如何選擇適當?shù)腜2P技術體制、標準,找到合適的業(yè)務運營模式,克服P2P在管理、安全和版權等方面存在的問題和隱患,發(fā)揮其新的技術特長,開發(fā)出新的業(yè)務和產(chǎn)品,是一個值得研究和探討的問題。
。1)技術標準和技術體制的選擇
由于目前P2P領域還沒有統(tǒng)一的標準,因此為規(guī)避技術風險,應首先進行標準的選擇和制定工作。
在進行技術體制選擇時,要考慮以下因素:首先,電信級的網(wǎng)絡要求是可運營、可管理的,要求具備集中控制能力,并提供服務質(zhì)量保證;其次,電信運營商本身有著豐富的網(wǎng)絡資源,并可提供代收費平臺,具有為用戶提供安全鑒權管理和文件加密的技術條件和手段;第三,為降低網(wǎng)絡流量負擔,節(jié)約網(wǎng)絡資源,應減少用戶訪問對象的隨機性,減小流量的不可預知性。
選擇的技術標準應具備良好的體系架構,具備良好的開放性、靈活性和擴展性,并充分考慮安全性、可靠性和可管理性等原則。
。2)網(wǎng)絡模式的選擇
建議采用混合式的網(wǎng)絡模式,索引節(jié)點和搜索節(jié)點由運營商負責建立,可在搜索算法等各方面進行控制,保證P2P業(yè)務網(wǎng)與運營商的承載網(wǎng)在流量上盡可能地接近。同時,融合網(wǎng)格計算的優(yōu)點,引入用戶的身份驗證、鑒權和安全管理等功能,由索引節(jié)點和搜索節(jié)點完成用戶的鑒權控制,各用戶節(jié)點進行鑒權后,便成為P2P網(wǎng)絡的一員,可在該網(wǎng)絡內(nèi)開展相應的P2P應用。這樣可將用戶的業(yè)務邏輯分為兩個階段:鑒權和安全管理階段;用戶服務階段。通過這一過程的劃分,可以解決用戶的安全鑒權管理問題,在第二階段,用戶使用的P2P應用與其他的P2P應用完全一樣。這種模式的另一個優(yōu)點是可以避免版權糾紛,索引節(jié)點不會直接連接到有版權的資料上。
。3)關于開展業(yè)務的幾點想法
通過運營商的網(wǎng)絡解決了用戶的身份鑒定、授權和防火墻保護等安全問題后,在這個網(wǎng)絡之中的用戶就可以組成一個統(tǒng)一的P2P網(wǎng)絡,開展以下一些業(yè)務:
·支持在線商務,提供用戶鑒權功能和密鑰管理,為用戶交互信息進行加密;
·可開發(fā)電子商務交易平臺,出租給銀行、證券等金融機構;
·借鑒Linux軟件商Lindows將其操作系統(tǒng)經(jīng)由P2P網(wǎng)絡免費發(fā)放的成功案例,利用電信的網(wǎng)絡進行軟件發(fā)布、網(wǎng)絡游戲下截等服務,利用P2P技術提供用戶就近文件下載服務,內(nèi)容存儲點可由運營商管理。
·運營商組織進行分布計算,然后將這種資源出租給科研單位。
。4)改變計費模式
隨著P2P等新技術的發(fā)展,傳統(tǒng)的計費和結算模式已不能適應業(yè)務發(fā)展的需要,網(wǎng)絡資源的占用并不再是單純的時長占用,而是網(wǎng)絡帶寬、流量等的占用,運營商應考慮改變原計費方式為流量計費。
----《電信技術》