一線網絡故障診斷

使用福祿克網絡的LinkRunner™鏈路通排除網絡故障的實際操作步驟和方法


  當網絡客戶端宕機時,技術人員的工作就是讓它恢復正常工作。在當今的商業(yè)環(huán)境中,他們的首要任務就是讓網絡經濟、高效地工作。在任何網絡環(huán)境中,為技術人員提供適當培訓、恰當的工具以及可靠的方法,可以幫助他們更快地排除網絡故障,節(jié)省時間,同時還能使網絡用戶盡快恢復高效工作。

排除故障的心態(tài)及方法

  技術人員要成功地排除故障,關鍵是要了解正常的網絡運行情況。這樣,技術人員就能迅速地查找到異常情況,而其他
方法則無異于盲目猜想。

  遺憾的是,許多網絡產品都沒有提供充足的性能說明、操作原理或精煉的技術數據來指導進行故障診斷。成功的技術人員應全面調研所有的可用數據,同時深入了解所有組件的功能及其操作方法。最后,他(她)會意識到某些嚴重故障的根源往往在于使用和配置方法不當或誤操作。

  這種洞察力來自正規(guī)培訓,并且隨著實踐經驗的不斷豐富而變得更加敏銳。真正精于故障診斷的技術人員善于在實踐中學習,通過反復試驗、與別人交流意見,發(fā)現課本中沒有卻很實用的方法。下面的信息能夠讓您少走彎路,并且針對查找和解決網絡問題的方法提出了一些中肯意見。

  成功的故障診斷人員應迅速掌握以下基本概念:簡單評測故障癥狀,這樣可以避免將大量時間耗費在追查錯誤問題上。必須將所有的信息和報告的故障癥狀結合起來考慮,同時還要考慮到它們與整個網絡運行之間的關系;只有這樣,技術人員才能真正了解故障癥狀的含義。收集到有關故障癥狀數據之后,就要進行檢測來驗證或排除一些問題。

成功排除故障的五個步驟

  在解決和處理網絡問題的過程中,成功的技術人員會采取一致的方法:

1、 對網絡進行文檔備案

  實時了解最新的文檔(如物理和邏輯圖、性能基準及審計、設備庫存、配置、主機地址表等),這樣就會大大節(jié)省故障排除過程的“查找”過程時間,從而輕松找到PC機在整個網絡中的位置。

2、 收集所有可用信息,分析故障癥狀

  考慮一下自己是否理解這些故障癥狀。用戶能否演示出現的故障,或者您能否重現這個故障?確定在出現故障之前,工作站或網絡是否有某些變動。

3、 查找并分析問題

  縮小問題的范圍。問題與某網段相關,還是與某個客戶端有關?對于某個客戶端,我們可以進一步將它細劃到網絡、物理布線或工作站的范圍內。您會發(fā)現,收集信息和查找問題往往是同時進行的。

4、 糾正故障和確認故障的解決方案

  找到問題之后,就可以輕松確定和糾正具體故障。對于網絡硬件,最簡單有效的方法就是更換部件,如更換損壞的跳線、集線器/交換機端口或客戶端網卡(NIC)。當用戶檢測故障(采用首次解決該問題的做法)時,就要完成此步操作,確保已修復故障。

5、 對所采取的措施進行文檔備案

  回到第一步。記錄故障及其解決方案(正如許多故障單應用程序所提供的一樣)可以構建企業(yè)內部知識庫,供以后發(fā)生類似故障時參考。該信息可以迅速排除今后的故障。



這步操作真的必要嗎?

  盡管操作系統軟件的可靠性不斷提高,但是“重啟計算機”仍然是專業(yè)技術服務人員的“絕技”。重新冷啟動可以解決很多無法解釋的問題,因而確實是不可替代的一步。該操作的好處就是使技術人員不用離開座位就能解決問題。

  除了讓用戶重啟機器之外,可以在前往工作站之前,給用戶打電話了解更多信息。

  大多數用戶都可以打開命令提示符,并向技術人員匯報IPCONFIG命令的執(zhí)行結果。這樣,就可以告訴技術人員PC機在所連接的子網中的地址是否正確。

  如果PC機配置為動態(tài)主機控制協議(DHCP),卻返回了Windows默認的IP地址(169.254.x.x))))),那么表示客戶端沒有與DHCP服務器正確連接。

  筆記本電腦可以正確尋址所連接的網絡,但是有時在離開網絡后,它仍然會保留另一子網的DHCP租約。讓用戶在命令提示符下鍵入兩條命令,提出新請求:

C:\ >ipconfig /release
C:\ >ipconfig /renew

  收到新IP 地址之后,讓用戶嘗試使用網絡。如果IPCONFIG 命令報告無法執(zhí)行DHCP,那么用戶可能正在使用靜態(tài)IP配置。根據網絡文檔,驗證所報告的IP 地址。

  如果用戶報告了有效的IP 地址,則嘗試從您的機器上對該地址進行PING 操作。如果用戶的PC 機有響應,則請用戶嘗試其他的聯網操作,如打開網頁或PING 本地路由器,確認基本連通性。如果這些檢測都無法解決問題,那么就應該到用戶的現場解決。

現場檢驗客戶端的問題

  到達可能出現故障的工作站后,應仔細收集各種信息。詢問用戶有關任何可能影響網絡性能的行為或活動。由于用戶可能沒有注意到許多工作站或工作區(qū)相關的常規(guī)操作會影響網絡性能,或者他們明知自己的操作不當卻不愿承認,因此,有時這種做法意義不大。向用戶詳細詢問您所懷疑的問題,注意一定要詢問最近所有的變動,甚至包括辦公家具的移動或新屏幕保護程序的安裝情況。

  重復您在電話里要求用戶執(zhí)行的檢測。如果能夠成功地PING 到網絡服務器或離線設備,那么就表示該工作站與網絡的連接達到了第三層,此時即可確定“沒必要”進行所有低層級檢測,而技術人員也可將工作重點放在其他方面。如果無法驗證第三層連接,那么必須從第一層開始檢測。

  如果故障癥狀是掛線或間斷性連接,那么連續(xù)執(zhí)行的PING 命令會向目標設備不斷發(fā)送回復請求數據包。每條成功執(zhí)行的PING 命令的響應時間或無響應時間將被顯示出來。

C:\ > ping -t x.x.x.x

  可以使用連接到目標設備的跟蹤路徑(TRACERT 或PATHPING)進一步調查超時響應或未執(zhí)行的PING 命令。路徑跟蹤能夠告知網絡中發(fā)生延遲或丟失數據包的位置,第一層的故障排除就應該從這個位置開始。

C:\ > tracert x.x.x.x

C:\ > pathping x.x.x.x

需要擴大故障排除范圍嗎?

  如果通過核實用戶的故障報告還不能明確問題所在,那就需要進行長時間的詳細調查。然而,在進行實地檢查之前進行快速檢測,仍有可能快速解決這種情況。

  既然用戶報告表明無法登錄到網絡,那么技術人員關注的首要問題就是該故障是否與網絡或用戶的PC 機有關。接下來,就是要確定客戶端與網絡是否正確連接和正常工作,客戶端能否訪問網絡。確保這些功能可以解決許多問題,同時也為解決更復雜的問題奠定了基礎。要及時、高效地解決網絡問題,就要求一線技術人員有一種能夠快速檢驗關鍵網絡功能狀態(tài)的工具,也例如福祿克網絡的LinkRunner 鏈路通。

一線故障排除的“快速檢測”:
1、 檢測鏈路
2、 檢查整個網段的活動
3、 利用DHCP 作為診斷工具
4、 Ping 本地目標和遠程目標

檢測鏈路

  許多網絡技術人員認為,網卡上的鏈路燈閃亮即表示存在鏈接脈沖。雖然人們信賴某些設備,但是許多鏈路LED 都由主機系統中的軟件控制,并且當檢測到較高層級的網絡活動時,它也會處于“開啟”狀態(tài)。某些網卡也會使活動指示燈閃亮,指示存在網絡流量;作為聯網證據,這些要比鏈路LED 更可靠。但是,這些LED 都不能指示傳輸速度或雙工設置情況,這需要另外調查加以證實。

  可以通過自動協商過程來確定鏈路情況,在此過程中,鏈路雙方相互交換有關傳輸速度和雙工性能的信息。交換信息之后,鏈路雙方互比性能,然后以最高的共同速度和雙工匹配情況開始進行通訊。如果鏈路雙方中的任何一方配置有誤或驅動程序功能異常,那么該過程就無法達成共同設置,而且通訊會時斷時續(xù)或完全中斷。


LinkRunner 通過單一線段成功發(fā)送和接收信號,檢測是否存在鏈接


  連接至網絡接口后,LinkRunner 首先嘗試與另一端能找到的“鏈路伙伴”建立鏈接,而這個“鏈路伙伴”可以是網絡連接器(集線器或開關),也可以是某個PC 機的網卡。LinkRunner 遵循IEEE 802.3 標準規(guī)定的自動協商過程,它是硬件控制(而非軟件控制)的鏈路指示器。在成功自動協商之后,LinkRunner 的LED 呈淺綠色,同時在LinkRunner 屏幕的左上角顯示傳輸速度和雙工設置情況。


LinkRunner 屏幕顯示成功鏈路狀態(tài)、傳輸速度和雙工設置及使用情況


檢查整個網段的活動

  如果在電纜上可以看到網絡流量,那么LinkRunner 會在主屏幕的“利用率條形圖”上指示流量水平。但需要注意的是,如果連接到某個單獨的交換機端口(非共享介質),那么就只能看到廣播幀的流量,這種流量在低流量網絡上斷斷續(xù)續(xù)、很不連貫。

  如果您正在檢測某個共享的以太網環(huán)境,而這個環(huán)境仍在使用集線器而不是交換機,那么您的網絡很可能是半雙工運行方式。半雙工以太網受限于嘗試同時傳輸信號的工作站個數,以及所要傳輸的幀的大小。如果嘗試同時傳輸信號的工作站過多,以太網的性能可能會因沖突而明顯下降。如果您所測試的網絡是每個工作站均連接在單獨的交換機端口上,那么就不用考慮站點超額情況。

  雖然發(fā)生沖突是半雙工以太網運行過程中的正,F象,但是當沖突數量開始隨網絡流量的增大而增加時,網絡流量也會由于必要的重新傳輸操作而開始大幅度增加。這樣,網絡的性能就會突然“直線下降”,這是由于幀、沖突和重新傳輸操作的數量盤旋式上升及其速率的快速增長造成的。由于性能下降,所以用戶就會感覺到延遲并會提交故障單。在大多數網絡中,以太網的流量水平并不重要,應該查找其他方面的問題。通過提供網段使用情況的統計信息,LinkRunner 能夠提供給用戶網絡性能異常信息的關鍵線索。

將DHCP 作為診斷工具

  如果可以建立鏈接并且合理使用,那么用戶就會按PING 測試所對應的按鈕。然后,LinkRunner 將嘗試從DHCP 服務器獲得IP 地址。通常,DHCP 是一種基于廣播的技術。因此,它要求每個子網使用單獨的DHCP 服務器(價格昂貴、難以管理)或者使用DHCP 中繼代理服務器,當客戶端和服務器處于同一物理子網時,這種代理服務器可以在兩者之間傳遞請求和回復。路由器上的這些定向廣播輔助程序是那些想在中央位置運行DHCP 服務器的大型企業(yè)的一種常用工具?蛻舳嘶騆inkRunner的自動DHCP 配置失敗會導致DHCP 中繼系統發(fā)生故障。

  雖然,必要時LinkRunner 能接受手工或靜態(tài)IP 配置,但是現在大多數網絡都能使用DHCP。獲取DHCP 地址的過程體現了本地電纜、本地集線器或交換機端口的耐久性,以及與DHCP 服務器相連的網絡基礎設施情況。在簡單操作中,附近大多數網絡基礎設施達到第三層。


成功分配DCHP地址表示客戶端的網絡通訊正常,并且能成功獲取IP地址,一步完成第一到第三層的檢驗


PING本地目標和遠程目標

  在網絡歷史上,PING操作已經成為排除網絡故障的一種最常用的方法。在常用的每種Internet可用操作系統中,PING操作是大多數網絡技術人員在排除網絡故障的過程中首要采取的一個步驟。為何這一簡單工具如此有用?

  在操作中,PING就像海洋學中使用的聲納(SONAR)一樣。PING工具發(fā)送一種能從目標設備(能夠做出“回應應答”)“反射”回來的信號(通常是ICMP“請求回應”幀),這個“反射”信號告知發(fā)送方目標系統是否存在,以及信號到達目標設備和返回所用的時間。

  配置DHCP服務器所提供的地址之后,LinkRunner會立刻向DNS(域名服務)服務器和默認的路由器發(fā)送PING測試,這兩個地址均由DHCP配置過程提供?梢宰疃酁長inkRunner預配置四個額外的目標IP地址,并且將其中一個作為自動進行PING測試的地址。如果某些關鍵網絡服務,如WEB應用程序、用戶認證等的PING操作成功,那么就表示客戶端的服務本身有效。

  PING操作成功表示兩臺設備間存在著端到端第三層鏈接。如果需要進一步分析,那么只需將請求的往返總時間作為已知值,就可以進行有幫助的診斷,以便獲得更詳細的分析數據。但是,ICMP請求是低優(yōu)先級的網絡流量,而且當鏈路上的某臺路由器或目標設備忙碌時,就會放棄這個請求。這就是為什么發(fā)送一系列PING請求,給目標設備更多響應機會的原因。

  企業(yè)網的外部服務器也能成為PING操作的目標設備,用以檢驗廣域網(WAN)從客戶端或本地站點至遠程站點的連通性。如果安裝了防火墻的服務器響應了PING操作,但是沒有安裝防火墻的服務器卻沒有響應,那么網絡技術人員就應該查找路由器或其他網絡邊界基礎設施是否出現故障。如果某些服務器有響應,而另外一些卻沒有響應,那么網絡技術人員應查找這些特殊網段出現故障的原因。如果對于外部服務器和內部服務器(包括應用程序和服務器),PING操作均有效,但是客戶端對PING操作卻沒有響應(實際上,也就是接受那些服務),那么就表示物理傳輸以外的其他層級上出現故障。PING成功就意味著其他網絡流量也能到達目標服務器,如果仍無法訪問那些服務,那么問題可能與服務器或用戶的登錄帳戶有關。


可以對本地系統或Internet上的所有系統執(zhí)行PING操作


下一步該做什么?

  如果最初的“快速檢測”無法確定或解決問題,那么下一步活動就應該明確兩個方向。

  如果檢測表明無法建立以太網鏈接,那么就要仔細檢查網絡電纜是否存在嚴重問題。

  如果快速檢測成功、并顯示鏈路及合理網段流量水平、通過DHCP獲得了地址,同時還成功地PING了關鍵網絡服務器,那么可以在其他網絡層級的較高技術層面來解決問題,或者由用戶帳戶管理員或個人電腦技術人員查找工作站配置問題。

電纜檢測

  首先要檢查將工作站或設備連接到網絡墻壁接口的跳線。為此,只需將電纜的一端插入LinkRunner的網絡接口,同時將另一端插入線序適配器插座中,就可進行快速的電纜連通性及正確性檢測。如果跳線正常,那么將它再次插入墻壁或地板接口內,并作為進一步檢測的組件。

  查找電纜問題的下一步就是檢查配線間和本地交換機中的電纜。在布滿電纜的配線間中,很難從眾多電纜中正確挑選出壞電纜,這種做法也很費時間,但是LinkRunner提供了兩項功能,使查找壞電纜的工作變得既簡單又迅速。首先,LinkRunner可以向電纜發(fā)出音頻信號,然后可以利用音頻探測器進行追蹤。使用標準的音頻探測器,可以系統地檢查電纜直至聽見壞電纜發(fā)出的音樂。當不能肯定電纜是否連接在交換機上,或者沒有文檔指示電纜與哪個配線間或交換機相連時,該方法將非常有用。



和嚴重受損的跳線


  找到用戶電纜的遠端位置之后,即可使用LinkRunner線序適配器或某個可選的LinkRunner電纜編號附件(LinkRunner Cable ID Accessories)斷開該鏈路,并檢測全部水平電纜的連接和線對是否正常。

  同時,Link Runner會發(fā)出音頻信號,并嘗試讓交換機端口鏈接路每隔三秒鐘閃亮一次。利用這個功能,可以方便地查找與電纜連接的端口。找到端口位置之后,就要將該電纜連接到其他未使用的端口上。通常,相鄰端口或故障端口會仍然顯示鏈路正常,因此切換到不同的端口可能會解決問題。

  如果集線器或交換機端口檢測結果正常,那么可能是工作站有問題?梢詫inkRunner直接連接到工作站的網卡上來進行檢測。與連接集線器或交換機類似,LinkRunner可以指示網卡的鏈路狀態(tài)、傳輸速度及雙工設置情況。如果顯示鏈路正常,請重啟PC機或使用PING之類的命令行工具,以觸發(fā)網絡流量并使用LinkRunner進行監(jiān)控。如果LinkRunner報告無任何流量,那么即使PC機顯示正在傳輸,也需要檢查綁定部件和PC機上的其他配置參數。如果LinkRunner同時報告鏈路和PC機的流量,那么需要進一步診斷PC機的聯網配置情況。

高層級診斷

  如果工作站建立了網絡鏈接,接下來就要確認工作站的尋址與它所連接的子網相符。確認工作站使用了恰當的協議堆棧并且配置正確。最后,技術人員必須檢驗所有必需的程序組件和數據庫正常。通常,首先要從工作站配置中刪除協議或網卡,然后再次重裝進行檢驗。如果所有這些組件的位置和配置都正常,而且工作站仍然顯示網絡和應用程序連接錯誤,那么此時就要在區(qū)域技術水平之外逐步查找問題。

非凡工具,打造卓越業(yè)績

  LinkRunner價格經濟、接口簡單,它是一種使用廣泛的工具,適于部門技術人員手持(或掛在腰帶上)使用。只有“眾口皆碑”的網絡設備才能消除筆記本電腦測試本身所固有的不確定性。

  正如網絡技術人員所說,假設是“眾口皆碑”的客戶端設備,那么它所帶來的問題要遠遠多于它能解決的問題,而且當網絡支持和臺式機客戶端分屬不同的小組時,不但會導致技術問題,還會導致政治問題或組織問題。當故障單上所指的設備不是臺式機,而是網絡基礎設施組件時,這就是一個比較棘手的技術問題(盡管也有簡單的政治因素)。

  在這種情況下,即便沒有常規(guī)設備診斷屏幕,那么通過查找(排除)鏈路本身的故障,也會迅速找到問題所在。當在部門或小組范圍內就可以解決問題,而無需將每個問題逐級上報給IT專業(yè)技術人員時,問題會會更快、更有效地預以解決?梢栽谑苓^高級故障診斷培訓的技術人員和工程師中間小范圍地使用高級工具。故障診斷方案的目的是確保充分發(fā)揮高級人材和技術資源的優(yōu)勢。



  福祿克網絡的LinkRunner鏈路通是一款價格經濟的超便攜式工具,它可以在網絡故障診斷過程的初期階段助技術人員一臂之力。

  LinkRunner是一種適于機構整體部署的簡易工具,它能幫助一線技術人員查找基本的連接故障,以及向更高層的技術人員報告故障單之前,解決物理層級出現的問題。

  LinkRunner是現場檢測基本網絡連接情況的理想之選,它可以解決許多網絡問題,而且也是解決更復雜問題的必要前提。當技術人員利用LinkRunner進行現場故障檢測時,它能確定各種網絡運行重要參數,并提供解決ISO 7層堆棧中較高等級所誘發(fā)的故障的基本信息。

  當網絡經理將基礎設施繼續(xù)遷移或升級到“開關到桌面”時,他們體會到全開關基礎設施的好處:分割網絡流量,避免網絡內的以太網錯誤傳播。但是,這種開關基礎設施“隱藏”了影響各鏈路性能的較低層問題,讓一線技術人員只能猜測連接的狀態(tài)。
作者:美國福祿克網絡公司   來源:C114(CHINA通信網)

微信掃描分享本文到朋友圈
掃碼關注5G通信官方公眾號,免費領取以下5G精品資料
  • 1、回復“YD5GAI”免費領取《中國移動:5G網絡AI應用典型場景技術解決方案白皮書
  • 2、回復“5G6G”免費領取《5G_6G毫米波測試技術白皮書-2022_03-21
  • 3、回復“YD6G”免費領取《中國移動:6G至簡無線接入網白皮書
  • 4、回復“LTBPS”免費領取《《中國聯通5G終端白皮書》
  • 5、回復“ZGDX”免費領取《中國電信5GNTN技術白皮書
  • 6、回復“TXSB”免費領取《通信設備安裝工程施工工藝圖解
  • 7、回復“YDSL”免費領取《中國移動算力并網白皮書
  • 8、回復“5GX3”免費領取《R1623501-g605G的系統架構1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息