如何完成遠(yuǎn)程排除網(wǎng)絡(luò)故障
時(shí)間:2014-08-07
為了能在遠(yuǎn)程站點(diǎn)提供高水平的網(wǎng)絡(luò)服務(wù),各企業(yè)正日益尋求一個(gè)能兼顧遠(yuǎn)程站點(diǎn)和企業(yè)總部站點(diǎn)的戰(zhàn)略、流程和工具組。
企業(yè)管理層和遠(yuǎn)程站點(diǎn)員工希望能獲得可與總部站點(diǎn)媲美的網(wǎng)絡(luò)服務(wù)水平。然而,分支機(jī)構(gòu)的IT人員往往面臨遠(yuǎn)程站點(diǎn)網(wǎng)絡(luò)服務(wù)資源有限的難題,這導(dǎo)致此類站點(diǎn)的應(yīng)用程序、服務(wù)和性能并不總能像總部站點(diǎn)一樣表現(xiàn)穩(wěn)健。與此同時(shí),在維護(hù)遠(yuǎn)程站點(diǎn)的性能、可用性、安全性和可視性的過程中,總部IT人員也不得不應(yīng)對(duì)性能損耗和可用性低等嚴(yán)峻挑戰(zhàn)。
通過適當(dāng)提升可視性,IT人員能夠迅速地認(rèn)清并解決問題。同時(shí),IT人員也可在總部站點(diǎn)發(fā)現(xiàn)遠(yuǎn)程網(wǎng)絡(luò)損耗,并積極主動(dòng)地解決網(wǎng)絡(luò)堵塞和延遲等問題。
因此,結(jié)合實(shí)踐,運(yùn)用恰當(dāng)?shù)男畔⒑凸ぞ邅砼懦h(yuǎn)程站點(diǎn)故障顯得非常必要。大致框架總結(jié)如下:
安全基線是排除故障時(shí)要主動(dòng)采取的首要一步
為保障順暢運(yùn)行,首先需要主動(dòng)設(shè)置當(dāng)前遠(yuǎn)程站點(diǎn)網(wǎng)絡(luò)的安全基線,為IT人員提供明確的工作目標(biāo)。
首先,應(yīng)檢測(cè)并記錄遠(yuǎn)程站點(diǎn)網(wǎng)絡(luò)的運(yùn)行情況,它可為IT人員提供有關(guān)現(xiàn)有設(shè)備、用戶和網(wǎng)絡(luò)連接路徑等信息。其次,應(yīng)了解遠(yuǎn)程站點(diǎn)“正常”流量水平,為日后確定異;顒(dòng)和驗(yàn)證故障提供參考和比較依據(jù)。由于當(dāng)前內(nèi)部交換端口的廣泛部署和桌面接入端口的普及,IT人員有必要檢查所有VLAN(虛擬局域網(wǎng))鏈接,測(cè)量所有VLAN的流量分配并捕捉特定VLAN的流量數(shù)據(jù),以此來確定網(wǎng)絡(luò)協(xié)議、主機(jī)和限定對(duì)話。評(píng)估互聯(lián)網(wǎng)/WAN(廣域網(wǎng))的連接性和服務(wù)提供商鏈接的質(zhì)量(QoS)也是遠(yuǎn)程站點(diǎn)主要安全基線的要素。該測(cè)試結(jié)果報(bào)告將成為關(guān)鍵的衡量指標(biāo),用于參照對(duì)比性能是否在日后出現(xiàn)損耗。
多任務(wù)處理是遠(yuǎn)程站點(diǎn)需要考慮的問題
在設(shè)置了安全基線后,負(fù)責(zé)遠(yuǎn)程站點(diǎn)的網(wǎng)絡(luò)專員需要考慮多任務(wù)處理,以更好地支持該遠(yuǎn)程站點(diǎn)。此類任務(wù)一般包括:主動(dòng)型任務(wù)、被動(dòng)型任務(wù)和窗口維護(hù)任務(wù)。
主動(dòng)型任務(wù)
在整體流量水平或單個(gè)關(guān)鍵的交換機(jī)流量超過“正常”水平時(shí),自動(dòng)警示總部站點(diǎn)人員是十分必要的。這樣,IT人員就可以在遠(yuǎn)程網(wǎng)絡(luò)的潛在網(wǎng)絡(luò)損耗問題演變成重大問題之前得到預(yù)警。此外,監(jiān)測(cè)當(dāng)前網(wǎng)絡(luò)協(xié)議對(duì)于WAN鏈接的流量而言也尤其重要。流量數(shù)據(jù)(NetFlow, sFlow, jFlow, ipFIX)可用來監(jiān)控應(yīng)用程序和用戶的帶寬使用情況。盡管可以通過部署監(jiān)控傳感器來防止惡意設(shè)備并監(jiān)控WLAN遠(yuǎn)程站點(diǎn)的表現(xiàn),對(duì)于發(fā)現(xiàn)未經(jīng)授權(quán)和未受保護(hù)的惡意無線接入點(diǎn),有線網(wǎng)絡(luò)的深度探測(cè)仍然非常重要。
被動(dòng)型任務(wù)
當(dāng)遠(yuǎn)程用戶抱怨“網(wǎng)速慢”時(shí),IT人員需要執(zhí)行統(tǒng)一流程,并獲取必要數(shù)據(jù)來確定問題域,以此發(fā)現(xiàn)并確認(rèn)責(zé)任人和具體故障。
在這種情況下,多數(shù)網(wǎng)絡(luò)專員會(huì)首先探測(cè)遠(yuǎn)程站點(diǎn)的連接性和響應(yīng)時(shí)間,然后檢查SNMP(簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議)或流量數(shù)據(jù),以此確定端口和網(wǎng)絡(luò)使用情況。網(wǎng)絡(luò)專員也可借助在遠(yuǎn)程電腦上部署軟件代理器,然后由總部分析師開展問題追蹤的獨(dú)特方法,在總部和遠(yuǎn)程站點(diǎn)之間開展帶寬性能測(cè)試。最后,總部可安排遠(yuǎn)程站點(diǎn)的分析人員進(jìn)行零丟包分析。
維護(hù)任務(wù)
在網(wǎng)絡(luò)維護(hù)期間,一定要確;ヂ(lián)網(wǎng)/WAN與遠(yuǎn)程站點(diǎn)之間的鏈接能夠支持所分配到的帶寬,并提供高質(zhì)量的應(yīng)用流量傳輸。為此,應(yīng)在遠(yuǎn)程站點(diǎn)的分析儀和總部站點(diǎn)的同類分析儀之間進(jìn)行網(wǎng)絡(luò)性能測(cè)試。
然而,對(duì)數(shù)據(jù)吞吐量和數(shù)據(jù)丟失的測(cè)試只是衡量網(wǎng)絡(luò)質(zhì)量的標(biāo)準(zhǔn)之一。還需要測(cè)試網(wǎng)絡(luò)延遲和抖動(dòng)現(xiàn)象;為了解網(wǎng)絡(luò)抖動(dòng)對(duì)流媒體應(yīng)用和VoIP質(zhì)量的影響,還需要對(duì)抖動(dòng)進(jìn)行非對(duì)稱測(cè)量。此外,須要測(cè)試不同設(shè)置下流量的服務(wù)質(zhì)量,以確保合理的流量?jī)?yōu)先順序,防止應(yīng)用流量的丟失或減速。
【推薦閱讀】
◆智能運(yùn)維工具有哪些,智能運(yùn)維工具如何運(yùn)用?
◆智能運(yùn)維需要面對(duì)云計(jì)算、物聯(lián)網(wǎng)時(shí)代下的哪些問題?
◆智能運(yùn)維在各行各業(yè)的應(yīng)用情況如何?
◆智能運(yùn)維與傳統(tǒng)的運(yùn)維相比,有什么區(qū)別和變化?