網絡故障處理方案范例6篇

前言:中文期刊網精心挑選了網絡故障處理方案范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

網絡故障處理方案

網絡故障處理方案范文1

【關鍵詞】 網絡故障;處理;實踐

1引言

隨著各療養院信息化建設的不斷深入,療養院信息管理系統、實驗室信息系統(LIS)、圖像傳輸與控制系統(PACS)、全成本核算系統、健康體檢系統等在各療養院的應用,有效地提升了醫療工作的質量和效率,同時對網絡穩定性的要求也越來越高。本文結合自身實踐,闡述系統化處理網絡故障的方法。

2網絡故障的系統化處理流程

2.1故障診斷在網絡中,單一故障的表現可能是用戶不能訪問網絡驅動器、無法發送電子郵件或者無法使用網絡打印機等,引起這些故障的原因很多,可能是網卡、網線、集線器或交換機、路由器、服務器等發生故障,也可能是不正確的客戶端軟件配置、用戶權限不夠等原因。當網絡出現問題時,應把用戶的出錯信息記下來,仔細分析可能產生故障的原因;當網絡出現故障后,首先應引導用戶詳細描述故障現象和相關信息,利用這些信息辨別問題的具體癥狀,如果是用戶操作問題,則可以當場解決。網絡故障系統化處理流程(圖1)。

2.2限定故障的范圍故障范圍可以區分為單個用戶(或工作站)的問題、一個網段的問題、整個網絡的問題。限定故障范圍可以排除其他誘因和對網絡中其他問題的關注。比如:當療養科室的某個醫生說自己的工作站登錄不了療養院信息管理系統,首先要判斷是不是同科室的其他人也登錄不了,或者是其他科室也登錄不了。如果只是一個醫生,同科室的沒有出現類似的故障,則問題可能出在客戶的權限不夠,或者是該工作站的軟件配置存在問題;如果是同科室的所有人都無法登錄,則問題可能出現在科室交換機軟硬件配置及科室交換機到核心交換機連接上;如果是其他科室也登錄不了,則可能是核心交換機或數據庫服務器的問題。

2.3驗證網絡物理連接的完整性根據經驗,限定故障范圍后,應該檢查網絡連接中最直接的潛在缺陷――物理連接。物理連接包括:從工作站到接入交換機的網線[1],從接入交換機到核心交換機的光電轉換模塊及光纖線路,檢查交換機的接口指示燈顯示連接是否正常,一個靜態的綠燈通常都表示網卡成功的連接到網絡,當網卡尋找或發現連接時LED燈會閃爍,一個靜態的橙色燈通常表示網卡不能實現連接。從受到影響的節點開始,向主干網絡延伸。如果網絡連接正常,只是傳輸速率慢,應用網絡分析儀詳細檢查網絡傳輸速率、是否有丟包等問題。

2.4驗證邏輯連接如果物理連接正常,則要檢查網絡的邏輯連接[2]。我們在工作中常見邏輯連接問題有:系統資源與網卡的配置沖突,網卡的IP地址沒有正確配置,不同工作站發生IP地址沖突,Oracle數據庫的客戶端未正確配置。

2.5考慮到最近的網絡變更開始排錯時,應該清楚網絡最近經歷了什么樣的變動,比如添加了一臺交換機,重新劃分了虛擬局域網,服務器更改了服務配置等,了解網絡變動有助于快速解決網絡故障。

2.6建立文檔如果方案解決了故障,要把收集到的癥狀、故障、解決方案的細節記錄下來,這樣有利于經驗總結,同時有利于故障解決方案的規范化[3]。

3結束語

為了更好地排除網絡故障,信息科網絡工程師不僅要充分了解自己所管理和維護的網絡,而且要對網絡協議和技術有著深入的理解,在此基礎上,要建立一個系統化的故障處理流程并合理應用于實際中,以將一個復雜的問題隔離、分解或縮減排錯范圍,從而及時修復網絡故障,確保網絡穩定運行。

參考文獻:

[1]廖綺麗.計算機網絡故障分析及維護[J].醫療衛生裝備,2005,26(7):74-75.

[2]李江,戴金萍,彭婷.淺談醫院網絡常見故障的分類診斷[J].中國管理信息化,2010,13(7):74-76.

網絡故障處理方案范文2

關鍵詞:計算機;網絡故障;故障分析;維護策略

中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2016)10-0066-03

在日常生活學習當中,計算機的運行可能會受到多種因素的影響,諸如違規操作、病毒入侵、黑客攻擊等等都會造成計算機網絡故障的事故發生,影響計算機網絡的正常運行。通暢,計算機網絡故障主要包括硬件故障和軟件故障這兩大方面,根據不同類型的故障以及表現形式,采取相應的措施進行處理和改進。

1 計算機網絡故障類型

1.1 軟件故障

軟件故障又被稱為邏輯故障,破壞配置通信協議或者是網絡設備配置就很容易引發計算機軟件故障的發生,嚴重阻礙計算的正常工作和運行。包括主機、路由器、端口、計算機重要進程等設備在內,都是可能引起軟件故障的設備,當這些設備受到不同程度的影響和干擾的時候,會直接阻礙計算機的正常運行。路由器故障多數情況下是由錯誤的參數配置、不合理的路由器配置所引發的,其驗收和檢查工序被忽視了,使路由器無法正常發揮其功效。中央處理器的過度利用以及計算機過小的內存,也會在一定程度上引發路由器故障。錯誤的路由器配置無法找到正確的遠端網址,計算機與網絡無法有效的鏈接起來,客戶獲取信息的渠道被切斷。計算機重要進程如果被錯誤的刪除了,那么就會出現系統故障的情況,計算機因關閉網絡而與外界無法取得聯系,影響計算機的正常使用。計算機與完結的聯系主要是通過網絡端口來實現的,因此常常會因受到病毒攻擊而出現故障。計算機主機的正常運行與否直接聯系到網卡驅動程序、網絡配置通訊協議、計算機網絡服務的使用功能。

1.2 硬件故障

硬件故障又被稱為物理故障,通常來講造成這種故障主要是因為網絡設備引起的,如破損的線路或網線等等。硬件設施中所包含的任何一個環節遭到破壞,都會嚴重影響網絡的正常使用,引發硬件故障,網絡信號不好或者是網絡斷開都是常見的問題。當然,硬件故障也會在一定程度上受到人為因素的影響,例如錯誤的線路連接方式,沒有采取維護方法等。最常見的故障類型就是線路故障,插口問題多數是由于接口故障引起的,廠家對產品的質量控制不到位。導致網絡信號不穩定的物理故障多種多樣,例如,不能正常運行的網卡,出現松動情況的網絡,遭到破壞的主機等等,這就需要立即采取有效地措施進行處理和完善。

2 處理計算機網絡故障的策略

2.1 網絡故障排查

出現網絡故障首先要進行排查工作,確認網線是否已連接,確認是否配置好網絡IP地址。具體步驟如下:

第一步,點擊無線網絡鏈接的屬性。如圖1。

第二步,點擊Internet協議(TCP/IP)。如圖2。

這里需要注意的是,如果是寬帶鏈接,應該手動填寫DNS服務器地址和IP地址;如果是無線鏈接,就選擇自動獲取IP地址即可。

上述步驟都沒有問題,就可以進行接下來的檢查步驟,即檢查網關設置。

第一步,打開開始菜單,點擊運行。如圖3。

第二步,將cmd輸入到對話框中。如圖4。

第三步,輸入空格+網關地址,點擊enter。見圖5

第四步,查看回復,證明有無問題。見圖6

2.2 掌握正確處理故障的方法

發生計算機網絡故障可能是由多種多樣的原因造成的,需要在第一時間內采取有效地方法進行處理。例如,利用相關工具對網絡配置、網絡協議和網絡服務進行檢查,查看其是否正確;利用專門的檢測軟件來檢測應用程序的參數是否正常,這是比較常見的計算機網絡故障的處理方法。又例如,當發生計算機網絡故障的時候,可以根據相關經驗進行分析總結,這樣采取措施處理故障才更加有針對性,這種方法比較合適排除交換機和路由器檢測的故障。除此之外,還可以對客戶機組成、網絡鏈接和服務器用網絡鏈接結構分析法進行檢測工作,包括計算機軟件、計算機硬件、計算機病毒、計算機應用程序和驅動程度等等,及時的發現故障根源,并采取相應的措施進行修復。

2.3 嚴格遵循計算機網絡故障的處理步驟

計算機的網絡程序是一個比較系統、比較復雜的程序,在日常的學習和生活中可能會有諸多的因素來影響它的正常運行,因此,在對計算機網絡故障進行處理的過程中,一定要遵循故障處理的步驟,避免因為人為的原因造成計算機網絡的二次損害。計算機的管理者和使用者收集故障數據和信息,進行分析,找到其形成的根本原因,在最短的時間內制定切合實際的解決方案和對策。與此同時,計算機的網絡檢查工作務必要重視起來,重視確保計算機正常運作及其綜合性能良好發揮的關鍵所在,盡可能的第一時間快遞、有效的解決故障問題。發現計算機網絡故障到分析研究到制定解決方案再到具體落實,這一系列的過程要做好記錄工作,可以從中總結經驗,吸取教訓,為之后遇到類似計算機網絡故障的時候可以提供數據支撐和參考依據。

網絡故障處理方案范文3

1系統化排錯策略

網絡故障排除是一門綜合性技術,涉及到網絡技術的方方面面,所以當聽到“網絡癱瘓了”,對于網絡管理員來說,首先應該是鎮定,其次開始第一步,分析網絡故障時,首先要清楚故障現象,應該詳細說明故障的現象和潛在的原因,然后確定造成這種故障現象的原因的類型。例如,主機不響應客戶請求服務。可能的故障原因是主機配置問題、接口卡故障或路由器配置命令丟失等。論文百事通第二步,收集需要用于幫助隔離可能故障原因的信息,如向用戶、網絡管理員、管理者和其他關鍵人物提一些和故障有關的問題。廣泛的從網絡管理系統、協議分析跟蹤、路由器診斷命令的輸出報告或軟件說明書中收集有用的信息。第三步,根據收集到的情況考慮可能的故障原因??梢愿鶕嘘P情況排除某些故障原因。例如,根據某些資料可以排除硬件故障,把注意力放軟件原因上。對于任何機會都應該設法減少可能的故障原因,以至于盡快的策劃出有效的故障診斷計劃。第四步,根據最后的可能的故障原因,建立一個診斷計劃,開始僅用一個最可能的故障原因進行診斷活動,這樣可以容易恢復到故障的原始狀態。如果一次同時考慮一個以上的故障原因,試圖返回故障原始狀態就困難的多了。第五步,執行診斷計劃,認真做好每一步測試和觀察,直到故障癥狀消失。第六步,每改變一個參數都要確認其結果。分析結果確定問題是否解決,如果沒有解決,繼續下去,直到解決。網絡故障的發生時很常見的事情,而對于網絡管理員來說,就是去解決這種網絡故障,恢復網絡運行,改善和優化網絡的性能。因此部署一種能夠排除不同可能性并一步一步朝網絡問題的真實原因前進的技術方案是非常關鍵的步驟,一個較好的故障排查方案圖如下:

2分層排錯

網絡的故障到底出在什么地方?這對于很多初級網絡管理者來說是一件麻煩的事情,但是對于網絡來說,為了降低設計的復雜性,增強通用性和兼容性,計算機網絡都設計成層次結構。這種分層體系使多種不同硬件系統和軟件系統能夠方便地連接到網絡。管理員在分析和排查網絡故障時,應充分利用網絡這種分層的特點,即根據OSI七層結構的定義和功能逐一的分析和排查這是最好最快的方法。OSI的層次結構為管理員分析和排查故障提供了非常好的組織方式,由于各層相對獨立,按層排查能夠有效地發現和隔離故障,因而一般使用逐層分析和排查的方法。在應用分層思想的可以有不同的思路,可以采用自下而上的方法,也可以采用自上而下的方法,自下而上是指從物理層開始檢查直到應用層;自上而下是指從應用協議中捕捉數據,分析數組統計數據和流量統計信息以獲得有價值的信息。OSI把網絡分成了七層,從下至上(1層到7層)分別為物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層、應用層,這七層模型描述了信息如何通過網絡介質從一臺計算機的軟件應用傳輸給另一臺計算機的軟件應用,這七個層次相對獨立,完成相應的網絡功能。OSI的上層(5至7層)處理應用問題,并且通常只實現在軟件中。應用層最靠近終端用戶。OSI的下層(1至4層)處理數據傳輸問題。物理層和數據鏈路層實現在硬件和軟件中。網絡層和傳輸層一般只實現在軟件中。①在查看物理層時,此時應該做的第一件事情就是檢查網絡線路。計算機后面的網卡綠色指示燈是否亮?很多情況下,你會發現這僅僅是線路存在問題。你可能也遇到過比較罕見的情況,由于線路接口比較松,加上用戶的經驗不足,所以看上去是插著的,但實際上并沒有接觸。因此應注意連接電纜是否正確,Modem、CSU/DSU等設備的配置及操作是否正確,確定路由器、交換機、防火墻等設備接口是否完好的主要通過showinterface命令,檢查每個端口是否UP,查看傳輸模式、傳輸速度、協議建立狀態等。②在確保物理層完好的情況下,應特別注意數據鏈路層,因為所有網絡層及網絡層以上的應用都建立在數據鏈路層的正常工作。數據鏈路層主要關注于相連設備的互連參數,比如封裝協議、信令格式等。③網絡層是計算機通信的關鍵層,因此網絡層檢查時要注意利用Ping命令和Traceroute命令檢查網絡的連通性。網絡層提供建立、保持和釋放網絡層連接的手段,包括路由選擇、流量控制、傳輸確認、中斷、差錯及故障恢復等。排除網絡層故障的基本方法是:沿著從源到目標的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現,應該通過檢查來確定是否已經輸入適當的靜態路由、默認路由或者動態路由。然后手工配置一些丟失的路由,或者排除一些動態路由選擇過程的故障,包括RIP或者IGRP路由協議出現的故障。④在協議層的高層涉及到協議故障比較多,故障處理起來越來越困難,因此管理員需要懂得協議之間如何工作。首先管理員應清楚有那些程序可用,可以利用Telnet終端模擬應用程序,它可以提供對大型主機、UNIX系統、路由器、交換機等的應用程序和相關配置的命令行訪問方式。同時可以使用端口掃描器判斷哪些端口正在使用,以及借助協議分析儀(如微軟提供的網絡監視器)捕捉相應的RIP信息和UDP報頭,大多數傳輸層錯誤主要表現在ACL和NAT上面。另外日志對于網絡安全來說非常重要,記錄了系統每天發生的各種各樣的事情,你可以通過日志來檢查錯誤發生的原因,或者受到攻擊時攻擊者留下的痕跡。路由器的一些重要信息可以通過syslog機制在內部網絡的Unix主機上作日志。在路由器運行過程中,路由器會向日志主機發送包括鏈路建立失敗信息、包過濾信息等等日志信息,通過登錄到日志主機,網絡管理員可以了解日志事件,對日志文件進行分析,可以幫助管理員進行故障定位、故障排除和網絡安全管理。當網絡故障排除后,管理員應及時做好記錄,以便日后查看和使用。⑤而對于應用層來說,可以使用程序本身進行調試和排錯。

網絡故障處理方案范文4

【關鍵詞】網絡維護網絡故障;解決辦法;技術;效率

1.計算機網絡維護主要包括以下幾個方面

首先,對硬件的維護。確定聯網計算機硬件能夠達到聯網的基本要求要定時檢測聯網電腦網卡、網線、集線器、交換機、路由器等故障、計算機硬盤、內存、顯示器等是否能夠正常運行,對臨近損壞的計算機硬件要及時進行更換。同時要查看網卡是否進行了正確的安裝與配置以及計算機配置的硬件是否與上網軟件發生沖突而導致不能正常聯網。

其次,對軟件的維護。軟件維護是計算機網絡維護的主要方面,具體來說主要包括:第一,計算機網絡設置的檢查。第二,對集線器、交換器和路由器等網絡設備的檢查。第三,對網絡安全性的檢測。第四,網絡通暢性檢測。

2.常見計算機網絡故障分類及處理方法

2.1故障分類

根據網絡故障的性質可把網絡故障分為物理故障與邏輯故障,也可以根據網絡故障的對象把網絡故障分為線路故障、路由故障和主機故障。

2.1.1按照網絡故障的不同性質劃分

(1)物理故障。

物理故障指的是設備或線路損壞、插頭松動、線路受到嚴重電磁干擾等情況。

(2)邏輯故障。

邏輯故障中最常見的情況就是配置錯誤,就是指因為網絡設備的設置原因而導致的網絡異常故障。配置錯誤可能是路由器端口參數設定有誤,或路由器路由配置錯誤以導致路由循環或找不到遠端地址,或者是掩碼設置錯誤等。

2.1.2根據故障的不同對象劃分

(1)線路故障。

線路故障最常見的情況就是線路不通,診斷這種情況首先檢查該線路上流量是否還存在,然后用ping檢查線路遠端的路由器端口能否響應,用traceroute檢查路由器配置是否正確,找出問題逐個加以解決。

(2)路由器故障。

事實上,線路故障中很多情況都涉及路由器,因此也可以把一些線路故障歸結為路由器故障。

(3)主機故障。

主機故障常見的現象就是主機的配置不當,象主機配置的IP地址與其它主機沖突,或IP地址根本就不在子網范圍內,由此導致主機無法連通。

2.2 網絡故障處理步驟

在著手處理故障之前,最好先準備筆和記事本,然后,將故障現象認真仔細記錄下來。在觀察和記錄時一定要注意細節,解決大型網絡故障也是如此,因為有時正是一些最小的細節會使整個解決過程變得明朗化。

2.2.1 故障處理過程

(1)識別故障現象。

識別故障現象時,應該詢問:當被記錄的故障現象發生時,正在運行什么進程。這個進程以前運行過沒有?以前這個進程的運行是不是可以成功?這個進程最后一次成功運行是什么時候?從最后一次成功運行起,哪些進程發生了改變?

(2)對故障現象進行描述。

當處理其他人報告的問題時,對故障現象的詳細描述顯得尤為重要。如果僅憑一面之詞,有時還很難下結論,這就需要你親自操作一下剛才出錯的程序,并注意出錯信息。

(3)列舉可能導致錯誤的原因。

應當考慮導致無法查看信息的原因可能有哪些,是網卡硬件故障,還是網絡連接故障、網絡設備(如集線器、交換機)故障,還是TCP/IP協議設置不當等。

(4)縮小搜索的范圍。

對自己所有列出可能導致錯誤的原因進行逐一檢查,不要根據一次測試,就斷定某一區域的網絡是運行正常還是異常。另外,也不要在自己確定了的第一個錯誤上就停下來,應該把自己所列出可能導致出錯的原因全部檢查過一遍為止。

(5)隔離查找出來的錯誤。

經過排查后,這時已經基本知道了故障的部位,對于電腦的錯誤,可以開始檢查該電腦網卡是否安裝好、TCP/IP協議是否安裝并設置正確、Web瀏覽器的連接設置是否得當等等一切與已知故障現象有關的內容。然后剩下的事情就是排除故障了。

(6)分析故障。

處理完問題后,還必須搞清楚故障是如何發生的,是何原因導致了故障的發生,以后如何避免類似故障的發生。

2.2.2 故障原因

雖然故障原因多種多樣、各不相同,但總體來說不外乎就是硬件和軟件問題,說得確切一些,這些問題就是網絡連接性問題、網絡協議問題和配置文件選項問題。

(1)網絡的連接性。

網絡的連接性是故障發生后首先應當考慮的。連通性的問題通常涉及網卡、跳線、信息插座、網線、HUB、MODEN等設備及通信介質。

(2)配置文件和選項。

服務器、電腦都會有配置選項,配置文件及配置選項設置不當,同樣會導致網絡故障。如服務器權限設置不當,會導致資源無法共享的故障。電腦網卡設置不當,會導致無法連接的故障。當網絡內所有服務都無法實現時,應當檢查HUB。

(3)網絡協議。

最后看看網絡協議的配置,若沒有網絡協議,網絡設備和電腦之間是無法通信的,是不能實現資源共享MODEN上網的。

2.3 硬件故障

硬件故障主要有網卡自身故障、網卡未正確安裝、網卡故障、集線器故障等。

我們先大致從網卡外表觀察一下:

(1)RJ45接頭的問題。

RJ45接頭容易出故障,例如,雙絞線的頭沒頂到RJ45接頭頂端,絞線未按照標準腳位壓入接頭,甚至接頭規格不符或者是內部的絞線斷了。

(2)接線故障或接觸不良。

一般可觀察下列幾個地方:雙絞線顏色和RJ-45接頭的腳位是否相符;線頭是否頂到RJ-45接頭頂端,若沒有,該線的接觸會較差.需再重新壓按一次;觀察RJ-45側面。金屬片是否已刺入絞線之中?若沒有,極可能造成線路不通;觀察雙絞線外皮去掉的地方,是否使用剝線工具時切斷了絞線(絞線內銅導線已斷,但皮未斷)。

2.4軟件故障

如果網卡的信號傳輸指示燈不亮,這一般是由網絡的軟件故障引起的。

(1)檢查網卡設置。

普通網卡的驅動程序磁盤大多附有測試和設置網卡參數的程序。分別查驗網卡設置的接頭類型、IRQ、I/O端口地址等參數,若有沖突.只要重新設置,一般都能使網絡恢復正常。

(2)檢查網絡協議。

在網絡出現故障時,我們經常使用DOS命令行進行檢查,交替使用ping、ipconfig、tracert、netstat等命令查找故障。

3.提高網絡維護效率措施分析

(1)保存網絡維護日志的良好習慣,尤其是有一些發生概率低但危害大的故障和一些概率高的故障,對每臺機器都要作完備的維護文檔,以有利于以后故障的排查。

(2)提高網絡安全防范意識,提高口令的可靠性,并為主機加裝最新的操作系統的補丁程序和防火墻、防黑客程序等來防止可能出現的漏洞。很多計算機系統常用口令來控制對系統資源的訪問,這是防病毒進程中,最容易和最經濟的方法之一。

(3)網絡安裝簡單化便于網絡集中管理,軟件的安裝和管理方式是十分關鍵的,它不僅關系到網絡維護管理的效率和質量,而且涉及到網絡的安全性。

(4)提高警覺性,設置多部防御。計算機網絡是一個開放的系統,它是同時運行多程序、多數據流向和各種數據業務的服務。所以網絡防毒一定要以網為本,從網絡系統和角度重新設計防毒解決方案,只有這樣才能有效地查殺網絡上的計算機病毒。常見的防御技術有:包過濾路由器、雙宿網關、過濾主機網關、過濾子網網關?!科]

網絡故障處理方案范文5

關鍵詞:網絡管理;故障定位;SNMP管理協議;事件關聯策略

計算機及網絡技術的飛速發展為大中型企業帶來了許許多便利之處,隨著大型企業開發了與之業務相對應的管理系統,越來越多的業務將通過網絡的方式進行,人們的衣、食、住、行都離不開網絡[1]。計算機技術的飛速發展導致基于計算機的大型企業管理系統復雜度顯著上升,與之相關的計算機網絡的復雜度也隨之提高。越來越復雜的網絡環境為計算機網絡管理帶來了不小的挑戰,需要網絡管理者在保證海量網絡集群能夠正常工作的基礎上,通過各種手段保證在運行過程中網絡故障帶來的影響和損失最小化,是計算機網絡故障管理面臨的主要問題。到目前為止,對于復雜度較高的大型網絡系統都采用集中式管理方式,該方式將信息的管理和轉發過程集中至一起,然后通過主要管理者進行分發和維護,系統的性能取決于中心管理者的管理能力。集中式管理方式面對大面積的計算機集群出現問題的時候,難以進行有效的處理,系統智能度較低,且中心管理者面對的管理任務較多,對于故障的傳播無能為力,對于故障發生區域的定位也較為困難。集中式中心網絡管理方式存在以下兩類缺陷[2]:(1)計算機網絡中心管理服務器需要面對成千上萬待處理數據,這些數據冗余性大,數據處理時限要求高,僅僅通過中心管理服務器難以一一完成處理。集中式處理方式對中心管理服務器的性能要求較高,若中心管理服務器發生部分故障將會對整個網絡系統的故障處理過程造成全方位影響。(2)計算機網絡中心管理服務器面對巨大的計算機網絡數據的吞吐量,在處理過程中,根據木桶原理,網絡的整體性能受限于中心服務器處理數據的能力,中心管理服務器成為了整個網絡系統的瓶頸。

1.基于SNMP協議的網絡故障定位

在計算機網絡管理中,與故障相關的管理包括故障發現、故障診斷和故障修復三個階段。正常的邏輯是首先尋找并定位到故障發生的地方,才能針對不同的故障來進行分析和診斷,進而根據診斷結果將故障進行修復[3]。目前,在網絡故障管理的三個階段中,故障診斷和故障修復過程都有成熟完善的算法支持,而在故障定位過程中,由于故障的發生源可能范圍較廣,故障發生后會隨著網絡系統的運行而不斷發展,且隨著網絡系統的復雜度提高,故障的傳播越來越迅速、隱蔽,對于故障定位的相關算法目前還不完善具有較大的研究空間,所以研究并改進在大型網絡系統中的故障定位算法是一項有意義的工作。

1.1SNMP協議故障定位與處理模型

SNMP協議用于計算機網絡管理,是TCP/IP協議簇中最常用的應用層管理協議之一。該協議通過不斷發出監聽包到網絡系統中各個設備上,通過設備的反饋包來檢測對應設備是否發生網絡異常。若某些網絡設備發生異常并引起故障,一般情況下,在規定時間內SNMP無法接受到該設備的反饋包,這時候該協議即可初步定為出異常發生區域,并采取相應措施。基于SNMP網絡管理協議的網絡管理模型以網絡管理系統NMS為中心,通過NMS與其他待管理的網絡元設備節點構成了整個網絡系統,SNMP協議運行在NMS之上,當網絡系統運行過程中,某些被管理的網絡元設備發生故障時,SNMP檢測到該故障并發出警告信息,警告信息通過網絡傳播到其他網絡元設備中,經過一定的時間,SNMP將警告信息傳播到整個網絡中,NMS對發生故障設備進行相應的處理。通過NMS的統籌管理,將會很快的定位出網絡故障的具置并進行分析和解決。

1.2SNMP協議網絡故障定位算法

由于計算機網絡的復雜度不斷提高,網絡管理系統NMS無時無刻不在接收著來自多方節點的警報和征兆,在實際網絡運行過程中,網絡管理系統將會面對大量的警告信息,面對如此多的冗余信息,非智能的網絡管理系統將會很難通過分析找出發生故障的真正節點設備,以至于大型網絡很難對故障做出有效的處理。在網絡管理運行過程中,網絡中心管理服務器與各個被管理網絡設備元之間相互依賴且各個被管理網絡設備元之間存在物理上和邏輯上的相關性,所以每當一個設備元出現故障的時候,不僅自己要發出警告,而且所有感知到該設備元出現故障的設備都會發出警告,大量冗余的警告在網絡中傳播最終導致一個設備元發生故障產生大量的征兆,這些征兆都是相互關聯在一起的,不能只針對一個征兆進行處理。在傳統的SNMP協議中,檢測到的網絡設備故障征兆都是被單獨傳送給中心管理服務器的,這使得大量冗余的征兆信息干擾對網絡故障的定位。事件關聯策略在此背景應運而生,建立在基于SNMP協議上的網絡故障定位新算法。在網絡管理中,故障指的是網絡中心管理服務器接受到的一個警告。事件關聯策略定義了被管理的網絡設備元在語義上的相關性,對被警告事件分別在空間上和時間上進行相關處理,通過提取各個事件中的相關聯部分構成單一的警報概念事件,生成的單一警報概念事件能夠過濾不必要的或者無關的事件,減少傳送到網絡中心管理服務器的冗余信息,中心管理服務器能夠更好的計算并分析出網絡故障的源泉。網絡管理系統NMS面對諸多的警報和征兆,為了解決警報信息量大,信息冗余程度強的方法是在SNMP協議上采用事件關聯策略,通過定義事件的方式來將警報編碼成事件,再通過檢測事件的相關聯部分,丟棄無意義的冗余信息,僅僅通過“核心部分”的警報即可定位出故障源的真正區域,并給出故障解決方案。

2.基于SNMP協議和事件關聯策略的網絡故障定位實例分析

2.1網絡拓撲圖及初始化設計

本文通過模擬網絡拓撲結構以及故障發生的環境,目的是呈現一種基于網絡拓撲關聯的網絡故障定位技術,然后通過基于SNMP協議和事件關聯策略來分析網絡故障定位。本文通過建立一個網絡拓撲結構來進行網絡故障定位技術,尋找故障發生的源點,并根據該網絡拓撲結構產生相應的節點表,關系表,和關聯表。為了更加形象的表示網絡的拓撲結構關系,本文需要給相應的拓撲結構節點添加虛擬的IP地址和該節點的屬性。這些屬性對后續實驗的結果有重要意義,通過對網絡設備的實際意義定性分析,就能夠很好的完成對網絡故障源點的定位和追蹤,然后進行相應的網絡故障分析和維護。

2.2基于SNMP協議軟件關于該案例的實驗結果

本文采用在SNMP協議上運行事件關聯策略來定位故障源點,該策略主要是在主控模塊中進行模擬的故障定位。在進入主控模塊前,該策略還有模擬的發現網絡拓撲結構模塊和由拓撲結構創建連接關系的模塊,接下來是通過連接關系創建關聯關系的模塊,該模塊創建的關聯關系是通過關聯關系算法創建的,然后進入主控模塊,在主控模塊里連接著模擬輸入故障數據模塊,故障定位模塊,以及故障源展示模塊和故障事例顯示模塊。

3.總結

本文針對大型復雜的網絡中難以定位故障的問題,分析了現有SNMP管理協議的各個方面,并詳細分析了基于SNMP管理協議,使用關聯關系進行故障定位算法的研究。在實際試驗環境中,本文通過使用基于SNMP的管理協議來進行模擬網絡拓撲結構的故障定位過程,實驗結果表明,使用SNMP管理協議進行的網絡故障源精確度高,分析速度快,適合日漸復雜的網絡系統。

作者:崔玉禮 單位:煙臺職業學院

參考文獻:

[1]韓莉莉.網絡管理系統中數據庫的設計與實現[J].無線互聯科技,2014,(8):24-24.

[2]李建國.電信網絡安全隱患與對策探析[J].科技視界,2014,(32):57-57,103.

網絡故障處理方案范文6

關鍵詞:TDCS;維護;故障;方案

中圖分類號:U262文獻標識碼: A

引言

鐵路列車高度指揮系統(Train operation Dispatching Command System,簡稱TDCS)原名為鐵路運輸調度指揮管理信息系統(Dispatch Management Information System,簡稱DMIS)。TDCS是實現鐵路各級運輸調度對列車運行實行透明指揮、實時調整、集中控制的現代化信息系統,是集信號、計算機、通信和網絡為一體的產物。TDCS是一個覆蓋全國既有線鐵路的大型網絡系統,由鐵道部調度指揮中心、鐵路局調度指揮中心、車站信息采集系統3層體系組成。隨著鐵路提速,行車密度不斷增大,TDCS系統在生產運輸中的作用越來越突出,一旦發生故障將嚴重干擾行車秩序,因此必須做好TDCS的日常維護工作。

1、TDCS設備的日常維護

1.1TDCS設備的維護管理可采用故障修與狀態修相結合的辦法,對雙機熱備的計算機設備實行故障修并定期進行整治;對接入設備采用故障修結合巡視來保證設備的正常使用。

1.2通過巡視各種設備的表示燈狀態可以及時發現設備隱患。巡視內容可歸納為:服務器、工作站、網絡設備、網絡運行情況、觀察UPS電源是否正常工作;檢查光帶、車次號、運行圖等信息是否正確。

1.3定期進行數據庫數據的物理備份,為保證數據庫系統的正常高效運行,在歷史數據已備份的前提下,應定期以自動或人工方式刪除較早的數據,并進行數據的優化存儲,定期測試備份數據庫服務器工作狀態。

1.4加強與通信工區的聯系。信號人員由于所學專業不同,對通信知識知之甚少,測試和維護經驗缺乏,而且使用數字通道,路由器、Modem等都可能造成通道故障。在出現故障時,要及時通知通信的專業人員協助解決現場一些實際問題。同時,定期召開一些培訓和專題會議,學習專業知識和維護經驗。

1.5常見故障的處理如:工作站的啟動、鼠標、鍵盤的更換,打印機、顯示器的更換,(打印機驅動安裝、地址分配等調試項目應該由維護中心解決)信號工區可上報后處理,遇到疑難故障,維護中心應立即派人指導處理,信號工區配合。碰到通道故障,應積極聯系通信工區,協同處理,包括現場信號工區可做一些簡單的處理,如重啟路由器、Modem等設備。

2、TDCS設備日常維護標準作業程序

TDCS設備日常維護標準作業程序如圖1所示。

圖1 TDCS設備日常維護標準作業程序

3、TDCS設備的故障處理

TDCS的故障處理也是復雜多變的,現針對現場出現的一些故障做簡單的概括,并提一些建議:

3.1 網絡故障

⑴檢查局域網,可以使用測試儀查看電源線、網線、接頭、路由器等是否正?;虿褰硬焕喂獭?/p>

⑵依次檢查通道、Modem、Modem轉換電纜、Modem和路由器的連接電纜、路由器等硬件的狀態。

⑶查看路由器、采集機、主板和采集板工作是否正常。

案例:通信故障,從站場畫面觀察,不能看到任何信息。

處理:用Ping命令查看路由器是否與網絡連通,若判斷為設備問題時檢查路由器是否正常及網線插頭是否松動,重啟工作站后恢復。

3.2系統故障

案例:某站PC機及TDCS中心的多個工作站發現計算機病毒。TDCS中心維護機上發現IP地址為10.102.21.1的計算機,每隔2秒鐘,便向中心機發送病毒。被感染的車站計算機內存顯示不足,然后屏幕顯示黑屏后計算機死機,重新啟動后故障再次出現,致使與該站相鄰車站的PC機被迫離網關機。

分析:此種現象,遭受攻擊最嚴重的是安裝Windows2000操作系統的計算機,由于使用以來從未打過系統補丁,而且均未安裝防火墻和殺毒軟件,日常維護基本沒有開展防毒工作,因此網絡根本沒有抵抗病毒能力。

這類故障出現的情況很少,主要是系統遭受病毒的襲擊,病毒侵襲主要通過以下途徑:

⑴大部分TDCS維護人員經常使用移動硬盤或U盤維護,移動硬盤或U盤在拷貝數據和使用過程中極易感染病毒,在調試或修改程序時病毒便由此進入TDCS網絡。

⑵在站機維修時, 為了便于維修, 維修人員會將站機接入互聯網或其他網絡中下載軟件進行檢修,這樣也容易從其它系統傳染病毒。

⑶遭受惡意攻擊等其他非正常途徑。

3.3 硬件故障

⑴服務器故障。由于設置了二套雙機系統,所以一般不會影響行車。有報警時,維修人員很容易發現,將服務器重啟或更換后即可。

⑵采集機故障。監測機監測不到數據,全站紅光帶或顯示不正常。重新啟動后如果還沒有恢復正常,則很有可能是主板、采集板故障,可根據情況判斷和更換出現故障的板子。

⑶Modem故障??赡苁请娫唇佑|不良或短路等,這時候 Modem的電源燈是不亮的。如果電源正常,確定通道和連接網線,重啟Modem,如果仍然無效,建議更換Modem。

案例:車站工作站兩個顯示器都沒有顯示。

分析:此類故障要從電源線上、觀察插接是否有松動等著手處理。

處理:電務值班員檢查切換開關上的轉接口的接頭是否脫落;車站值班員按壓切換開關的切換按鈕,看故障是否解決(檢查電源是否都送到顯示器上)。通過以上的排查,一般可以恢復正常。

4、TDCS網絡安全的改進建議

4.1應定期對TDCS系統做滲透測試,濾出安全漏洞。

4.2TDCS中心應增設網絡安全服務器,安裝防火墻,對連接在網絡中的任何一臺機器,實行統一管理,工作站安裝網絡版殺毒軟件和防火墻。

4.3完善各級TDCS維護中心、工作站、故障處理體系。TDCS中心應設專職網絡安全管理人員,電務段應成立信息設備維護站,負責本段范圍內信息設備安全養護和故障處理。

4.4實現專網專用,減少外界干擾。盡量避免遠程登錄,登陸密碼過于簡單應, 缺少遠程登錄身份驗證是現有TDCS 網絡中計算機的一大嚴重隱患。應加強管理, 使密碼設置達到安全要求, 確因工作需要遠程登錄時, 要對登錄方調試用計算機采取殺毒措施和身份驗證后, 方可進入網內開展遠程診斷、處理等工作。

4.5封堵車站工作站主機上的I/O接口,如光驅、軟驅、USB插口等,并在主板BIOS里修改相應項屏蔽各端口,杜絕在車站工作站及網內計算機上進行與業務無關的作業內容。

4.6科學處理補丁和系統的矛盾。有些補丁可能與正在運行的操作發生沖突,影響系統的穩定工作,應安排專職技術人員,定期從指定的網站或服務器上下載防病毒升級軟件和操作系統補丁,并結合年度TDCS設備集中檢查指導計劃開展相應的維護工作,確保各站TDCS設備正常運行。系統維護用的光盤、軟盤、U盤必須專用, 需要外用的存儲設備時必須在一立自治的專用查毒計算機上查殺病毒之后才可介入TDCS網絡上的客戶端。

4.7做好系統軟件的備份,包括每個車站的系統和數據,采取光盤刻錄或移動硬盤備份。

5、結束語

TDCS是我國調度指揮系統的核心,為確保行車安全和網路運行安全,TDCS必須做到自成體系、安全運行,資源共享、優勢互補,以滿足TDCS設備高安全、高穩定、高可靠的要求。,隨著TDCS系統的不斷完善,維護難度也將不斷加大。只要我們認真總結經驗,不斷提高維護水平,就能將TDCS設備維護好、管理好。 為鐵路運輸生產的安全有序、高效可控提供優質服務貢獻一份心意。

參考文獻:

亚洲精品一二三区-久久