網絡管理的故障管理
作者:佚名 時間:2013-08-27 分享到:
故障管理是網絡管理中最基本的功能之一,用戶都希望有一個可靠的計算機網絡,當網絡中某個組成部分發生故障時,網絡管理器必須迅速查找到故障并及時排除,故障管理的主要任務是發現和排除網絡故障,故障管理用于保證網絡資源的無障礙,無錯誤的運營狀態,包括障礙管理,故障恢復和預防保障,障礙管理的內容有告警,測試,診斷,業務恢復,故障設備更換等,預防保障為網絡提供自愈能力,在系統可靠性下降,業務經常受到影響的準故障條件下實施,在網絡的監測和測試中,故障管理參考配置管理的資源清單來識別網絡元素,如果維護狀態發生變化,或者故障設備被替換,以及通過網絡重組迂回故障時,要與資源mib互通,在故障影響了有質量保證承諾的業務時,故障管理要與計費管理互通,以賠償用戶的損失.
通常不大可能迅速隔離某個故障,因為網絡故障的產生原因往往棹當故障是由多個網絡組成部分共同引起的,在此情況下,一般先將網絡修復,然后再分析網絡的原因,分析故障原因對于防止類似故障的再次發生相當重要,網絡故障管理包括故障檢測,隔離故障和糾正故障3個方面,應包括以下典型功能:
1.維護并檢查錯誤日志;
2.接受錯誤檢測報告并作出響應;
3.跟蹤辨認錯誤;
4.執行診斷測試;
5.糾正錯誤.
對網絡故障的檢測依據對網絡組成部件狀態的監測,那些不嚴重的簡單故障通常被記錄在錯誤日志中,并不作特別處理,而嚴重一些的故障則需要通知網絡管理器,即所謂的"警報".一般網絡管理器根據有關信息對警報進行處理,排除故障,當故障比較復雜時,網絡管理器應能執行一些診斷測試來辨別故障原因.