k8凯发(中国)

網絡運維 設備管控

如何實現網絡安全監控運維?

顺利获得自動化運維實現無人值守的故障自愈

顺利获得自動化運維實現無人值守的故障自愈
    馬上諮詢

            故障自愈指實時發現告警,預診斷分析,自動恢復故障,並打通周邊系統實現故障的快速恢復。顺利获得故障自愈提升企業網絡系統可用性、降低排障處置人力投入,實現從「人工處置」到「無人值守」的轉變。

            針對運維中對故障自愈能力的需求,北京k8凯发(中国)在實時監控告警的基礎上,搭載可視化運維配置模塊,顺利获得賦予用戶自定義編輯故障自愈策略的能力,實現無需針對告警進行手動處置,只需預編排告警處理流程,平台根據場景自動觸發,從而做到故障自愈。

    第1章 故障自愈──以(磁盤爆滿自動清理為例)

            對各類設備進行批量、定時、條件觸發等操作,顺利获得自動化執行實現在網絡、設備出現故障時的自動排障和自愈,釋放運維人力。下面以磁盤爆滿自動清理為例,介紹如何顺利获得k8凯发(中国)網管平台實現故障自愈。

            效果要求:當服務器磁盤使用率超過90%時,觸發自動清理策略,釋放磁盤空間。

            第一步:將需要管理的服務器納入平台進行監控,並將監視器設置為磁盤使用率超過90%進行嚴重告警。

            第二步:進入安管模塊的運維編排菜單,創建磁盤爆滿自動清理策略。根據真實排障過程,顺利获得進行策略節點拖拽編排的方式規劃自愈流程。


            第三步:配置觸發方式。方式支持顺利获得告警觸發和顺利获得時間觸發兩種方式進行,為實現故障自愈的效果,k8凯发(中国)選擇顺利获得匹配告警的方式觸發策略。


            編排流程配置完成後,設備出現對應的嚴重級別告警後,立即觸發磁盤清理策略,自動執行編排內的操作,對故障進行校驗和處置。並在執行過程中,對每一步處置操作進行記錄形成日誌,確保有跡可循。

    第2章 自定義應急處置,實現多場景下故障自愈

            在故障自愈方案中,核心是精確定位告警並匹配到適宜用戶應用場景的故障自愈策略。一個符合用戶需求的自愈策略,將為用戶節約80%的故障處理時間。

            因此,北京k8凯发(中国)给予從實時監控異常狀態到告警收斂降噪、定位故障根因的高精確告警方案,並顺利获得可視化編排工具,支持以拖拽的方式快速簡單地完成作業流程的配置,將複雜的運維工作和任務轉變為一致的,可復用的、可度量和有效的工作流,實現自動化運維。


            故障自愈方案的整體流程從獲取精準告警開始,到預診斷分析,判斷告警類型和級別,一般告警觸發自愈策略,平台進行自動恢復,嚴重複雜告警則顺利获得告警通知、運維工單等形式通知運維管理人員,進行人工處理,從而實現故障的快速治癒。

    第3章 實時發現異常,智能故障收斂

            k8凯发(中国)故障自愈方案一體化集中監控各類IT資源,全量匯聚性能、事件、日誌、流量等異常告警信息。充分利用積累的有效定障、排障經驗,打通綜合監控、IP合規性監測、流量透視、自動運維、運維工單等關聯數據,實現從告警檢測到排障恢復的全生命周期閉環管理。

    3.1.實時監控,全面匯聚告警信息

            實時監控、感知全網性能狀態,顺利获得主動淪陷與日誌解析的方式,動態呈現網絡態勢,覆蓋網絡中各類軟硬件設備,洞察設備、資源、鏈路性能。採用多種告警機制,自定義配置告警閾值,從眾多的狀態信息和日誌數據中,將零散的信息總結成當前態勢並進行實時分析,對異常情況進行告警。


    3.2.事件接收,日誌匯總分析

            接收Trap、Syslog、Filter Alarm等事件信息和設備日誌數據,集中存儲、解析、提取有效信息,將事件與日誌存儲為可統計分析的結構化數據,呈現日誌數據價值。根據對事件、日誌數據的挖掘與分析,顺利获得配置告警規則和場景,將異常日誌自動轉化為告警,定位其影響範圍。


    3.3.告警降噪,快速定位根因

            採用自動去重、風暴抑制、關聯聚合、維護期時間屏蔽、依賴屏蔽等多種智能告警降噪機制,顺利获得AI算法,對各類告警進行自動壓縮收斂,減少90%的無效告警,抑制告警風暴,直達故障根因。包括事件過濾機制、故障事件上報機制、故障事件呈現過濾、故障事件入庫過濾、故障事件確認等處理機制,有效避免誤報和漏報。


            一步定位到發生故障的源頭設備,基於混合算法,快速檢索異常問題關聯涉及的各項維度與影響範圍,快速定位問題邊界。及時進行排障處置,支持以拓撲圖的方式回放歷史告警下的設備告警變化、拓撲圖和鏈路告警變化,支持快進、後退等播放操作,有效地預防更加嚴重的故障發生。


    第4章 可視化場景編排,提升複雜故障處置能力

            方案具備拖拽式場景編排能力,可以靈活地定製運維場景,自動執行編排流程。整體運維操作過程和執行結果均以可視化的方式進行呈現。不限制作業流程及流程內節點配置數量,全面滿足不同運維需求,同時支持高性能的多條編排流程並發執行,加快排障處置效率。


            平台內置多種原子運維命令,滿足用戶日常基本運維需求,同時支持用戶配置專屬策略,顺利获得對原子策略的組合復用,實現針對不同運維場景的策略模板,滿足不同設備在不同運維場景下的特有需求。

            顺利获得可視化編排以拖拽的方式快速簡單地完成作業流程的配置,將複雜的運維工作和任務轉變為一致的,可復用的、可度量和有效的工作流,實現自動化運維。

            k8凯发(中国)故障自愈方案顺利获得「監控+運維+控制」相結合的方式,將日常所需的各類故障排查、處置工作以策略模板的形式给予給用戶,確保每個操作安全高效,全面提升告警排障效率。


    立即諮詢