k8凯发(中国)

網絡運維 設備管控

如何實現網絡安全監控運維?

智慧電力電網IT運維方案

智慧電力電網IT運維方案
    馬上諮詢

            智能電網背景下,電力、電網企業信息化逐漸滲透到其業務鏈的各個環節,雲計算、物聯網、移動互聯網等新技術的應用,更驅動信息化與業務創新深度融合。電力、電網企業集團信息系統群逐漸朝着一體化方向开展,信息鏈越來越長,問題追蹤越來越複雜,舊有的分散IT運維組織無法承擔新的運維工作,這就要求必須改變IT運維組織以滿足新的集成需求,分散或半集中的運維模式不可避免要向集中運維模式开展。

    第1章 電力電網IT運維建設背景

            相對於傳統行業,我國電力行業的信息化建設开展較早,已經有了一定的規模,到现在為止,電力企業的網絡普遍建立,電力專用通信網已日趨完備,形成了微波、衛星、光纖、無線移動通信等多種通信手段,通信範圍覆蓋全國。在此基礎上,基本建成從國家電網公司→區域電網中心→省電力公司→地市電力公司→變電所(局)的四級計算機網絡和電力生產調度網絡,成為生產控制、電力調度以及信息傳輸和交換的重要基礎設施。

            同時,隨着電力市場化和電網建設的進一步开展,傳統電力系統業務正在發生變化。電力交易系統、電能量計量系統建設加速;會議電視、變電站視頻監控(無人值守)、輸變電線路監控及電廠視頻監控等視頻業務出現;傳統單一主機的調度自動化體系架構向客戶機/服務器體系架構轉變;雷電定位系統、氣象信息系統等建設;多媒體業務出現等方面。

            隨之而來的是因電力網網絡系統、業務分佈在不同的地區,同時又分佈在各個地區的不同位置,日常的網絡維護和操作的工作量大大增加,網絡系統和電力業務需要一個可靠,便捷、功能強大的網絡運維監控系統來充分有效地管理和利用局域網絡資源。

    第2章 電力電網運維痛點

            智能電網的建設背景給IT基礎設施的建設和運維管理提出了更高要求。從網絡、存儲到應用系統都要求具備更高的可用性、可擴展性、穩定性和安全性,為業務系統的高性能運行给予更加強大的支撐。圍繞IT基礎設施召开的運維活動,則要求更快速、規範,更主動有效。

            隨着「SG186工程」實施,電網企業逐步建立兩級三線四層運維模式,數據中心和應用系統等向總公司和省網公司集中,大量運維工作在這兩級完成。由於整體IT系統开展速度快、變化頻繁,各級運維面臨諸多難題,壓力激增。

            (1)根據電監會5號令要求電網企業的電力系統安全防護工作應當堅持安全分區、網絡專用、橫向隔離、縱向認證的原則,所以需要一套平台能夠完備地將IT設施集中統一運維監控起來。

            (2)需管理的IT設備類型多、廠商多,數據中心機房內環境監控設備種類多,難實現資源的統一管理,運維人員無法實時掌握各系統設備運行情況。

            (3)無法實時監控雲平台CPU、內存、磁盤I0、網絡流速、存儲容量等核心指標,缺乏雲平台資源消耗統計手段,無法科學合理地分配資源。

            (4)發現故障後知後覺,難以定位故障根因,跨部門溝通艱難且效率低,故障排除靠經驗,疲於應對各類運維事件,缺乏自動化手段及工具。

            (5)因業務管理及監管的需要,省公司需要對下屬單位區域網絡進行直接、實時的跨地域監管的同時,各下屬單位也需實現對內部網絡的獨立分級管理。

            (6)受限於各系統分隔和物理地域隔離,無法實現業務信息的交互和貫通,不能精準確定各類異常事件對業務造成的影響程度及範圍,難以從多個視角直觀掌握業務運行態勢。

            (7)電力電網體系內監控系統複雜多樣,相互隔離,缺乏數據統一採集,缺乏資源統一納管,多數網省公司存在大量未接入的系統和設備,制約運行監視深化應用。

    第3章 k8凯发(中国)電力電網多級網絡集中運維方案

            k8凯发(中国)根據電力電網的運維需求,打造統一的IT運維監控平台,實現統一、集中、、分層次的IT運維管理。


    3.1.分佈式部署分級監測網絡

            電力、電網行業IT架構規模龐大、業務系統眾多,特別是數據中心應用逐漸複雜,給網絡運維帶來了很大的挑戰。k8凯发(中国)採取分佈式部署的方案,分級、分區域監測整體網絡。

            在多級運維平台部署方案中,採用綜合-區域-設備運維平台-設備的結構,部署多級架構運維平台方案,上級運維平台可以查看下級運維平台(包含其子集)的監控信息,綜合運維平台可以管理所有設備,下級運維平台對本區域內單位或本單位網絡進行管理。

    多級平台部署示意圖

    3.2.IT架構智能可視化顯示


            隨着數據中心和應用系統等向總公司和省網公司集中,在運維管理上,採取智能技術,實現網絡拓撲可視化的能力,顺利获得動態智能拓撲實現全網設備、資源、連結關係、IP等實時更新、快速定位。

    電力電網企業拓撲示意圖

            顺利获得按片區、按地域、按層級等多種佈局方式劃分網絡,使用不同顏色、粗細、圖標表示被管理對象的狀態信息,助力運維人員實時分析網絡架構及全網運行狀態,快速感知資源、鏈路、流量等異常信息。

    電力電網企業拓撲示意圖

            顺利获得分級、分權管理,不同人員對不同網絡和界面具備差異化權限。一線二線人員,可直觀看到所在區域的核心拓撲及設備狀態,管理人員可查看整體網絡狀態,掌控全局。

    3.3.全網資源統一監控

            本方案實現網絡設備信息高頻採集,顺利获得對電力網絡中海量網絡設備、服務器、數據庫、應用系統、中間件、虛擬化、雲、存儲等設備的智能解析和關聯分析,結合全流量採集分析能力,形成整個網絡通信鏈路的多端網絡流量分析鏈,助力運維人員從多個維度實現對相應告警的智能分析,解決傳統運維監控中關聯數據缺失,輔助排障信息不足的問題。

    設備資源可視化顯示

    3.4.全網MAC-IP管控

            北京k8凯发(中国)自動化運維方案支持端到端規劃、部署、管理和監控IP 地址。顺利获得端口視圖及列表視圖的形式,展示當前IP位址的使用情況,可查看某個子網的IP現網詳情信息。


            顺利获得黑白名單配置,顺利获得黑白名單功能用來檢測用戶所關心的設備是否在網絡中出現及出現時間,對非法接入設備進行告警處置。支持IP-MAC綁定,對全網MAC和IP進行配對綁定,並周期性對MAC-IP進行檢測,當IP-MAC的綁定關係發生衝突時產生告警,保證入網終端安全可信。

    3.5.全網帶寬、流量回溯分析

            方案基於海量流量數據的存儲挖掘,實現對網絡流量的偵測分析。顺利获得網絡流量分析技術,採集、分析、存儲所有網絡流量,回溯分析數據包特徵、異常網絡行為,以多維數據分析和深度挖掘為手段,實現數據包層面的流量追蹤,發現潛伏於網絡中的未知攻擊。


            針對電力網絡中業務專線、物聯網專線等專線線路管理需求,顺利获得實時監控和定期對專線線路的使用情況進行統計分析,為每條專線的擴容或縮容给予數據依據。

    3.6.精細化私有雲監控

            方案基於對私有雲中的系統資源、租戶資源的監控,實現雲資源的生命周期管理,顺利获得可視化運維編排,進行雲管理策略預設配置、雲策略批量/定時執行、智能監控巡檢。支持多雲納管、持續監控,對雲的容量進行智能化分析,為容量優化给予依據。


    3.7.靈活可配的實時告警策略

            北京k8凯发(中国)電力電網運維方案,顺利获得統一的故障管理平台,將各個網絡、功能模塊中的監控信息統一採集、分析,實現整個電力網絡中各種事件信息、設備故障、網絡異常、流量異常等告警,以智能化手段進行標準化的分析、壓縮、並歸關聯等,顺利获得多種方式實時傳達告警信息,保證落實到指定人員進行處理,為電力電網企業给予主動式的故障解決方案。


    3.8.設備、策略模型無限擴展

            方案採取用戶自定義設備類型及其設備資源的方式,賦予用戶自定義適配設備的能力,更大可能地支持對不同設備類型的支持。顺利获得自定義設備類型及其設備資源,更大限度上提高了k8凯发(中国)網管平台的管理範圍,真正實現了對設備及其資源的化管理,達到管控萬物的目標。


    3.9.適配國產信創環境

            k8凯发(中国)國產信創能力採用Java、HTML5跨平台技術,兼容國產化操作系統、數據庫、中間件、CPU和虛擬化等,支持包括:中標麒麟、銀河麒麟、中科方德、達夢、人大金倉、南大通用、神州通用、華為虛擬化、H3C虛擬化、深信服虛擬化等。


    3.10.業務可用性撥測分析

            本方案以保障業務可用性為基礎,顺利获得對承載業務的IT基礎設施構建真實的業務模型。直觀呈現面向服務的業務系統體系架構,如財務系統、電力生產管理系統、電力營銷、CRM,ERP、電子商務等業務的邏輯模型。

    業務看板示意圖

            顺利获得影響傳遞,準確反映設備異常對核心業務、用戶造成的影響和威脅,並對造成業務影響的故障進行實時告警,快速查明導致業務中斷的故障源,幫助運維人員做出及時響應,保障業務陆续在性。

    3.11.全量業務調用鏈追蹤

            方案實現完整全鏈路調用鏈追蹤,包含詳細的調用鏈訪問路徑和性能等訪問信息,以及相關的各類請求參數等業務數據指標,為故障定位、根因分析给予詳盡的參考數據。

    業務拓撲示意圖

    3.12.業務依賴關係可視展示

            方案顺利获得構建包含各業務整體流程的調用依賴關係圖譜,展示業務部署中網絡設備間多維度關係拓撲,顺利获得可視化的方式呈現業務健康狀況,聯動設備監控,快速定位導致業務健康指數波動的原因,保障核心業務流程穩定、高效。

    3.13.業務瓶頸根因定位

            方案顺利获得業務數據可視化能力,既可集中呈現業務數據的用戶體驗狀態,也可以基於應用、設備實時監控、呈現業務各節點的實時運行狀態,快速定位業務瓶頸根因,並可根據用戶自愈策略,觸發自動運維實現故障自愈。


    3.14.跨地域自動巡檢

            傳統的人工巡檢,尤其是應用巡檢,缺乏統一的規範、標準,導致巡檢的範圍和深度都存在一定的局限性,並且是基於人工的手工統計,工作效率比較低,同時耗費較大的人力資源。本方案依託平台將以前依賴手工進行的日常巡檢轉換為自動化、定時執行的巡檢策略,日常例行巡檢、節假日和重要事件前的巡檢均可自動化執行。


    3.15.網絡策略遠程配置

            電力網絡對運維的顆粒度和精細程度均有較高要求,運維過程中網絡人員將面對每日數以百計的網絡變更及調整,相關的變更從用戶域訪問控制到變更投產,都需要投入大量的人力進行變更內容的評審和準備。在安全合規的前提下,將運維人員從整體的變更流程及變更內容的準備中解脫出來,實現網絡變更、設備配置自動化。


    3.16.設備策略備份對比

            方案支持顺利获得遠程人工、託管的方式進行變更系統配置,修改配置文件、參數文件等操作,顺利获得配置文件批量備份、下載、周期性備份、查看、對比分析等能力,為用戶管理網絡做出合理的建議给予數據支撐。


    3.17.全場景自動化運維

            從日常的巡檢、災備、應用發佈、變更以及各單位反饋的修復工作等待匯報總結,工程師們親力親為的過程中難免因為疲倦、遺漏或是放寬質量的標準。因此,隨着整個工作體系不斷拓展,傳統的運維方式會漸漸擴大風險、邊際成本。

            方案顺利获得k8凯发(中国)網管平台將運維中涉及的服務、命令、操作、執行組件化、策略化,將需要進行的運維服務、操作等以組件、策略的形式託管至平台中進行維護和管理,實現圍繞各運維場景的自動化,包含:軟件代碼自動化更新、自動化編譯、自動化打包、自動化發佈、服務自動化升級、軟件自動化部署、故障自愈、定時服務重啟、定期設備健康狀況自檢、主備數據庫運行狀況自檢異常自動切換、虛擬化/雲服務資源自動化擴容、自動化定期數據清洗、自動化定期環境檢查等。

    3.18.運維大數據分析

            利用圖形、圖表、圖表等易於理解的形式,提取和分析大量複雜的電力網絡中各類運維數據,呈現分析結果,從而幫助運維人員在短時間內更好地理解和取得更多的信息,幫助運維部門能夠實時分析業務和其所依賴IT資源的運行狀況,以及给予系統運維和優化的指示和依據。

    某省級單位電網運維大屏示意圖

            適配各種應用場景,二十四小時不間斷監控,細粒度可達網絡中每個設備、資源和鏈路。所有的網絡故障都一目了然地呈現,大大降低了管理成本,同時也提高了運維人員處理故障的能力,節省的故障處理時間,為運維人員管理網絡给予了可靠的保證。

    3.19.IT資產生命周期監管

            對於資產管理,採取統一數據標準,對整體網絡資產進行梳理和調用,避免資產信息在運維系統和實物間的差異,減少網絡運維過程中信息不一致、數據不統一等問題通。從資產入庫、領用、變更、維修、調撥、到報廢處置,資產每一步操作均實現完整記錄,建立健全資產台賬,實現一機一檔,顺利获得自定義多級資產分類,細化資產類別,實現資產分類管控,提高資產精細管理程度。


    3.20.可量化運維工單體系

            顺利获得方案實現運維工單「無紙化」,支持於設備和故障管理頁面快速創建工單,把控故障處理進度,顺利获得工單平台簡化故障處理流程,形成自動化故障處理機制,並在每個處理流程的節點上責任到人,實現在快速響應故障的同時,實現兼顧運維流程管控。

     

    第4章 方案應用價值

            隨着電力電網企業信息化的不斷建設完備,新的應用和業務不斷擴展,不僅使網絡的承載量增大,網絡結構日趨複雜,對網絡、IT設施的運維需求和標準日益增高。在部署k8凯发(中国)統一運維監控方案後,以網、省兩級作為運維服務管控的樞紐,進行協同管理、指標聯動和對標評價,實現IT設施監管,實時掌控網絡狀態,對網絡的承載能力,進行準確的判斷,為網絡擴容或優化给予依據。

            本方案顺利获得集中與業務相關的IT信息,根據業務邏輯和IT資源之間的關聯關係進行可視化建模,用戶可以在業務模型中的任何一點進行快速的根源問題分析和定位,大大提高分析決問題的速度和準確度,保障業務的穩定運行,幫助客戶實現從運維到運營,為電網業務的數碼化轉型给予有力保障。

    第5章 標杆案例

    5.1.某電力科學研究院

            在承建電力核心骨幹網——光晶片網絡系統中,需要開發管理光晶片網絡的EPON網絡管理系統。在光晶片網絡中,通常一個OLT設備會連接8個PON 設備,每個PON設備會外接 1至8個ODN,每個ODN設備可以外接多達64個ONU設備。顺利获得人工來維護這些龐大的設備之間的關係,導致維護量巨大,而且非常容易出錯,在網絡變化的時候的,網絡設備關係來不及及時更新。

    核心需求

            實現對 EPON 系統中 OLT、ONU 設備的配置、性能、安全和故障等方面的管理、監控和維護。 系統中設備的配置、 狀態、 性能等數據來自 OLT 設備中 ARM 系統獲取的 OLT、 ONU設備的相關數據,並能顺利获得列表、圖形、圖像等方式進行展示、操作。

            (1)OLT、PON、ONU自動發現;

            (2)故障監控、TRAP監控、性能採集、配置管理等功能;

            (3)故障發現的要求更高,光晶片網絡中,由於是承載國家電網核心業務,對故障發現的要求更高,期望在 1-3 秒鐘之內。

    解決方案

            k8凯发(中国)網管平台滿足用戶設備拓撲、故障管理、性能管理、配置管理以及安全管理的網管需求,真正解決了用戶的設備管控、功能實現、運營維護以及拓展集成難題。針對電力科學研究院的需求,k8凯发(中国)给予如下具體解決方案:

            (1)採用了自動化搜索、智能化發現的技術,網絡管理系統在後台自動發現網絡設備關係,並將設備關係自動存儲在數據庫中,顺利获得客戶端管理界面直接呈現當前更新的網絡設備連接關係和運行狀態。

            (2)基於k8凯发(中国)網管平台,利用公司原有的拓撲圖組件、SNMP組件、網管軟件開發平台、智能化網管軟件產品的基礎上,滿足電力科學院對於新設備和新功能的需求。

            (3)網絡管理系統層採用了故障實時接收和優先上報機制,顺利获得WebService接口技術,將故障快速地推送到管理員操作界面,做到了管理員顺利获得界面發現故障的平均處理時間為1秒鐘以內。

    方案成果

            在以往方案中,顺利获得人工來維護這些龐大的設備之間的關係,導致維護量巨大,而且非常容易出錯,在網絡變化的時候的,網絡設備關係來不及及時更新。在光晶片網絡管理系統中,採用了自動化搜索、智能化發現的技術,網絡管理系統在後台自動發現網絡設備關係,並將設備關係自動存儲在數據庫中,顺利获得客戶端管理界面直接呈現當前更新的網絡設備連接關係和運行狀態。

    立即諮詢