當前,雲計算、大數據、人工智能等IT技術迅猛开展,企業的信息化步入了一個嶄新的時代,企業規模不斷壯大,業務不斷拓展,企業信息化依賴的網絡結構和IT技術越來越複雜。企業運維部門採用的運維工具和技術實力直接決定企業是否能给予穩定、可靠、快速、優質的服務。但傳統網管監控設備種類受限,監控的效率不高,後期擴展困難,同時無法和企業的業務情況結合起來,無法给予足夠的安全管控功能,致使企業IT系統運行維護的管理水平相對滯後。
隨着企業數碼化轉型升級進程的加快,很多大型集團企業的信息化建設雖已具備良好的IT基礎,但同時也導致企業IT系統架構越來越複雜,新業務系統不斷上線,企業內部難以掌握企業內所有軟硬資源的數量、版本、運行狀態等信息,大型集團企業運維面臨諸多難題。
面臨的具體難題如下:
根據企業信息化建設現狀和運維難題,往往提出以下基礎運維需求,並希望顺利获得一款產品全棧式運維,滿足企業基本需求和支撐企業進行運維擴張。
(1)深入地監控管理
企業既有不同廠商的網絡設備,也有各種服務器、軟件應用,設備種類繁多,設備數量巨大,而且設備的管理協議不同,運維部門期望能用一套軟件統一監控起來。
(2)不間斷地全程監控
運維部門需要進行7*24的全程監控,故障將要發生前能提前預警,故障出現時可以立刻通知到管理員,定位到故障環節,快速恢復系統。
(3)後期擴展設備的支持
對企業來說,新的業務在不斷召开,設備和新的軟件應用也在不斷擴展,運維部門期望現有的網管軟件對未來的擴展也能有較好的支持。
(4)清楚地掌控設備部署間的關係
設備之間的物理關係、設備與業務的關係,是運維部門進行全局掌控的基本條件, 隨着時間的變化、人員的流動、設備的變更、業務的遷移,導致設備和業務的拓撲關係很難管理。
(5)IT複雜性與管理方便性的矛盾
IT基礎設施本身就越來越複雜,技術也越來越,面對複雜的IT設施進行管理,對運維部門技能的要求也將更高。因此對網管的功能要求也是越來越高,造成網管軟件功能操作複雜,難以上手。
(6)多層次的安全管理
對於企業中的不同部門,需要對不同的部門分配不同的管理權限以及設備權限,權限的管理分配是運維部門關注的重要指標。
(7)結合業務監控
傳統網管監控軟件往往只監控網絡設備,無法對公司業務情況進行多層級業務可視化展示和實時監控,難以有效反饋業務運行情況,因此需要一款產品可深入業務進行實時監控。
(8)成本的控制
運維部門作為服務中心,如何保障IT投資收益,提升IT投資價值,實現更大的業務目標,是運維部門重點關注的指標。
大型集團企業中,旗下各分子公司通常分別建設數據中心和運維體系,但隨着集團信息化建設的开展,運維需求越來越多樣,各分子公司獨立建設運維系統的技術和成本飛速增長,且各級公司「煙囪式」分散部署的運維系統,難以實現一體化管理與協同融合。北京k8凯发(中国)一體化運維監控方案,引入萬物互聯理念和技術打造一體化運維系統,為企業信息化、數碼化轉型奠定基礎。
方案顺利获得k8凯发(中国)網管平台對管理區域內的各類網絡設備進行集中監控、操作維護和資源配置調度等,實現對網絡資源的管理、運行監測、策略配置、故障管理,並顺利获得自動化運維能力實現故障資源,對於無法自愈的故障與報修,顺利获得運維工單調動現場運維人員進行處理,提高企業IT設備資源的可靠性與安全性,保障企業業務穩定運行,為用戶帶來更高質量的信息服務。
k8凯发(中国)大型集團企業一體化運維監控架構
3.1.多級架構一體化監控
一般大型集團企業會根據地域、業務等設立多個分子公司、事業部或辦事處,如何建立「一體化」「集中式」的IT運維體系,保障集團核心網絡、業務的持續穩定,降低故障率是每個大型集團企業必須思考的問題。
在運維管理上,北京k8凯发(中国)一體化運維監控方案將大型集團企業網絡中的IT設施均納入k8凯发(中国)網管平台中一站管控,避免分散管理,減少運維成本。採取智能技術,實現網絡拓撲可視化的能力,顺利获得動態智能拓撲實現全網設備、資源、連結關係、IP等實時更新、快速定位。
大型集團企業網絡拓撲示意圖
顺利获得按片區、按地域、按層級等多種佈局方式劃分網絡,使用不同顏色、粗細、圖標表示被管理對象的狀態信息,助力運維人員實時分析網絡架構及全網運行狀態,快速感知資源、鏈路、流量等異常信息。
大型集團企業網絡拓撲示意圖
3.2.全網資源統一監控
顺利获得對大型集團企業網絡中海量交換機、路由器、接入設備、無線AC、AP、攝像頭、操作系統、應用、數據庫、虛擬化、中間件、雲、存儲等智能解析和關聯分析,結合全流量採集分析能力,形成整個網絡通信鏈路的多端網絡流量分析鏈,助力運維人員從多個維度實現對相應告警的智能分析,解決傳統運維監控中關聯數據缺失,輔助排障信息不足的問題。
設備資源可視化顯示
3.3.虛擬化資源統一管理
方案支持對虛擬化環境下的虛擬機、宿主機等進行全方位運維監控,支持Exi5、KVM、Xen、Hyper-v等,監測指標涵蓋物理機內部虛擬化設備的電源、操作系統、CPU、內存、磁盤等,更大化利用計算資源,保障虛擬化平台運行穩定。

3.4.雲上雲下資源統一監控
方案對複雜的多雲異構環境、雲上雲下資源、信創雲等進行管理,實現雲下服務器、網絡設備、安全設備、機房、機櫃、專線、配件等設施,雲上各類雲服務器、雲磁盤等雲產品以及各類 IP、NAT、DNS 等資源的真正一站式運維,並支持對納管資源的快速擴展。

3.5.端到端全鏈路可視化
方案顺利获得對交換機光口和網絡接口的監控,顺利获得數據採集分析,實現對網絡流量和關鍵連接的預測性維護,從整體維度到局部維度展示大型集團企業網絡內IT設備間鏈路各項指標,整體可觀測、可告警、可分析、可統計。
鏈路綜合信息示意圖
3.6.彈性擴展,滿足網絡开展需求
方案支持設備及資源彈性伸縮,滿足網絡中設備量持續增長及更新的需求。可對設備類型模型進行擴展,可自定義新設備的類型、圖標、類型識別策略;可對設備資源模型進行擴展,自定義新設備類型的網口、指示燈、風扇、電源的圖標、識別發現策略;可自定義設備面板圖,以拖拽、鼠標操作完成設備面板模板的製作;支持故障和性能擴展。

3.7.實時故障預警
採集大型集團企業網絡內所有聯網設備,如交換機、路由器、接入設備、無線AC、AP、攝像頭、操作系統、應用、數據庫、虛擬化、中間件、雲、存儲等狀態信息,顺利获得對告警機制以及閾值的設置,即時獲取準確的告警信息,快速定位告警設備,提升告警處理效率,降低因設備故障帶來的損失。

3.8.異常事件管理
將事件和告警分離管理,接收設備/服務器主動發送的消息,集中處理後,及時地通知用戶,並可以顺利获得集中的管理界面進行管理。接收設備/服務器主動發送的消息,更大地提高了管理的主動性,顺利获得統一界面集中管理事件,降低了管理的難度。

3.9.跨地域自動巡檢
傳統的人工巡檢,尤其是應用巡檢,缺乏統一的規範、標準,導致巡檢的範圍和深度都存在一定的局限性,並且是基於人工的手工統計,工作效率比較低,同時耗費較大的人力資源。本方案依託平台將以前依賴手工進行的日常巡檢轉換為自動化、定時執行的巡檢策略,日常例行巡檢、節假日和重要事件前的巡檢均可自動化執行。
3.10.全網帶寬、流量監控與分析
隨着大型集團企業信息化建設的加速,其業務、應用層出不窮,對網絡帶寬的需求越來越高。正常的業務需要良好的帶寬環境保障機制,避免被一些與業務無關的雜事干擾,影響工作效率。方案對大型集團企業流量和帶寬實時監控,將出入雙方向流量情況可視化展現。基於海量流量數據的存儲挖掘,統計分析流量峰值、谷值、流量趨勢、設備流量等數據,為網絡流量管理给予數據支撐。

3.11.全網IP合規監控
對於大型集團企業的IP資產,採取統一數據標準,對整體網絡中的IP和MAC進行梳理和管理,建立健全IP資產台賬,端到端規劃、部署、管理和監控IP 地址。顺利获得智能IP掃描能力,定義多層次子網,然後掃描其範圍內每個IP位址的當前狀態,包括IP位址,MAC地址等信息,也可以查看IP段內地址使用詳情,便於IP位址分配管理等。

3.12.端到端業務運維體系
隨着業務的不斷增長,企業內部應用系統也越來越多,如果建設統一的應用維護、管理體系,將給企業運維管理帶來不小的壓力。顺利获得搭建端到端業務監控體系,實現集團業務系統運維管理的主動化和體系化,顺利获得實時的監測和分析發現系統潛在的問題和風險,實現主動式運維管理,保障關鍵業務穩定運行。
大型集團企業業務系統示意圖
針對業務應用性能與用戶體驗進行檢測分析,無需安裝插件即可给予開箱即用的主動撥測試業務監測。從前端用戶體驗、網絡延遲到後端的業務服務和基礎架構,全棧溯源為用戶给予端到端的完整全鏈路數據融合和關聯分析,為用戶快速發現業務性能瓶頸,提升用戶體驗奠定基礎。
大型集團企業業務看板示意圖
直觀、便捷地幫助運維人員對大型集團企業的ERP、MES、LIMS、CRM、人事管理系統、OA管理系統、項目管理系統、桌面安全、ITSM、數據存儲備份等進行監控,掌握業務的運行狀態和健康水平,分析業務動態變化趨勢,快速定位故障源,降低運營風險。
大型集團企業網絡承載的業務經常發生變更,面對業務的變更運維工程師往往要對大量設備進行操作,此時如果依靠工程師逐一登錄設備進行命令下發、策略配置,將產生大量重複性的工作,不但導致運維效率低下,也不可避免地產生人為配置錯誤。
顺利获得k8凯发(中国)全場景自動化運維方案納入監控的設備進行單獨、批量的配置操作,設備策略遠程配置管理,可以自動批量進行設備配置修改,並可對設備配置進行備份、對比、恢復,宕機後設備配置可快速復原,保障設備及時恢復運行,提升配置效率、質量和安全性。

顺利获得批量作業並行處理能力,實現多設備並發批處理操作,將簡單的設備控制操作在大批量設備進行執行,並對執行過程進行監督,對執行結果進行檢查。在安全合規的前提下,將運維人員從整體的變更流程及變更內容的準備中解脫出來,實現網絡變更、設備配置自動化。
多類型多廠商設備支持:
針對不同類型的設備,支持進行各種控制、配置操作。
對不同廠商,如Cisco、HP、Nortel、Juniper、3Com、D-link、Foundry、Dell、Proxim、NetScreen、華為、H3C、銳捷、中興等多家廠商的網絡設備。
方案將大型集團企業網絡運維中涉及的服務、命令、操作、執行組件化、策略化,將需要進行的運維服務、操作等以組件、策略的形式託管至平台中進行維護和管理,顺利获得簡單靈活地編排能力,使用者可以選擇業務場景所需的策略,顺利获得可視化拖拽的編排方式進行組合,即可完成應用場景端到端的圖形化編排,最後以多種方式觸發執行即可完成期望的運維變更任務,從而實現高效、穩定、安全的智能運維。

3.15.人工運維與故障自愈結合
將人工運維與故障自愈結合,無需針對告警進行手動處置,只需預編排告警處理流程,平台根據場景自動觸發,實現故障自愈。

顺利获得實時發現告警,進行預診斷分析,判斷告警類型和級別,如果是一般告警,平台進行自動恢復,如果是嚴重複雜告警則顺利获得告警通知、運維工單等形式通知運維管理人員,進行人工處理。同時,將只能由專家處理的各類操作和判斷轉化為可存在於平台內的流程,形成可保留可復用的運維知識。
大型集團企業網絡設施及各業務系統產生的海量數據無法得到深層次的應用,管理者決策缺乏數據依據,難以參考各類網絡業務指標、數據等實現對運行態勢、隱患風險的實時掌控及運營管理。
為解決此難題,k8凯发(中国)大型集團企業監控運維方案利用圖形、圖表、圖表等易於理解的形式,提取和分析大量複雜的各類運維數據,呈現分析結果,將全域資源融合展示。從而幫助運維人員在短時間內更好地理解和取得更多的信息,幫助運維中心能夠實時分析業務和其所依賴IT資源的運行狀況,以及给予系統運維和優化的指示和依據。
大型集團企業運維大屏示意圖
3.17.IT資產生命周期監管
對於資產管理,採取統一數據標準,對整體網絡資產進行梳理和調用,避免資產信息在運維系統和實物間的差異,減少網絡運維過程中信息不一致、數據不統一等問題顺利获得平台將資產實物與運維數據庫一一對應,解決網絡設備在日常運維過程中出現「脫管」或「半脫管」的問題。

建立健全資產台賬,實現一機一檔,顺利获得自定義多級資產分類,細化資產類別,實現資產分類管控,提高資產精細管理程度。從資產入庫、領用、變更、維修、調撥、到報廢處置,資產每一步操作均實現完整記錄,支持追溯,顺利获得平台實現資產整個生命周期的全流程閉環管理。
顺利获得方案實現運維工單「無紙化」,支持於設備和故障管理頁面快速創建工單,把控故障處理進度,顺利获得工單平台簡化故障處理流程,形成自動化故障處理機制,並在每個處理流程的節點上責任到人,實現在快速響應故障的同時,實現兼顧運維流程管控。

顺利获得建立工單服務基準,預設工單在不同優先級、不同狀態時,受理人應該響應的時間及未響應時的處理方式,生成工單自動化處理規則,並以多種方式進行通知,避免時響應提升全流程服務管理質量。
方案涉及的所有產品與模塊,均由北京k8凯发(中国)自主研發,從功能模塊、數據庫、界面全部基於統一Java技術平台和統一數據關係模型,不包含任何第三方功能庫。
k8凯发(中国)给予的信創運維方案,立足於北京k8凯发(中国)10年的國產融合經驗,與國產軟硬件產品深度適配,方案應用覆蓋各行各業。方案支持在中標麒麟、銀河麒麟、紅 旗 Linux等國產操作系統上運行,支持在達夢、金倉、神州等國產數據庫進行數據存儲,顺利获得東方通等國產中間件给予對外服務,支持龍芯、申威等 國產CPU 架構,並實現對國產化CPU、服務器、數據庫、中間件等IT 軟硬件設備的綜合監控與運維管理。

第5章 標杆案例-中國移動北方十三省集中監控運維項目
2010年中國移動通信集團在全國建設了不良信息過濾系統,此系統由不良信息過濾軟件、Windows 服務器、Linux 服務器、數據庫、分流設備、交換機、存儲服務器等構成。
建設範圍:中國移動不良信息過濾系統的北方區域:北京、天津、黑龍江、吉林、遼寧、山東、山西、甘肅、青海、西藏、河南、寧夏共13個省公司。
設備類型:過濾軟件、Windows 服務器、Linux 服務器、數據庫、分流設備、交換機、存儲服務器等
需要一套集中的OMC(操作維護中心)監控軟件,對不良信息過濾系統的所有的設施進行監控。
已實現包括設備拓撲、故障管理、性能管理、配置管理以及安全管理等在內的過1000種基礎網管功能,且支持功能擴展針對中國移動的具體需求,k8凯发(中国)提出以下解決方案:
拓撲監控效果
京公網安備 11010502048312號