近日,我們采訪了兩位經驗豐富的大咖,試圖從博睿數據的視角窺探AIOps 的全貌。
關于AIOps 產品本身

就博睿數據而言,博睿數據的AIOps的核心是“數據+AI+產品+場景”四合一的綜合解決方案。在一體化運維、告警管理、故障定位、應急快恢等高頻運維場景中幫助用戶更高效、更準確的達成業(yè)務目標。
就其優(yōu)勢而言,主要有5個方面:
目前,博睿數據基于自研的大數據實時處理和分析平臺 Zeus做數據挖掘,在異常檢測、趨勢預測、告警收斂、事件分析等應用場景方面已實現產品化落地。
具體來說,異常檢測,主要應用于運維數據的無監(jiān)督異常發(fā)現環(huán)節(jié),不需要運維人員手工設置閾值即可做到異常的自主發(fā)現,大幅節(jié)省了人力投入;
趨勢預測,主要應用于業(yè)務特性運維數據的預測場景,比如容量預測、訪問量預測、硬件缺陷預測等等,對于運維人員的預算編制、業(yè)務規(guī)劃和提前介入處置起到很大的參考作用;
告警收斂,主要應用于統(tǒng)一告警平臺的事件管理場景,運維人員不再需要面對大量的無效告警,只需要關注收斂后的少量故障,應急處置的效率和精準度有了大幅提升;
事件分析,主要應用于一體化運維平臺的問題管理場景,AI將指標、Trace、事件的異常信息匯聚到問題,從問題查找根因,從根因聯動通知、自動化等處置步驟,問題分析的效率和精準度得到大幅改善。
在AIOps實踐方面,博睿數據依托多年APM行業(yè)積累,已具備豐富的數據集合。依托IT運維監(jiān)控能力,利用大數據和機器學習技術持續(xù)構建智能運維監(jiān)控能力。
2021年,博睿數據在國內首次提出了“服務可達的數據鏈DNA”技術理念,D代表DEM(數字體驗管理),N代表NPM(網絡性能管理),A代表APM(應用性能管理),從而打通從代碼到用戶訪問的全過程,進一步釋放企業(yè)IT運維監(jiān)控管理所有分支領域DEM、APM、ITIM、NPM和智能運維管理的能力。

目前,博睿數據算法中臺 SwiftAI已賦能到新一代APM的Server產品、新一代的智能運維大數據平臺DataView、“雙模一體”智能應急中心OneAlert等,與博睿數據統(tǒng)一聯邦數據中臺 Zeus相輔相成,不斷落地智能異常檢測、趨勢預測、智能告警、事件分析等場景,助力云原生時代服務可達。
2022年5月20日,博睿數據正式推出了一體化智能可觀測平臺ONE,該平臺旨在建立一體化、智能化、面向業(yè)務與用戶體驗的統(tǒng)一運維平臺,助力企業(yè)提高數字化體驗,降低運維成本,提升工作效率,為數字化轉型賦能升級。同時,這也是業(yè)界第一個將所有運維監(jiān)控需求“All in ONE”的統(tǒng)一平臺。博睿數據的 AI 能力,比如告警收斂、根因分析、多維分析、影響分析等,也將在 ONE 平臺的觀測洞察、應急管理等模塊中逐步落地。

談及博睿數據AIOps未來的發(fā)展,賀安輝表示:“未來,博睿數據在AIOps 方面將在根因定位、影響分析、NLP、算法實驗室四個方面發(fā)力。”
同時,未來博睿數據也將繼續(xù)發(fā)展多模態(tài)數據聯邦“底座”和AI算法的廣度和深度,支持全程服務可觀測。
AIOps 未來已來
雖然AI技術給運維工作帶來的價值顯而易見,但需要明確的是AIOps 不是一個一蹴而就的實踐,而是一個長期演進的過程,需要不斷創(chuàng)新發(fā)展。
就當前國內智能運維的環(huán)境而言,李驊宸認為AIOps還存在以下幾方面的挑戰(zhàn):
在他看來,博睿數據今后要在智能運維方面持續(xù)發(fā)力。
首先,要打破數據孤島,做DNA 數據的最大化融合,建立數據資產的統(tǒng)一管理倉庫,產生聯邦數據的次生價值。以博睿數據提出的數據鏈DNA 概念為例,AIOps是DNA中重要的一環(huán),可助力APM產品和數據實現端到端打通,讓DNA更加自動化和智能化。同時,DNA數據鏈也給AI提供場景和數據土壤,讓AI通過信息整合、特征關聯真正的跑出優(yōu)質算法模型。
其次,要加強數據分析和數據挖掘,擴展AI產品能力,夯實算法基礎能力,讓AI支持輕量級的模塊化和產品化。在算法可解釋性和評價體系方面建立一套標準,引入不同的數據集進行數據加工分析,用真實故障注入的方式來不斷錘煉AIOps能力,在商業(yè)化輸出時能夠以近乎開箱即用、極低適配成本的方式實現價值的最大化輸出。
更為重要的是,AIOps本就是基于已有的運維數據,并通過機器學習的方式來進一步解決自動化運維沒辦法解決的問題。企業(yè)實現AIOps的前提是建立起全面獲取IT數據的能力,這里的數據主要包括但不限于日志、指標和事件等。將這些數據輸送給AIOps平臺,為AIOps提供數據資產,以進行整合的更高級別的分析和洞察。如果沒有這些大數據的支持,AIOps則是無源之水。所以對于企業(yè)來說,大數據采集工作至關重要。
兩位大咖對AIOps的未來發(fā)展充滿信心??傮w而言,中國市場足夠大,數據也足夠豐富,而在國家戰(zhàn)略和政策的支持下,傳統(tǒng)制造業(yè)正向智能創(chuàng)造逐步發(fā)展,發(fā)展的過程中必然會涉及大量數據處理,而這也是AI技術的強項,當前在運維領域,AI技術的應用還是剛剛起步,慢慢成熟,在未來的3-5年內,AI技術會廣泛應用到運維場景中,向自助式服務方向發(fā)展。
寫在最后
每一個產品最需要的是被市場認可。
在標準制定方面,2021年博睿數據獲信通院首批AIOps評估的異常檢測全面級,同年博睿數據作為信通院組織的AIOps標準工作小組成員,多項建議納入到規(guī)范標準。
在產學研方面,博睿數據也跟廈門大學成立聯合實驗室,開展機器學習、深度學習方面的合作。
在行業(yè)應用落地方面,博睿數據的AIOps解決方案已經落地到銀行、保險、證券、教育、航空等行業(yè)中,如異常檢測場景、告警收斂場景、趨勢預測場景等,為客戶的數字化轉型加速賦能。