經(jīng)過域名解析階段后,靜態(tài)資源命中CDN后直接返回,無命中時會回源去拉取,動態(tài)請求直接訪問WEB服務(wù),在請求到達(dá)四層和七層ELB之前,多數(shù)企業(yè)應(yīng)用也會選擇WAF來清洗異常流量。
經(jīng)過ELB后,請求到達(dá)業(yè)務(wù)應(yīng)用服務(wù)器,業(yè)務(wù)實例多為分布式構(gòu)架,微服務(wù)之間相互調(diào)用,一般情況下企業(yè)運維人員較多的關(guān)注點是應(yīng)用實例這一層,多為企業(yè)自行開發(fā)的服務(wù)。
持久化層當(dāng)前各CSP提供的中間件不一樣,華為云上用戶使用較多的如分布式緩存,分布式數(shù)據(jù)庫等。由于提供動態(tài)擴容及較高級別的SLA,越來越多的企業(yè)不再需要專業(yè)的DBA,轉(zhuǎn)而使用云上的服務(wù),開發(fā)上也更加敏捷。
如此多的云服務(wù)和各種資源,任何一個環(huán)節(jié)出現(xiàn)問題,都將導(dǎo)致應(yīng)用KPI異常,用戶體驗下降,進(jìn)而導(dǎo)致企業(yè)運營受到影響,而每個使用云服務(wù)的企業(yè),如果投入大量人力去自建運維系統(tǒng)并且將整個請求的各個環(huán)節(jié)關(guān)聯(lián)起來,成本會非常高。因此華為云通過實踐構(gòu)建了一套立體運維體系,幫助企業(yè)更好的進(jìn)行一站式運維。下面將為您介紹立體運維定位、架構(gòu)及特點。
立體運維主要是圍繞應(yīng)用進(jìn)行監(jiān)控,一站式完成基礎(chǔ)設(shè)施層、應(yīng)用層及用戶體驗層的監(jiān)控。
參考以上典型云應(yīng)用架構(gòu),將業(yè)務(wù)請求路徑上經(jīng)過的不同資源進(jìn)行分層,分層如下:
圍繞分層設(shè)計不同的專業(yè)運維服務(wù)子系統(tǒng),將不同數(shù)據(jù)在不同子系統(tǒng)上串聯(lián)協(xié)同、關(guān)聯(lián)分析,構(gòu)筑一個云上的運維平臺,從而最大化的實現(xiàn)數(shù)據(jù)價值,為運維人員提供一個統(tǒng)一的運維中心,達(dá)到一站式立體化運維的目的。綜合立體運維定位及典型云應(yīng)用分層,立體運維融合了華為云的應(yīng)用運維服務(wù)(AOM)、應(yīng)用性能管理服務(wù)(APM),對虛機、存儲、網(wǎng)絡(luò)、數(shù)據(jù)庫及應(yīng)用等多維度實時監(jiān)控,并通過應(yīng)用與資源告警關(guān)聯(lián)、日志分析、智能閾值、分布式調(diào)用追蹤、手機APP異常分析等技術(shù),實現(xiàn)分鐘級問題快速診斷和修復(fù),保障云上應(yīng)用長穩(wěn)運行。
AOM側(cè)重于對云主機、存儲、網(wǎng)絡(luò)、WEB容器、Docker、Kubernetes等應(yīng)用運行環(huán)境及應(yīng)用狀態(tài)、應(yīng)用與資源的關(guān)聯(lián)關(guān)系等內(nèi)容的深入監(jiān)控并進(jìn)行集中統(tǒng)一的可視化管理,其架構(gòu)如下:
APM側(cè)重于分布式應(yīng)用性能分析,擁有強大的分析工具,通過拓?fù)鋱D、調(diào)用鏈、事務(wù)分析可視化地展現(xiàn)應(yīng)用狀態(tài)、調(diào)用過程、用戶對應(yīng)用的各種操作,快速定位問題和改善性能瓶頸,其架構(gòu)如下:
立體運維一站式完成基礎(chǔ)設(shè)施層、應(yīng)用層及用戶體驗層的監(jiān)控。它具備以下特點:
通過集群與虛機、虛機與應(yīng)用、應(yīng)用與資源統(tǒng)一建模,將集群、虛機、網(wǎng)絡(luò)、磁盤、數(shù)據(jù)庫、應(yīng)用、容器及業(yè)務(wù)等上百種指標(biāo)監(jiān)控起來,并提供各種指標(biāo)智能關(guān)聯(lián)分析,運維人員通過統(tǒng)一的告警入口即可下鉆找到問題根因。
將虛機上的應(yīng)用、開源組件、系統(tǒng)等日志集中采集起來,通過清洗、實時分析、智能聚類等處理,實現(xiàn)了日志的高性能搜索和業(yè)務(wù)分析。同時,支持自定義采集路徑、實時刷新、上下文查看、秒級搜索、日志下載、轉(zhuǎn)儲等常用功能,滿足日常所需。
應(yīng)用、服務(wù)、實例、資源相關(guān)聯(lián),可以直接查看到異常影響范圍。針對應(yīng)用異常,可以直接查看其指標(biāo),通過指標(biāo)找到原因。針對資源異常,可以查看其資源對象拓?fù)鋱D及告警情況等信息來定位原因。
應(yīng)用拓?fù)涫菍?yīng)用間調(diào)用關(guān)系和依賴關(guān)系的可視化展示,包括應(yīng)用狀態(tài)、時延、錯誤、負(fù)載、依賴關(guān)系等指標(biāo),支持?jǐn)?shù)據(jù)庫、緩存、消息中間件、NOSQL等各類開源組件的情況。同時可以按照時間、服務(wù)、事務(wù)、top等維度進(jìn)行篩選查看。在應(yīng)用拓?fù)渲校槍Ξ惓R部芍苯酉裸@查看調(diào)用關(guān)系,定位異常根因。
調(diào)用鏈跟蹤、記錄業(yè)務(wù)的調(diào)用過程,還原業(yè)務(wù)請求在分布式系統(tǒng)中的執(zhí)行軌跡和狀態(tài),可以分鐘識別異常原因。在業(yè)務(wù)方法被調(diào)用時,可自動捕獲該方法的調(diào)用者、詳細(xì)的堆棧以及各類參數(shù),幫助開發(fā)人員快速鎖定問題現(xiàn)場。
從運營視角,了解每個業(yè)務(wù)的運行狀況,包括交易次數(shù)、時延、錯誤率,并通過調(diào)用鏈找到異常代碼,同時可以幫助運營人員了解活動期間的交易體驗情況。
數(shù)據(jù)庫SQL語句異常,可能會引發(fā)業(yè)務(wù)超時等問題。在日常運維中,可通過錯誤耗時、響應(yīng)時間等關(guān)鍵指標(biāo)對數(shù)據(jù)庫進(jìn)行監(jiān)控,定位出那些執(zhí)行耗時長、效率低、調(diào)用出錯的SQL語句,并對其進(jìn)行分析和優(yōu)化。
通過運維數(shù)據(jù),包括百種指標(biāo)監(jiān)控、KPI數(shù)據(jù)、調(diào)用跟蹤數(shù)據(jù)自動完成故障根因分析。具體原理可分為單維度異常識別、復(fù)合事件異常識別、業(yè)務(wù)根因分析。
單維度異常識別:根據(jù)歷史指標(biāo)數(shù)據(jù)動態(tài)生成指標(biāo)基線,無需人工配置告警閾值。
復(fù)合事件異常識別:多維護(hù)異常指標(biāo)因果關(guān)聯(lián)分析,識別出根源告警。
業(yè)務(wù)根因分析:提取業(yè)務(wù)正常與異常時上下文數(shù)據(jù)特征,如資源、參數(shù)、調(diào)用結(jié)構(gòu),通過聚類分析找到問題根因。
5G時代,華為云強大可靠的運維能力將助力互聯(lián)網(wǎng)企業(yè)上云無憂,更能抓住5G紅利,搶先擁抱數(shù)字化和智能化時代。7月2日~8月31日期間,華為云啟動“華為云專蜀月”活動,重點為四川以及西南地區(qū)的客戶上云降低門檻,特別推出了西南節(jié)點ECS S3云主機還提供6折特惠的活動。針對視頻、游戲、移動應(yīng)用APP三大互聯(lián)網(wǎng)應(yīng)用場景的特惠包,包括免費視頻加速體驗、全球獨家云手機優(yōu)先購買權(quán)、免費高頻云服務(wù)體驗等權(quán)利。華為云為新老客戶、生態(tài)伙伴及開發(fā)者設(shè)計優(yōu)惠政策也誠意滿滿:對于老客戶,華為云最高返券可達(dá)50%;對于新客戶,則有機會獲得最高贈2萬元的測試券;開發(fā)者更可獲得微認(rèn)證限時五折特惠并加返百元大禮;生態(tài)合作伙伴則享受首單5折的優(yōu)惠。