3.1. 方案概述
在該項目建設中, DeepFlow? 平臺對接范圍包括阿里公有云、VMware、華為公有云、華為私有云、微軟公有云共5個平臺。通過部署DeepFlow? 采集器、控制器和數(shù)據(jù)節(jié)點三大組件,幫助地產(chǎn)科技企業(yè)在混合云環(huán)境中實現(xiàn)了虛擬網(wǎng)絡流量的統(tǒng)一采集和實時分析,實現(xiàn)對業(yè)務關鍵鏈路的全面性能監(jiān)控,并提供虛擬網(wǎng)絡端到端的路徑診斷。
采集器運行于5朵云的計算節(jié)點,通過從控制器獲取ACL規(guī)則,提供對云環(huán)境中的網(wǎng)包數(shù)據(jù)完備的采集和預處理能力(如過濾、分發(fā)、Flow生成、Flow截取、脫敏等功能)可精細地實現(xiàn)對云網(wǎng)絡流量的采集和分析。
控制器組件以集群模式旁路部署在本地資源池的標準x86服務器中,提供5朵云的對接和全部采集器的管理以及采集策略的管理。數(shù)據(jù)節(jié)點部署方式和控制器相同,提供豐富的實時分析和回溯取證等功能,并根據(jù)項目規(guī)劃要求,支持橫向擴展。
3.2. 部署實施
在項目實施過程中,控制器和數(shù)據(jù)節(jié)點旁路部署在地產(chǎn)科技企業(yè)本地資源池的x86集群,控制器通過對接云平臺實現(xiàn)了虛擬機遷移感知,從而實現(xiàn)了采集策略的自動化跟隨;同時 DeepFlow? 擁有對自身系統(tǒng)的全面監(jiān)控能力,以確保平臺穩(wěn)定運行且不會對地產(chǎn)科技企業(yè)云環(huán)境造成影響。根據(jù)5朵不同云的技術差異,采集器組件在不同的云環(huán)境中,采取了如下部署方式:
在基于開源OpenStack云平臺環(huán)境(如華為私有云)中,采集器以用戶態(tài)進程的形式安裝在宿主機上,利用宿主機操作系統(tǒng)自身內核的功能模塊,對其虛擬網(wǎng)卡進行流量采集。
在VMware云平臺、微軟Hyper-V虛擬化環(huán)境和其他公有云中,通過在獨立虛擬機中安裝采集器的方式,借助宿主機或公有云操作系統(tǒng)自帶的虛擬交換機功能實現(xiàn)流量的采集。
3.2.1. 云網(wǎng)全景圖
地產(chǎn)科技企業(yè)云平臺對資源上下級的關聯(lián)展示有所缺失。例如網(wǎng)管平臺只有宿主機與虛擬機的信息關系,而云平臺又只有VPC、子網(wǎng)、虛擬機信息;當宿主機故障時,無法判斷影響了哪些客戶的哪些資源。借助 DeepFlow? 資源拓撲既能查看資源的所有云平臺信息、流量統(tǒng)計信息,又能根據(jù)不同視角來查看資源的關聯(lián)關系;例如VPC視角能將VPC關聯(lián)的虛擬網(wǎng)關、VPC所包含的子網(wǎng)、虛擬機、虛擬路由器、虛擬安全組、外網(wǎng)/內網(wǎng)IP等全部呈現(xiàn)。
現(xiàn)有的流量統(tǒng)計和管理工具中,基本具備對單資源點的監(jiān)控,但多資源之間的流量走向關系卻不能直觀地可視化,因此則不能進行帶寬資源優(yōu)化,也不能監(jiān)控流量到底流向何方。借助 DeepFlow? 流量拓撲能力,云平臺的運營者不僅能從大范圍到小范圍層層深入揭示流量拓撲關系,也能窺見資源與資源之間、資源與Internet之間、資源與未知流量之間的關系。
3.2.2. 云網(wǎng)診斷
云時代東西向流量占比越來越大,虛擬網(wǎng)絡越來越得到重視,但虛擬網(wǎng)絡問題的定位還處在蠻荒期,多數(shù)場景下都是一邊人工查看配置信息,一邊找到對應設備,一邊導流量分析的狀態(tài)。云平臺運營者無法準確知曉業(yè)務部門提出來的帶寬需求是否合理;也不知道虛擬機的投放是否符合業(yè)務需求;不清楚東西向的流量與南北向流量的變化;難以區(qū)分哪些業(yè)務的流量產(chǎn)生了異常;不能預判活躍TCP端口是否有變化。
地產(chǎn)科技企業(yè)的5朵云不同程度地遇到了上述問題,要解決上述問題需要先解決東西向流量帶來的巨大壓力。DeepFlow? 依靠精準的流量預處理能力,從多資源維度、多租戶視角、多流量場景、任意時間粒度來統(tǒng)計與分析云網(wǎng)流量、包量,針對業(yè)務畫像梳理出來的業(yè)務做可視化監(jiān)控。此外,DeepFlow? 提供了豐富的可自定義告警設置,通過對不同的云資源池、設定詳細的網(wǎng)絡性能監(jiān)控指標和告警閾值,從而實現(xiàn)了快速發(fā)現(xiàn)和定位業(yè)務網(wǎng)絡異常;結合支持五元組采集過濾的PCAP下載功能,滿足了故障回溯取證的需求,覆蓋了故障事前預警和事后分析的全場景。
4. 價值總結
在不侵擾生產(chǎn)網(wǎng)絡、不影響業(yè)務連續(xù)性的前提下,DeepFlow? 通過與地產(chǎn)科技企業(yè)多云平臺的對接,在層次復雜的虛擬網(wǎng)絡環(huán)境中從服務和應用角度,梳理并監(jiān)控業(yè)務網(wǎng)絡,通過對網(wǎng)絡指標的異常信息進行實時分析,為業(yè)務在虛擬網(wǎng)絡中的運行狀態(tài)提供及時的監(jiān)控告警。地產(chǎn)科技企業(yè)通過部署 DeepFlow? 實現(xiàn)了異構云資源池虛擬網(wǎng)絡流量的按需采集、統(tǒng)一管理,解決了多云環(huán)境下虛擬流量的一體化管理和分析,為企業(yè)的業(yè)務整合、資源打通和基礎設施建設打下了堅實的基礎。