峰會首日,應主辦方邀請,戴爾科技集團大中華區(qū)售前系統(tǒng)工程部解決方案架構師姜永凱發(fā)表了《持續(xù)引領存儲技術創(chuàng)新與發(fā)展》的主題演講。
以下內容根據速記整理,已經本人審定。
姜永凱:感謝百易傳媒(DOIT)2019中國數據與存儲峰會這個平臺。我是姜永凱,在戴爾科技集團為企業(yè)級客戶提供技術架構方面的支持。非常榮幸今天參會,也見到了非常多的新老朋友。我用二十分鐘時間分享一些存儲技術創(chuàng)新與發(fā)展方面的內容。
首先我們來看用戶關心什么。我們知道,我們最終服務的是用戶,做存儲產業(yè)也是這樣。在數字化的時代,用戶在關心什么?用戶關心的是自己的業(yè)務,關心業(yè)務如何更敏捷。IT的技術、存儲技術的發(fā)展方向,都是為了實現用戶的業(yè)務敏捷,產生業(yè)務價值。也就是幫客戶的業(yè)務可以快速調整,用代碼實現他的業(yè)務價值和他的業(yè)務邏輯,這也是我們的價值所在。
IDC總結了企業(yè)級IT的三個大方向。
首先是微服務化,微服務已經成為主流。大家一看就明白,因為微服務化和容器是幫助用戶實現代碼重用和代碼敏捷部署一個重要的方向。IDC預計,2018-2023年,隨著云原生工具/平臺、敏捷方法、大量代碼重用以及更多的開發(fā)者的出現,將有5億個新APP面世,與過去40年間的數量相當。
存儲如何去滿足微服務化,如何從傳統(tǒng)比較重的交付,變成能夠快速迭代的持續(xù)開發(fā)/持續(xù)部署(CI/CD),再到開發(fā)運維一體化(DevOps),甚至未來討論No-Ops,這是戴爾科技集團在幫助用戶思考的問題。
二是多云部署已經成為主流。云幫助用戶的代碼交付實現更大的彈性,能夠實現從邊緣到核心到多云平臺的部署。
三是人工智能能力不斷擴展。數據的不斷積累,在算法、算力的提升下,人工智能不是一個很遠的話題,今天可能我們還在這里,是人工智能的第二階段,包括智能工廠、智能制造,未來會更快的進入到前端,為什么?因為人工智能最核心的內容就是算法,算法是什么,剛才我講了就是代碼,就是業(yè)務邏輯和業(yè)務價值。人工智能也要求數據的高性能、高可用、高可靠,以及運維的自動化。
在這三點之外,我們還有哪些工具可以利用?可以看到,5G,IoT,分布式計算,區(qū)塊鏈等等。這些代表了目前最熱門的方向,要求我們把數據中心的管理模式從傳統(tǒng)的方式變到了一個全新的模式。過去十年,我們把數據中心之外發(fā)生的事件和業(yè)務信息,拿回到數據中心里邊處理和管理,未來的十年,我們會在事件發(fā)生的位置做實時的計算與處理。因為5G提供了實時交易和處理的能力,而人工智能可以幫助我們去做更好的算法訓練,再把封裝的算法推到邊緣去做推理,利用傳感器更多的感知能力,利用區(qū)塊鏈技術可以跨組織和個人交易信息或者交易數據。
在新的模式下,數據存儲與管理面臨哪些挑戰(zhàn)?隨著數據量增長,大量的交易數據拿回數據中心處理。要管理數據的增長,打破系統(tǒng)之間的區(qū)隔,實現系統(tǒng)交換,往往需要重新建一個大數據云平臺。另外,如果打破了這個區(qū)隔,那意味著所有”雞蛋放在一個籃子里”,籃子一定要更安全更堅固。最后是釋放價值,包括用AI算法,用以前比較熟悉的手段,如結構化數據上建模,未來還要關照IoT上邊如何處理流式數據。
戴爾科技集團擁有七個子品牌,最核心的是三家公司:Dell EMC,VMware,Pivotal。在中國,戴爾科技集團未來將幫助客戶提供一個數據中心轉型的整體解決方案,這個方案可以從邊緣到核心再到云解決算力部署和數據管控的問題。
戴爾科技集團的存儲產品也非常豐富,行業(yè)內已經找不到一個存儲廠商能夠提供如此豐富產品線。為什么?因為我們所有的產品與創(chuàng)新都來自于客戶的需求。就是今天,當你的代碼在去做部署的時候,你有這么多不同的可用性需求、容量的需求、部署方式的需求以及數據格式的需求等等,這都是我們在關注存儲的發(fā)展方向時的重點。
針對未來的需求,戴爾科技集團把數據中心的數據服務拓展到邊緣,將今天的數據服務,數據中臺,統(tǒng)一分析平臺等等整合成一個統(tǒng)一數據服務平臺。今天的技術能不能夠銜接未來的產品?戴爾科技集團未來的產品就是要幫助客戶能夠無縫和上一代或更早的產品做集成。高端的PowerMax已經發(fā)布,中端應該在明年會有新的平臺出現,名字還沒有宣布,PowerVault也是已經宣布的產品,是我們低端的存儲,大量邊緣計算需要的臨時存儲,以及可用性要求不那么高的存儲等等很多應用場景。如何把數據保護起來?我們數據保護的產品也有新的發(fā)布。
所有的這些平臺,我們都是通過一個叫DNA的東西,也就是我們的技術儲備,能夠把客戶需求和我們的解決方案聯結在一起,這是我們在未來要關注的內容。有了這樣的技術儲備,還離不開大量的人才。我們在中國有2500+名研發(fā)的人員,幫助順應客戶需求實現產品的升級,這將是一個長達幾年,跟著用戶的需求成長的過程。我們在中國儲備了足夠的人員,甚至還在中國為整個存儲行業(yè)輸出了很多技術人員,行業(yè)內也有大量根據Dell EMC產品與解決方案去做研發(fā)的行業(yè)伙伴。所以我們看到,這是一個大的行業(yè)生態(tài)體系,這個生態(tài)體系幫助我們可以做更好的DNA,做更好的產品技術儲備,創(chuàng)造更好的存儲行業(yè)未來。
看一下,用戶關心的另外一個話題是什么?
代碼在交付的過程里面有不同的方式。企業(yè)級客戶大多不是互聯網公司或Startup的小白公司,都是在現有基礎架構下面去發(fā)展應用,然后去滿足未來數字化應用需求,在現有應用系統(tǒng)里有最傳統(tǒng)的布局。以中航信值機系統(tǒng)為例,最核心的系統(tǒng)運行在大機上,未來看不到任何方式能更好地替換這個系統(tǒng),同時開放平臺要滿足跟很多企業(yè)級客戶平臺對接的功能,要滿足每個航班每個乘客的信息交互,實現的方式就是混合云平臺。
混合云的概念不只是多個公有云,多個私有云的混合云,而是未來代碼交付也會在裸金屬主機、虛擬化、容器以及PaaS等云服務堆棧的多層提供交付的能力,這是多堆棧、多協(xié)議的云,多層提交IT服務能力的云平臺。在這樣一個多云環(huán)境里,戴爾科技集團重點關注如何去打造互通的能力,如何通過存儲在底層把業(yè)務系統(tǒng)平臺做互聯互通,最終實現業(yè)務快速交付。
涉及到一些業(yè)務層面,企業(yè)級客戶要滿足大量的I/O交易,傳統(tǒng)的存儲包括核心存儲如何去面對To C的業(yè)務轉變,這方面有非常多的案例。存儲介質的速度提升需要在存儲系統(tǒng)上做整體的優(yōu)化,才能讓這種價值帶給應用。商業(yè)銀行為了應對雙十一,應對新年紅包,交易平臺可以達到每秒鐘2.5萬次的交易,提升了交易平臺性能天花板。
每一個企業(yè)級用戶考慮數據中心布局的時候,首要的問題是擔心有沒有足夠的空間,有沒有足夠多的電力,這個時候要考慮的是存儲能否做線內的除重和壓縮,同時不損傷應用的性能。這個將是存儲很關鍵的一個能力,因為應用在損傷性能的情況下做除重和壓縮沒有任何價值和意義。
今年9月17日,戴爾科技集團成為業(yè)內第一個存儲系統(tǒng)里使用雙端口的傲騰介質,就是在應用性能得到五倍提升情況下,大幅度降低機房的消耗和電力的消耗,解決了企業(yè)級客戶機房面臨的確實問題,也實現了戴爾科技集團的社會責任承諾。
這種情況下,除了性能的提升,也包括介質的利用,我們都知道存儲級內存(SCM)價格很貴,每TB是普通NAND閃存價格的十倍,用戶更關心怎么把介質用好,這里有一個一九原則,百分之十是經常訪問的數據,需要更高的應用性能,而在互聯網+時代之后或者說數字化2.0時代,用戶關心的是提升性能的天花板,減少數據擺放的人力消耗,用人工智能讓機器自動去做,我們的PowerMax也是第一個在業(yè)內高端存儲里部署了人工智能的算法。每一天實時分析預測4000萬個數據單元,是選擇SCM存儲介質,還是選擇傳統(tǒng)NAND介質,機器可以通過算法幫助優(yōu)化,每一天在一臺設備里可以做60億個智能決策,移動這些數據單元。這樣的存儲才可以幫助客戶應對調整所消耗的人力資源增長需求,未來會有更多的越來越智能的設備工作在數據中心,應對數據性能和容量的挑戰(zhàn)。
此外,現在很多用戶也采用多云的環(huán)境,當然不是多云的堆棧,這里是指私有云和公有云之間的互聯,實際情況是,最底層的虛擬化層(Hypervisor)都完全不同,怎么樣打通多個公有云之間的區(qū)隔呢?戴爾科技集團將在多云的堆棧,在代碼需要部署的層面聯通多云,利用原生的容器和虛擬機統(tǒng)一管理做應用的交付。在底層提供更靈活的選擇,通過傳統(tǒng)三層架構的存儲,或通過超融合的方式,自服務獲取底層的基礎架構。
多云基礎架構最大的特點是,用戶今天可以和騰訊、阿里、AWS、微軟、IBM等,幾乎可以找到所有的主流公有云服務商,都會有一個VWware的專區(qū),這個專區(qū)和用戶的數據中心之間可以無縫的互通,然后通過虛擬機無縫的遷移,不需要停機,這樣的多云平臺可以幫助客戶更好地實現代碼交付,利用公有云實現更大彈性。
這里邊包含了云和數據中心之間的互通,邊緣到數據中心之間的互通
也包括了如何保護所有在邊緣、在數據中心、在公有云多云平臺的數據。
未來在物聯網的環(huán)境如何交互處理數據?
要把數據取回數據中心只是做訓練,邊緣一定是一個小的算法或者是壓縮成模塊的算法,可能是通過FPGA去部署,數據中心里是大數據量通過GPU、TPU去做訓練。這個平臺最大的問題是什么?無論采用現有的什么手段,比如用卡夫卡把數據采集進來,不管是到數據湖還是數據服務平臺,最重要的是數據一旦寫入系統(tǒng),現在無法避免它的移動和拷貝,只要移動和拷貝就會產生數據副本,產生數據副本就會有管理,有數據一致性的問題。通過卡夫卡,并發(fā)有限制,實時處理有限制,數據的分析處理要通過ETL加載到某一些分析平臺上面實現,也無法滿足未來在邊緣做實時的推理,這是一個非常大的問題。
流數據本身還存在管理的問題,對數據副本進行管理,對應用前端的管理,這里也有孤島無法打通。
戴爾科技集團歷時兩年研發(fā)的Naultilus項目的Pravega分布式流存儲平臺,會幫客戶把數據注入和數據持久化統(tǒng)一在平臺上面,只要寫入到數據平臺,就減少它的移動,用Isilon+ECS存儲架構實現持久化保存,利用Flink平臺(目前屬于阿里集團)做流數據的計算處理,我們繼續(xù)合作在做一個統(tǒng)一的流數據分析的引擎,結合在一起減少數據的移動、減少數據的副本,增加數據管理的一致性,滿足實時分析處理應用的要求。
2018年,戴爾科技集團的外部存儲取得了長足的成長,同時軟件定義、超融合相關業(yè)務也在進一步增長。
我們不但引領了這個行業(yè),也把一些最新的技術帶到這個行業(yè)里邊來。
今年戴爾科技集團和IDC聯合撰寫了一份白皮書,提出了第五代存儲概念,指出了未來存儲的五大特性,包括敏捷高速、有效容量、無縫接云、數據護航、AI賦能,以及如何幫助用戶利用第五代存儲的特性實現數字化轉型,這次兩天的會議中還安排了SCM和第五代存儲的專場,也請大家關注。
未來,戴爾科技集團將持續(xù)在存儲上在中國加大投入,謝謝大家。
編后:本次2019中國數據與存儲峰會(DATA & STORAGE SUMMIT)為期兩天,包含主論壇、CIO高峰對話,以及大數據、閃存系統(tǒng)、分布式存儲、第二存儲與容災備份、超融合與云存儲、人工智能、數據創(chuàng)新與安全可控、容器創(chuàng)新與應用、SCM第五代存儲與閃存控制器等十大主題論壇,超過100場的專業(yè)知識分享。初步統(tǒng)計,本屆峰會吸引了來自政、企、產、學、研、媒體等各方參會者約2000人,在線直播觀看觀眾再創(chuàng)新高,超過10萬余人次。