為了應對新增的需求,用戶不得已的選擇是不斷疊加,先一個個疊加新的專用數(shù)據(jù)庫產(chǎn)品,再疊加運維不同產(chǎn)品的專業(yè)化團隊。最終造成的困境,杭州自動化技術(shù)研究院院長徐赤將其總結(jié)為“難、混、亂、散”:

每出現(xiàn)一個新需求,就要疊加一個新產(chǎn)品,從選型、試點到驗證,少則一兩個月,多則半年甚至一年,堪比“煉獄”。由于目標混沌、路徑混亂、缺少核心系統(tǒng),數(shù)據(jù)總是呈現(xiàn)散亂并難以整合的狀態(tài)。

最后導致的直接結(jié)果就是“用戶成本高“、”需求難以滿足、痛點永遠存在”。

對此,徐赤在發(fā)布會上表示,在過去以專用類產(chǎn)品為主流的市場中,服務商忙著生產(chǎn)孤島、企業(yè)忙著購買孤島,工程師們忙著打通孤島,循環(huán)往復,永無止境。而且,這樣強行耦合的結(jié)構(gòu),牽一發(fā)動全身,非常不穩(wěn)定。

YMatrix創(chuàng)始人姚延棟介紹,作為數(shù)據(jù)庫人,成立團隊的初心,就是想從用戶需求出發(fā),做一款通用性強的產(chǎn)品,而不是和大多同行一樣,開發(fā)專用數(shù)據(jù)庫產(chǎn)品,繼續(xù)一個問題接一個問題,只解決當下問題。

據(jù)了解,在國際市場上,類似YMatrix這樣具備 “超融合”特性的產(chǎn)品,已經(jīng)成為了近年的研發(fā)趨勢。

海外市場,Snowflake 和 Databricks 曾先后提出 “one data platform”理念;傳統(tǒng)數(shù)據(jù)庫頭把交椅的Oracle也在走向融合方向;對復雜新興場景需求更加熟悉的時序數(shù)據(jù)庫大佬 InfluxDB 和 TimescaleDB,也先后啟動了新一代融合型數(shù)據(jù)庫的研發(fā),對比大廠采取了更為激進的策略。

國內(nèi)市場中,YMatrix率先提出超融合數(shù)據(jù)庫概念,在2020年完成了相應產(chǎn)品的研發(fā);目前也有少數(shù)創(chuàng)業(yè)公司試水,從專用產(chǎn)品出發(fā),研發(fā)符合新一代融合理念的產(chǎn)品。

如何定義一款優(yōu)秀的“超融合”數(shù)據(jù)庫產(chǎn)品?

首先,回到用戶需求。

小米智能制造軟件產(chǎn)品部負責人封楊博士是這么定義的:以工業(yè)互聯(lián)網(wǎng)場景為例,其本質(zhì)是以“數(shù)據(jù)”為核心要素,企業(yè)實現(xiàn)全面連接。企業(yè)經(jīng)營者的核心訴求,是如何最大化利用數(shù)據(jù)智能,為企業(yè)經(jīng)營帶來看得見的價值。

再向上一層,則是跨過每個企業(yè)的微觀需求,在垂直產(chǎn)業(yè)或多個產(chǎn)業(yè)交叉的維度,構(gòu)建起全要素、全產(chǎn)業(yè)鏈、全價值鏈融合的新制造體系和新產(chǎn)業(yè)生態(tài)。

為了實現(xiàn)這個目標,需要搭建一個閉環(huán)的數(shù)據(jù)鏈條。在企業(yè)內(nèi)到企業(yè)外,從采集、診斷、預測到智能決策,實現(xiàn)全環(huán)節(jié)覆蓋。依賴優(yōu)化后的結(jié)果,可以更及時、更準確的做商業(yè)決策,比如確定一個月后生產(chǎn)什么,需要提前備好多少原材料,技術(shù)工藝能怎么調(diào)優(yōu),等等。

封楊博士介紹,從企業(yè)級用戶的角度來看,代表最先進生產(chǎn)力的產(chǎn)品,首先應該是極致簡單的,最好是一個頂N個,能降低企業(yè)的財務、人力、學習成本;其次,要好用易用,因為制造場景采集的數(shù)據(jù)類型五花八門,不同數(shù)據(jù)類型的交叉分析、應對業(yè)務訴求的復雜分析也是層出不窮。

對此,姚延棟進一步解釋,“用戶并不關(guān)心什么TP、AP、湖倉、批流,他們想要的就是一個強大的數(shù)據(jù)庫,能接入所有數(shù)據(jù),做得了各種各樣的分析。有數(shù)據(jù)就可以往里寫,想用的時候隨時用,允許他們把精力放在數(shù)據(jù)價值上,而不是數(shù)據(jù)庫上。所以,行業(yè)內(nèi)曾熱烈討論的湖倉之分、批流之分,只會是階段性產(chǎn)物”。

“使用YMatrix,用戶只需要做一次選型,運維一個產(chǎn)品,就可以支持所有數(shù)據(jù)類型,滿足所有可能的需求。每次新需求出現(xiàn)時,只需要考慮在YMatrix中怎么實現(xiàn)。這大大降低了選型成本和開發(fā)運維成本”,姚延棟介紹。

“企業(yè)內(nèi)很難有精通不同產(chǎn)品的通才,所以廠商應該把復雜度處理掉,把簡單應用給到我們用戶,這樣既省錢,又省心省力”,封楊博士表示在應用YMatrix的超融合產(chǎn)品后,相當于實現(xiàn)了“無縫集成”,僅僅需要管理“1個極致輕松的數(shù)倉建設團隊+1個極致專注的工業(yè)算法團隊”。

三一重工泵送研究院泵誦云平臺大數(shù)據(jù)負責人褚鳳天表示,“使用高效的產(chǎn)品,可以大量釋放出精力和創(chuàng)造力,讓團隊聚焦工廠運營、設備管理、工藝調(diào)優(yōu)等更有價值的工作”。

“以常見的堵管故障為例,以前總是很難明確堵管的真實原因,現(xiàn)在可以在庫內(nèi)通過批量的算法,在采集到的工礦數(shù)據(jù)上,更好的定位原因,提升服務水平,降低客戶投訴率”,褚鳳天介紹,“在嘗試從制造企業(yè)向服務型企業(yè)升級的過程中,數(shù)據(jù)能力會是重點之一,直接決定了服務水平和盈利水平” 。

性能突破,是超融合價值放大的必要前提

在數(shù)據(jù)庫行業(yè),性能似乎是一個永遠有吸引力的話題。

性能數(shù)據(jù)直觀,誰高誰低,誰強誰弱,一目了然。最近,很多數(shù)據(jù)庫廠商都開始性能打榜打擂。姚延棟對此表示,“這是好事,說明技術(shù)在進步。但是,僅僅在某個場景下實現(xiàn)性能快20%-30%,甚至1倍,是很難贏得客戶的??蛻粜枰氖氰F人三項,甚至是十項全能” 。

“在YMatrix團隊內(nèi)部,我們關(guān)注全場景性能表現(xiàn),包括寫入能力、時序查詢能力、單表OLAP分析、多表關(guān)聯(lián)OLAP分析、Machine Learning性能以及 OLTP 能力等諸多方面”,姚延棟介紹,“性能加持下的超融合,才是真正的超融合,才能給用戶提供價值” 。

目前,YMatrix在生產(chǎn)場景下的寫入速度實現(xiàn)了1.52 億數(shù)據(jù)點/秒。通常一個工廠的數(shù)據(jù)點大概在10萬點以內(nèi),1.52億是該場景規(guī)模的1500倍,哪怕是對寫入能力要求最高的時序場景,也可以輕松滿足其高并發(fā)、低延遲的寫入需求。

此外,對比時序數(shù)據(jù)庫獨角獸TimescaleDB,查詢耗時是YMatrix的5.1倍;對比知名OLAP數(shù)據(jù)庫產(chǎn)品Clickhouse,YMatrix在SSB基礎測試上快27%;對比MPP數(shù)據(jù)庫主流廠商Greenplum,YMatrix在多表關(guān)聯(lián)分析場景上實現(xiàn)了數(shù)倍的性能提升;對比全球流行的開源大數(shù)據(jù)平臺Spark,YMatrix在機器學習場景上的性能是其8倍;在Intel實驗室的TPC-B 國際標準測試中,YMatrix主鍵查詢tps高達160萬,數(shù)十倍于絕大多數(shù)產(chǎn)品。

對于性能優(yōu)化的重要性,三一重工褚鳳天表示,“最直接的體現(xiàn)就是提高運行速度,我們可以更快速的反應,大大提高了運維團隊的效率”。

姚延棟介紹,此次發(fā)布的YMatrix 5.0版本,還包含了多至138項的性能優(yōu)化,特別是針對寫入和分析等重點領域,進行了深度的指令級優(yōu)化。

在易用性方面,YMatrix設計了用戶體驗極佳的圖形化installer,只需10分鐘左右就可以完成數(shù)據(jù)庫集群的搭建。同時,為了降低初學者的學習曲線,YMatrix提供了on boarding功能,用戶可以在3分鐘內(nèi)體驗一個完整的IoT場景,包括數(shù)據(jù)寫入和查詢分析。

目前,YMatrix已經(jīng)獲得了從創(chuàng)業(yè)公司到大型企業(yè)的認可,其中有超過萬億市值的行業(yè)龍頭企業(yè),包括寧德時代、比亞迪等,以及世界500強企業(yè),包括小米、三一重工等。

“后續(xù),YMatrix會在已經(jīng)存在海量需求的時序場景深耕,嘗試替代傳統(tǒng)數(shù)據(jù)庫和專用類產(chǎn)品”,創(chuàng)始人姚延棟介紹,“數(shù)據(jù)量大、指標量多的車聯(lián)網(wǎng)、智能制造、智慧能源、智慧城市、智慧園區(qū)、智慧醫(yī)療等場景會是重要方向。這些場景所產(chǎn)生的業(yè)務需求,將最大化體現(xiàn)超融合產(chǎn)品的價值”。

收看發(fā)布會完整回放視頻請至“B站“ :bilibili.com/video/BV1b84y1B7ys

關(guān)于四維縱橫

北京四維縱橫數(shù)據(jù)技術(shù)有限公司(YMatrix) 成立于 2020 年 8 月,是一家創(chuàng)新型基礎軟 件公司,致力于物聯(lián)網(wǎng)時代新一代數(shù)據(jù)基礎設施軟件的研發(fā),并提供相關(guān)產(chǎn)品、解決方案及一站式商業(yè)服務。

公司創(chuàng)立伊始即獲得中科院系、清華系和民營頭部投資機構(gòu)的投資,在政府政策和投資資 金的大力支持下,公司迅速進入發(fā)展快車道。截止目前,公司已完成 4 輪融資,總計規(guī) 模超億元人民幣,主要投資人包括晨山資本、順義產(chǎn)業(yè)基金、東方富海、某頭部云廠商等 多家國內(nèi)知名機構(gòu)。

公司位于北京市中關(guān)村科創(chuàng)園,是國家高新及中關(guān)村高新技術(shù)企業(yè),曾獲得多項政府科創(chuàng)扶持基金支 持,并曾榮獲 2021 HICOOL 全球創(chuàng)業(yè)大賽三等獎、 2021 中關(guān)村創(chuàng)業(yè)之星等多項榮 譽。

關(guān)于YMatrix 超融合數(shù)據(jù)庫

四維縱橫團隊在業(yè)界率先提出超融合數(shù)據(jù)庫理念,并發(fā)布了 YMatrix 超融合數(shù)據(jù)庫,基于獨創(chuàng)的多微內(nèi)核開放架構(gòu),在單一數(shù)據(jù)庫之上,實現(xiàn)多模態(tài)數(shù)據(jù)的融通管理,及全場景 查詢分析的統(tǒng)一支持;同時,YMatrix 兼顧高性能、高可靠及易用性,并大幅降低了數(shù)據(jù) 基礎設施的建設復雜度,為構(gòu)建物聯(lián)網(wǎng)時代的融合數(shù)據(jù)基座,開拓一種全新的技術(shù)路徑。

YMatrix 內(nèi)置 4 種高性能微內(nèi)核數(shù)據(jù)引擎,支持包括關(guān)系數(shù)據(jù)、時序數(shù)據(jù)、GIS 數(shù)據(jù)、 JSON 數(shù)據(jù)、文本數(shù)據(jù)、圖片等多類型數(shù)據(jù)的融通管理;全面支持 SQL 1992-2016 標 準,同時支持多種場景下的復雜查詢分析,包括高并發(fā)低延遲的增刪改查、點查、明細查 詢、聚合查詢、窗口查詢、關(guān)聯(lián)查詢、多維查詢、復雜 OLAP 查詢等;支持庫內(nèi)機器學習(In-database machine learning)和 AI,可實現(xiàn)庫內(nèi)高性能模型訓練和推理計算等。

YMatrix 在多項性能測試中均展現(xiàn)出強大的性能表現(xiàn):基于 TPC- B 基準的并發(fā)查詢 TPS 最高可達 163 萬, 時序數(shù)據(jù)寫入性能可達 1.5 億點/秒。同時,YMatrix 是目前唯一通 過中國信通院 “分布式分析型數(shù)據(jù)庫”及“時序數(shù)據(jù)庫”雙認證的數(shù)據(jù)庫產(chǎn)品。

發(fā)布僅兩年,YMatrix 超融合數(shù)據(jù)庫已經(jīng)贏得包括寧德時代、三一重工、比亞迪、理想汽 車、小米等多家行業(yè)領軍企業(yè)的信賴,成功實現(xiàn)商業(yè)化落地,被應用于工廠數(shù)據(jù)基座、大 型公司集團數(shù)倉、智能網(wǎng)聯(lián)汽車、物聯(lián)設備智能運營等真實生產(chǎn)場景中。

YMatrix 以極高的性能、穩(wěn)定性、數(shù)據(jù)安全性,以及融合極簡的技術(shù)架構(gòu),助力用戶輕松 應對數(shù)據(jù)管理挑戰(zhàn),大幅降低選型、采購、使用及運維時的技術(shù)門檻,使開發(fā)更省力、迭代更省時、運維更省心。

分享到

zhupb

相關(guān)推薦