CDP (Cloudera Data Platform) 是一個(gè)面向IT、業(yè)務(wù)大數(shù)據(jù)平臺(tái),可支持公有云平臺(tái),也可構(gòu)建私有云平臺(tái),付諸元數(shù)據(jù)管理、安全、加密等治理手段,可以實(shí)現(xiàn)混合云數(shù)據(jù)應(yīng)用,這也是為什么Cloudera自稱混合云服務(wù)提供商的原因。

需要稍加說(shuō)明的是,這里的混合云不是針對(duì)IaaS,而是針對(duì)上層的數(shù)據(jù)創(chuàng)新應(yīng)用,不要混為一談。

對(duì)比數(shù)據(jù)中臺(tái)和智能湖倉(cāng)

就像武林有宗派分別一樣,目前數(shù)據(jù)市場(chǎng)市場(chǎng)可以大致分為數(shù)據(jù)中臺(tái)、大數(shù)據(jù)、智能湖倉(cāng)等生態(tài),每個(gè)生態(tài)都有自己的開(kāi)發(fā)者擁躉粉絲。

與其他技術(shù)方案相比,大數(shù)據(jù)平臺(tái)有什么優(yōu)勢(shì)嗎?

劉隸放表示會(huì):所謂數(shù)據(jù)中臺(tái),其實(shí)就是一種數(shù)據(jù)治理,考慮到業(yè)務(wù)中臺(tái),數(shù)據(jù)中臺(tái)可以做的事情,可能更高一些,業(yè)務(wù)中臺(tái)對(duì)應(yīng)數(shù)據(jù)中臺(tái),數(shù)據(jù)中臺(tái)服務(wù)于業(yè)務(wù)中臺(tái),大致是這樣的一種思想。

目前“數(shù)據(jù)治理”經(jīng)常是要一把手工程,從零開(kāi)始,強(qiáng)調(diào)業(yè)務(wù)、數(shù)據(jù)要解耦,這是數(shù)據(jù)中臺(tái)的初衷!如今,CDP平臺(tái)上提供有源數(shù)據(jù)治理工具,有SDX組件能夠幫助數(shù)據(jù)治理,這是很好契合點(diǎn)。

對(duì)于智能湖倉(cāng),劉隸放表示:智能湖倉(cāng)主要由數(shù)據(jù)湖、數(shù)據(jù)倉(cāng)庫(kù)兩部分組成,其中,數(shù)據(jù)倉(cāng)庫(kù)是把原來(lái)平臺(tái)的數(shù)據(jù)拿出來(lái),經(jīng)過(guò)加工成為數(shù)據(jù)倉(cāng)庫(kù)用的數(shù)據(jù)模型,數(shù)據(jù)會(huì)有一些轉(zhuǎn)換;相比,數(shù)據(jù)湖是把數(shù)據(jù)從外面“撈”進(jìn)來(lái),呈現(xiàn)一種原生態(tài)形式的存在,如果能夠提供比較好的算力,就可以輸出數(shù)據(jù)分析的結(jié)果,雖然沒(méi)有像數(shù)據(jù)倉(cāng)庫(kù)這樣,可以基于精簡(jiǎn)模型輸出結(jié)果,但也可以忍受的時(shí)間內(nèi)。

從現(xiàn)有市場(chǎng)應(yīng)用的規(guī)???,如果數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器的用量是數(shù)百臺(tái),那么大數(shù)據(jù)分析平臺(tái)集群規(guī)模會(huì)達(dá)到數(shù)千臺(tái),這意味著90%數(shù)據(jù)其實(shí)是在大數(shù)據(jù)平臺(tái),幾乎是企業(yè)全量數(shù)據(jù),因此規(guī)模上的區(qū)分,會(huì)決定未來(lái)不同技術(shù)未來(lái)的走向。

小結(jié)

各種技術(shù)之間并不是涇渭分明的存在,而是一種你中有我,我中有你的現(xiàn)狀。從產(chǎn)品形態(tài)看,有開(kāi)源產(chǎn)品形式,也有云服務(wù)的形式,并且產(chǎn)品和云服務(wù)也存在轉(zhuǎn)換,Cloudera可以服務(wù)混合云,公有云也可以進(jìn)行私有化部署,但是無(wú)論如何,他們都服務(wù)于同一個(gè)目標(biāo),數(shù)據(jù)創(chuàng)新。

不管黑貓白貓,抓住耗子就是好貓!

分享到

songjy

相關(guān)推薦