IBM大數(shù)據(jù)平臺框架和應(yīng)用程序解決方案,從中可以看出基于Hadoop技術(shù)而發(fā)展起來的BigInsights已是IBM大數(shù)據(jù)平臺當(dāng)中分析靜態(tài)數(shù)據(jù)的核心和基礎(chǔ)。
端到端:IBM大數(shù)據(jù)方案解析
從IBM的大數(shù)據(jù)平臺框架和應(yīng)用程序解決方案可以看出,其中大數(shù)據(jù)平臺包括4大部分:信息整合與治理組件、大數(shù)據(jù)的核心處理平臺(包括基于開源Apache Hadoop的框架而實(shí)現(xiàn)的BigInsights平臺、流計(jì)算平臺、數(shù)據(jù)倉庫、語境搜索等四部分)、加速器,以及包含可視化與發(fā)現(xiàn)、應(yīng)用程序開發(fā)、系統(tǒng)管理的上層應(yīng)用。
IBM軟件集團(tuán)大中華區(qū)信息管理軟件總經(jīng)理盧偉權(quán)先生表示,除了傳統(tǒng)上提到的大數(shù)據(jù)量(Volume)、多樣性(Variety)、速度(Velocity)之外,數(shù)據(jù)的真實(shí)性(Veracity)在未來的大數(shù)據(jù)應(yīng)用中會越來越重要。“社交數(shù)據(jù)、企業(yè)內(nèi)容、交易與應(yīng)用數(shù)據(jù)等,超越傳統(tǒng)的數(shù)據(jù)源,這些都需要有效的信息治理來確保其真實(shí)性及安全性。”他說,“IBM除了可以對傳統(tǒng)的數(shù)據(jù)倉庫和數(shù)據(jù)信息進(jìn)行管控和審計(jì),也可以對來自不同信息源的大數(shù)據(jù)信息進(jìn)行真實(shí)性審核并實(shí)現(xiàn)有效管控,這也是IBM在業(yè)界特別強(qiáng)于其他廠商重要的維度。”
據(jù)悉,實(shí)現(xiàn)信息整合和治理的組件是Guardium,其數(shù)據(jù)治理部分有三大特色:首先,其主數(shù)據(jù)管理能夠?qū)碜圆煌瑪?shù)據(jù)來源的重復(fù)數(shù)據(jù)集中在一起管理;其次,每一個(gè)產(chǎn)品里面都有安全性管理;第三,通過一個(gè)整合的平臺進(jìn)行管理。目前,Guardium能夠管理包括DB2、Netezza、Oracle、Sybase、Informix、SQLServer、SharePoint、Teradata、MySQL等在內(nèi)的軟件數(shù)據(jù)。
在此之上是IBM的BigInsights平臺,此方案基于開源Apache Hadoop的框架實(shí)現(xiàn),并增加了包括管理能力、工作流、安全管理等能力,并融入了IBM研究實(shí)驗(yàn)室的獨(dú)特和領(lǐng)先的數(shù)據(jù)分析、機(jī)器學(xué)習(xí)技術(shù)以及文本數(shù)據(jù)分析挖掘。IBM表示,所有這些增強(qiáng)都是為了更好的使得該方案能適用于復(fù)雜的,海量數(shù)據(jù)的分析。“Hadoop平臺上并沒有相應(yīng)的管理工具,也沒有將不同的數(shù)據(jù)進(jìn)行匯總的功能。”盧偉權(quán)說,“IBM借用過去幾十年在數(shù)據(jù)庫領(lǐng)域的經(jīng)驗(yàn),將數(shù)據(jù)庫的管理辦法也移植到大數(shù)據(jù)管理平臺上,讓Hadoop平臺的可用性、可管理性、安全性都提高了很多。”根據(jù)不完全統(tǒng)計(jì),IBM在Hadoop平臺上至少新增了100個(gè)功能。
不僅如此,BigInsights不僅支持目前最流行的x86平臺,也能支持性能強(qiáng)勁的Power平臺。“借助為Power平臺優(yōu)化的Linux系統(tǒng),BigInsights能夠在Power System上良好地運(yùn)行。”盧偉權(quán)說,“這就使大數(shù)據(jù)方案在分布式處理能力的同時(shí),還能充分享受到Power系統(tǒng)的高性能。”IBM大中華區(qū)軟件事業(yè)部銀行業(yè)解決方案高級顧問陳劍補(bǔ)充說,“IBM的BigInsights方案是非常開放,不僅能夠支持標(biāo)準(zhǔn)Hadoop,也能支持一些主流Hadoop發(fā)行版,例如Cloudera Hadoop。這就意味著客戶可以從第三方平滑地移動到IBM企業(yè)級Hadoop平臺上。”作為對比,Oracle的大數(shù)據(jù)方案,明確要求應(yīng)用Oracle公司優(yōu)化過的Hadoop版本。
不過,“BigInsights并不是對數(shù)據(jù)倉庫的替換方案,它是對傳統(tǒng)數(shù)據(jù)倉庫的一種補(bǔ)充和延伸,整體構(gòu)成一個(gè)更廣義的Internet級別的海量數(shù)據(jù)倉庫。”陳劍先生說。
3A5步:技術(shù)之外的IBM大數(shù)據(jù)能力
除了IBM的技術(shù)平臺之外,IBM軟件集團(tuán)大中華區(qū)業(yè)務(wù)分析洞察及智慧地球解決方案總經(jīng)理卜曉軍先生表示,IBM的大數(shù)據(jù)能力更體現(xiàn)在IBM能夠利用其過去在企業(yè)的信息架構(gòu)當(dāng)中所積累的能力,幫助企業(yè)去打造一個(gè)端到端的“3A5步”的完整能力,幫助客戶解決從海量數(shù)據(jù)當(dāng)中發(fā)掘其背后的商業(yè)價(jià)值。
“以證券行業(yè)為例,他們在應(yīng)用大數(shù)據(jù)的切入點(diǎn),就是如何在每秒鐘上百萬筆的交易中間進(jìn)行及時(shí)分析,從而發(fā)現(xiàn)交易異常,幫助決策。”卜曉軍說,“大數(shù)據(jù)能夠給客戶帶來的商業(yè)價(jià)值是什么,在電信行業(yè)、移動互聯(lián)網(wǎng)的行為分析非常清楚,IBM能夠幫助他們實(shí)現(xiàn),并通過3A5步的方式不斷優(yōu)化,持續(xù)獲益。而對于一些新興行業(yè),IBM也有責(zé)任幫助客戶在大數(shù)據(jù)環(huán)境下,找到轉(zhuǎn)型切入點(diǎn),從而獲得商業(yè)價(jià)值。”
IBM智慧洞察幫助客戶從大數(shù)據(jù)當(dāng)中獲取商業(yè)價(jià)值
IBM軟件集團(tuán)制造事業(yè)群總經(jīng)理蕭丁瑞先生表示,在制造行業(yè),由于形態(tài)差異比較大,對大數(shù)據(jù)應(yīng)用切入點(diǎn)就有不同的需求。“對大數(shù)據(jù)的應(yīng)用切入點(diǎn),在制造業(yè)可以根據(jù)業(yè)務(wù)形態(tài)和生產(chǎn)形態(tài)這兩個(gè)維度進(jìn)行劃分。制造業(yè)中的業(yè)務(wù)部門和客戶服務(wù)部門,甚至于針對消費(fèi)電子和消費(fèi)市場的產(chǎn)品設(shè)計(jì)部門,因?yàn)橛凶銐虼蟮臄?shù)據(jù)量,他們需要分析客戶需求,進(jìn)行精準(zhǔn)營銷、服務(wù)和設(shè)計(jì)。”他在接受比特網(wǎng)記者的采訪時(shí)說,“而從生產(chǎn)面來看,連續(xù)性生產(chǎn)對大數(shù)據(jù)應(yīng)用方案的需求就遠(yuǎn)遠(yuǎn)組裝業(yè)。其中,IBM的半導(dǎo)體工廠就是最好的示范,已應(yīng)用了IBM整套大數(shù)據(jù)解決方案,借此提高半導(dǎo)體機(jī)臺的生產(chǎn)良率,降低維護(hù)時(shí)間。”
小結(jié)
在大部分廠商還滿足于提供局限在基礎(chǔ)架構(gòu)層面的Hadoop大數(shù)據(jù)解決方案的情況下,IBM已經(jīng)拿出了一套從大數(shù)據(jù)當(dāng)中挖掘出商業(yè)價(jià)值的整體框架和可用的商業(yè)化平臺,并在在金融、電信、制造、零售等多個(gè)行業(yè)當(dāng)中已有成功的案例實(shí)施。可以說,在客戶急需大數(shù)據(jù)整體解決方案的情況下,IBM為客戶提供了一個(gè)可見的實(shí)現(xiàn)藍(lán)圖。