“軟+硬”全力深耕大數(shù)據(jù)市場(chǎng)
英特爾在大數(shù)據(jù)論壇上展示了醫(yī)療、電信、金融等行業(yè)的大數(shù)據(jù)解決方案及案例,而支撐起這些解決方案,并幫助它們成功通過(guò)實(shí)戰(zhàn)考驗(yàn)的主要力量,則是來(lái)自英特爾應(yīng)大數(shù)據(jù)核心應(yīng)用需求而開(kāi)發(fā)的創(chuàng)新產(chǎn)品和技術(shù),其中主要包括:可為大數(shù)據(jù)的采集和邊緣處理提供支持英特爾凌動(dòng)處理器及英特爾至強(qiáng)E3處理器平臺(tái);能實(shí)現(xiàn)高效橫向擴(kuò)展以承載大數(shù)據(jù)分布式存儲(chǔ)、管理、處理和查詢(xún)重任的英特爾至強(qiáng)E5處理器平臺(tái)和針對(duì)它進(jìn)行了優(yōu)化、以具體實(shí)現(xiàn)這些應(yīng)用功能的英特爾Hadoop發(fā)行版軟件(Intel Distribution for Apache Hadoop);主要為大數(shù)據(jù)分析和商業(yè)智能提供支持,擁有高性能,支持高帶寬、高容量?jī)?nèi)存子系統(tǒng),并具備可媲美小型機(jī)的可靠性、可用性和可維護(hù)性(RAS)特性的英特爾至強(qiáng)E7處理器平臺(tái)。圍繞這些核心處理器平臺(tái)所構(gòu)建的服務(wù)器設(shè)備,英特爾還提供了萬(wàn)兆以太網(wǎng)和固態(tài)硬盤(pán)等創(chuàng)新,來(lái)突破大數(shù)據(jù)應(yīng)用在數(shù)據(jù)傳輸和存儲(chǔ)方面的性能瓶頸。
英特爾Hadoop發(fā)行版軟件雖然是新近加入英特爾陣營(yíng)的產(chǎn)品,屬于“軟”實(shí)力,但實(shí)際上它在英特爾內(nèi)部已經(jīng)孕育有些年頭了。這期間一些用戶(hù)的需求,比如電信行業(yè)3G智能手機(jī)的用戶(hù)想查流量清單,智慧城市中的車(chē)載數(shù)據(jù)、視頻數(shù)據(jù)、監(jiān)控?cái)?shù)據(jù)的管理和分析。這些用戶(hù)實(shí)實(shí)在在的需求驅(qū)動(dòng)英特爾把Hadoop變成一個(gè)真正的產(chǎn)品。
“2009年開(kāi)始我們已經(jīng)開(kāi)始做Hadoop,當(dāng)時(shí)是作為一個(gè)創(chuàng)新主題,看看Hadoop的架構(gòu)、應(yīng)用場(chǎng)景是什么。由于當(dāng)時(shí)中國(guó)有具體的需求,大數(shù)據(jù)環(huán)境非常好,并且有電信行業(yè)典型的用戶(hù)需求。這都推動(dòng)我們馬上把Hadoop變成了一個(gè)產(chǎn)品來(lái)滿(mǎn)足客戶(hù)的需求。”苗凱翔博士回憶說(shuō)。
英特爾中國(guó)行業(yè)合作解決方案服務(wù)部企業(yè)技術(shù)銷(xiāo)售與數(shù)據(jù)中心咨詢(xún)資深經(jīng)理張哲源表示,正是有了Hadoop的加入,英特爾才能實(shí)現(xiàn)“軟硬”的有機(jī)組合,構(gòu)成了英特爾針對(duì)大數(shù)據(jù)應(yīng)用提供的端到端支持,推動(dòng)更多的合作伙伴在其上開(kāi)發(fā)適合行業(yè)需求的大數(shù)據(jù)解決方案。
端到端支持用友醫(yī)療數(shù)據(jù)大挖掘
作為英特爾醫(yī)療行業(yè)大數(shù)據(jù)的重要合作伙伴,用友展示了其基于英特爾平臺(tái)的大數(shù)據(jù)解決方案。用友醫(yī)療衛(wèi)生信息系統(tǒng)有限公司副總裁、用友智慧健康研究院首席專(zhuān)家徐春華介紹, 醫(yī)療行業(yè)和大數(shù)據(jù)相關(guān)的主要有三大領(lǐng)域,也即電子健康檔案、城市級(jí)的電子病歷數(shù)據(jù)中心和衛(wèi)生醫(yī)療相關(guān)的統(tǒng)計(jì)數(shù)據(jù)。這三個(gè)領(lǐng)域的數(shù)據(jù)有著共性的特征:海量數(shù)據(jù)、結(jié)構(gòu)化半結(jié)構(gòu)化并存、版本隨著時(shí)間而改變。有鑒于此,用友將大數(shù)據(jù)技術(shù)主要用于三大數(shù)據(jù)庫(kù)的建設(shè)上。
“這些領(lǐng)域必須采用大數(shù)據(jù)處理手段來(lái)處理,關(guān)鍵要素涉及到兩個(gè):一是通過(guò)引入并行計(jì)算框架提高整個(gè)解決方案的運(yùn)行性能,到了PB級(jí)數(shù)據(jù)以后,運(yùn)行時(shí)間成為了關(guān)鍵參數(shù);二是基于列的數(shù)據(jù)庫(kù)架構(gòu),它和傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)有很大的差異。”徐春華說(shuō)。
在過(guò)去一年中,用友醫(yī)療和英特爾上海Hadoop團(tuán)隊(duì)開(kāi)展了深入的合作,采用基于英特爾x86服務(wù)器集群+Hadoop綜合解決方案來(lái)嘗試處理大型電子健康檔案和區(qū)域性的醫(yī)療質(zhì)量分析。目前從運(yùn)轉(zhuǎn)情況來(lái)看效果非常理想。
在醫(yī)療行業(yè),用友采用的計(jì)算架構(gòu)有三類(lèi):x86服務(wù)器、小型機(jī)、大型主機(jī)。談到大數(shù)據(jù)領(lǐng)域用友為什么會(huì)選擇x86集群?徐春華表示,傳統(tǒng)做計(jì)算架構(gòu)或者存儲(chǔ)架構(gòu)的時(shí)候,經(jīng)常要考慮3年到5年的存儲(chǔ)量。但這樣往往存在著大量的浪費(fèi),因?yàn)閯傞_(kāi)始往往用不到那么大的量。而英特爾提倡的橫向擴(kuò)展模式,可以根據(jù)業(yè)務(wù)的規(guī)模而隨時(shí)增加計(jì)算和存儲(chǔ)能力,這是用友和用友的客戶(hù)非常樂(lè)于接受的一種模式。