端到端支持用友醫(yī)療數(shù)據(jù)大挖掘
許振新 發(fā)表于:13年05月20日 00:00 [原創(chuàng)] DOIT.com.cn
“2009年開始我們已經(jīng)開始做Hadoop,當(dāng)時是作為一個創(chuàng)新主題,看看Hadoop的架構(gòu)、應(yīng)用場景是什么。由于當(dāng)時中國有具體的需求,大數(shù)據(jù)環(huán)境非常好,并且有電信行業(yè)典型的用戶需求。這都推動我們馬上把Hadoop變成了一個產(chǎn)品來滿足客戶的需求。”苗凱翔博士回憶說。
英特爾中國行業(yè)合作解決方案服務(wù)部企業(yè)技術(shù)銷售與數(shù)據(jù)中心咨詢資深經(jīng)理張哲源表示,正是有了Hadoop的加入,英特爾才能實(shí)現(xiàn)“軟硬”的有機(jī)組合,構(gòu)成了英特爾針對大數(shù)據(jù)應(yīng)用提供的端到端支持,推動更多的合作伙伴在其上開發(fā)適合行業(yè)需求的大數(shù)據(jù)解決方案。
端到端支持用友醫(yī)療數(shù)據(jù)大挖掘
作為英特爾醫(yī)療行業(yè)大數(shù)據(jù)的重要合作伙伴,用友展示了其基于英特爾平臺的大數(shù)據(jù)解決方案。用友醫(yī)療衛(wèi)生信息系統(tǒng)有限公司副總裁、用友智慧健康研究院首席專家徐春華介紹, 醫(yī)療行業(yè)和大數(shù)據(jù)相關(guān)的主要有三大領(lǐng)域,也即電子健康檔案、城市級的電子病歷數(shù)據(jù)中心和衛(wèi)生醫(yī)療相關(guān)的統(tǒng)計(jì)數(shù)據(jù)。這三個領(lǐng)域的數(shù)據(jù)有著共性的特征:海量數(shù)據(jù)、結(jié)構(gòu)化半結(jié)構(gòu)化并存、版本隨著時間而改變。有鑒于此,用友將大數(shù)據(jù)技術(shù)主要用于三大數(shù)據(jù)庫的建設(shè)上。
“這些領(lǐng)域必須采用大數(shù)據(jù)處理手段來處理,關(guān)鍵要素涉及到兩個:一是通過引入并行計(jì)算框架提高整個解決方案的運(yùn)行性能,到了PB級數(shù)據(jù)以后,運(yùn)行時間成為了關(guān)鍵參數(shù);二是基于列的數(shù)據(jù)庫架構(gòu),它和傳統(tǒng)的關(guān)系型數(shù)據(jù)庫有很大的差異。”徐春華說。
在過去一年中,用友醫(yī)療和英特爾上海Hadoop團(tuán)隊(duì)開展了深入的合作,采用基于英特爾x86服務(wù)器集群+Hadoop綜合解決方案來嘗試處理大型電子健康檔案和區(qū)域性的醫(yī)療質(zhì)量分析。目前從運(yùn)轉(zhuǎn)情況來看效果非常理想。
在醫(yī)療行業(yè),用友采用的計(jì)算架構(gòu)有三類:x86服務(wù)器、小型機(jī)、大型主機(jī)。談到大數(shù)據(jù)領(lǐng)域用友為什么會選擇x86集群?徐春華表示,傳統(tǒng)做計(jì)算架構(gòu)或者存儲架構(gòu)的時候,經(jīng)常要考慮3年到5年的存儲量。但這樣往往存在著大量的浪費(fèi),因?yàn)閯傞_始往往用不到那么大的量。而英特爾提倡的橫向擴(kuò)展模式,可以根據(jù)業(yè)務(wù)的規(guī)模而隨時增加計(jì)算和存儲能力,這是用友和用友的客戶非常樂于接受的一種模式。
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.