HPC China2013：高能物理大數(shù)據(jù)存儲(chǔ)、處理及挖掘

袁紹龍發(fā)表于：13年10月31日 00:54 [原創(chuàng)] DOIT.com.cn

分享：

[導(dǎo)讀]來(lái)自中國(guó)科學(xué)院高能物理研究所的研究員孫功星帶來(lái)了主題為《從大數(shù)據(jù)到新發(fā)現(xiàn)--高能物理大數(shù)據(jù)存儲(chǔ)、處理及挖掘》的主題報(bào)告。

2013年10月31日，桂林。HPC China 2013大會(huì)進(jìn)入到第三天。在第三天的會(huì)議中，來(lái)自中國(guó)科學(xué)院高能物理研究所的研究員孫功星帶來(lái)了主題為《從大數(shù)據(jù)到新發(fā)現(xiàn)--高能物理大數(shù)據(jù)存儲(chǔ)、處理及挖掘》的主題報(bào)告。孫功星研究員認(rèn)為在發(fā)現(xiàn)希格斯粒子這個(gè)過(guò)程中計(jì)算機(jī)的作用非常重要，計(jì)算機(jī)在未來(lái)的高能物理學(xué)中將繼續(xù)發(fā)揮重要作用。另外，通過(guò)把Hadoop架構(gòu)引入到高性能物理計(jì)算領(lǐng)域，將有助于大幅提升處理與分析的性能。

圖一：中國(guó)科學(xué)院高能物理研究所的研究員孫功星發(fā)表演講

圖二：高能物理需要大量的計(jì)算資源，并且會(huì)產(chǎn)生大量的數(shù)據(jù)。

孫功星表示，在高能物理領(lǐng)域的大數(shù)據(jù)處理過(guò)程主要包括三個(gè)方面：首先是Data Recording，Raw Event從探測(cè)器獲取，以二進(jìn)制格式記錄的探測(cè)器信號(hào)，再由計(jì)算機(jī)產(chǎn)生模擬實(shí)驗(yàn)的蒙特卡羅模擬數(shù)據(jù)，將物理信號(hào)數(shù)字化；然后是Data Processing，讀出Raw/MC Raw，處理產(chǎn)生相關(guān)物理信息，如動(dòng)量、對(duì)撞頂點(diǎn)等；最后就是Data Mining，由上千個(gè)屬性組成的DST Event文件，提供物理學(xué)家進(jìn)行分析，并最后產(chǎn)生物理結(jié)果。

圖三：高能物理的數(shù)據(jù)處理過(guò)程。

圖四：物理分析。

孫功星研究員表示，物理學(xué)家通過(guò)大數(shù)據(jù)處理三個(gè)過(guò)程，在里面找到有興趣的數(shù)據(jù)�，F(xiàn)在我們開始嘗試采用Hadoop本地系統(tǒng)，采用Hadoop方案之后，對(duì)于網(wǎng)絡(luò)、磁盤陣列的需求減少很多。當(dāng)然在高能物理領(lǐng)域的Hadoop應(yīng)用跟互聯(lián)網(wǎng)有所不同，因此我們也有針對(duì)性，特別是在IO方面做了一些工作，以適用Hadoop架構(gòu)。通過(guò)Lustre和Hadoop架構(gòu)的對(duì)比，我們進(jìn)行分析測(cè)試后發(fā)現(xiàn)，在處理性能和文件重建等方面都有著大幅的性能提升。過(guò)去傳統(tǒng)的方式就是拿數(shù)據(jù)過(guò)來(lái)分析，扔掉不重要的數(shù)據(jù)，然后再拿數(shù)據(jù)進(jìn)行分析，再扔掉不重要的數(shù)據(jù)，過(guò)程比較繁瑣。通過(guò)Hadoop架構(gòu)，我們將TAG數(shù)據(jù)放入到Hbase中，TAG數(shù)據(jù)則是非常小的，利用Hadoop的確是能大幅提升性能。

圖五：在MapReduce下面運(yùn)行C++

圖六：測(cè)試對(duì)比結(jié)果。

圖七：將TAG數(shù)據(jù)放入Hbase。

圖八：測(cè)試性能結(jié)果。

最后，孫功星研究員認(rèn)為高能物理領(lǐng)域是大數(shù)據(jù)、數(shù)據(jù)挖掘的技術(shù)，具有完善的數(shù)據(jù)挖掘軟件。未來(lái)LHC升級(jí)將會(huì)產(chǎn)生幾倍于現(xiàn)在的數(shù)據(jù)，給高能物理計(jì)算帶來(lái)更多挑戰(zhàn)，因此現(xiàn)在的趨勢(shì)就是探索新型的計(jì)算機(jī)體系結(jié)構(gòu)、高性能計(jì)算機(jī)結(jié)合的方案。

[責(zé)任編輯：袁紹龍]

HPC China2013：高性能數(shù)據(jù)系統(tǒng)回顧和展望

2013年10月30日，桂林。HPC China2013大會(huì)進(jìn)入到第二天。在第二天的會(huì)議中，來(lái)自華東師范大學(xué)云計(jì)算與大數(shù)據(jù)研究中心主任、海量計(jì)算研究所所長(zhǎng)周傲英教授做了主題為《高性能數(shù)據(jù)管理系統(tǒng)：回顧和展望》的主題演講。

官方微信

相關(guān)閱讀

精彩專題更多

2014企業(yè)級(jí)IT風(fēng)云榜

存儲(chǔ)風(fēng)云榜”是由DOIT傳媒主辦的年度大型活動(dòng)。回顧2014年，存儲(chǔ)作為IT系統(tǒng)架構(gòu)中最基礎(chǔ)的元素，已經(jīng)成為了推動(dòng)信息產(chǎn)業(yè)發(fā)展的核心動(dòng)力，存儲(chǔ)產(chǎn)業(yè)的發(fā)展邁向成熟，數(shù)據(jù)經(jīng)濟(jì)的概念順勢(shì)而為的提出。

華為OceanStor V3開啟全融合數(shù)據(jù)架構(gòu)時(shí)代

華為OceanStor V3系列存儲(chǔ)系統(tǒng)是面向企業(yè)級(jí)應(yīng)用的新一代統(tǒng)一存儲(chǔ)產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達(dá)到業(yè)界領(lǐng)先水平，很好的滿足了大型數(shù)據(jù)庫(kù)OLTP/OLAP、文件共享、云計(jì)算等各種應(yīng)用下的數(shù)據(jù)存儲(chǔ)需求。

聯(lián)想亮相高交會(huì)

聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會(huì)

国产精品一区二区av交换,中文字幕人成无码免费视频,永久免费av无码网站性色av,欧美一道本一区二区三区,樱桃熟了a级毛片

HPC China2013：高能物理大數(shù)據(jù)存儲(chǔ)、處理及挖掘

HPC China2013：高能物理大數(shù)據(jù)存儲(chǔ)、處理及挖掘