提升高性能計(jì)算的性能與效率:不要再看CPU
[導(dǎo)讀]無(wú)論是賴能和還是張鐵鋼,他們已經(jīng)意識(shí)到,單純依靠CPU提高工作負(fù)載能力、加速石油行業(yè)高性能計(jì)算性能的時(shí)代已經(jīng)一去不復(fù)返
DOSERV服務(wù)器在線 8月8日原創(chuàng)報(bào)道: 誰(shuí)拯救了美國(guó)的能源危機(jī)?不是奧巴馬,也不是??松梨冢皇且恢眲?dòng)蕩不安的中東石油,而是頁(yè)巖氣,自2006年起,美國(guó)頁(yè)巖氣產(chǎn)量大幅增長(zhǎng),到2011年,美國(guó)頁(yè)巖氣產(chǎn)量高達(dá)1800億立方米,占美國(guó)天然氣產(chǎn)量的34%。
其間,在2009年,美國(guó)天然氣產(chǎn)量達(dá)到6240億立方米,首次超過(guò)俄羅斯成為世界第一天然氣生產(chǎn)國(guó),此后一直維持在這一位置。2012年美國(guó)天然氣產(chǎn)量6810億立方米,是世界天然氣增產(chǎn)最迅速的國(guó)家,比位居第二的俄羅斯天然氣產(chǎn)量多出900億立方米。
此后,頁(yè)巖氣革命對(duì)美國(guó)的能源結(jié)構(gòu)產(chǎn)生重大影響:美國(guó)每百萬(wàn)英熱(計(jì)量單位)天然氣均價(jià)為2.86美元,同期東亞同等熱值天然氣價(jià)格為16美元~18美元,歐洲12美元~14美元——雖然頁(yè)巖氣的價(jià)格下跌導(dǎo)致很多頁(yè)巖氣開(kāi)采氣田和石油公司無(wú)利可圖,但如此價(jià)廉、清潔、高效和儲(chǔ)藏量龐大的頁(yè)巖氣資源,讓美國(guó)擺脫了石油和天然氣價(jià)格高企的今天所面臨的能源危機(jī)。
而現(xiàn)在,美國(guó)已經(jīng)開(kāi)始考慮開(kāi)采頁(yè)巖油,與傳統(tǒng)油氣資源類似,頁(yè)巖層中的油氣資源也相伴而生,頁(yè)巖油屬于輕質(zhì)油,油質(zhì)好,但比之傳統(tǒng)直井油田直接從油層抽取原油,開(kāi)采頁(yè)巖油采用水平鉆井和水力壓裂技術(shù)從頁(yè)巖層中獲得,其開(kāi)采成本也更高一些,即便如此,在較高的國(guó)際油價(jià)面前,開(kāi)采頁(yè)巖油仍有利可圖。
但無(wú)論開(kāi)采頁(yè)巖氣還是頁(yè)巖油,工程建設(shè)與開(kāi)采技術(shù)都是其中的關(guān)鍵。以頁(yè)巖氣為例,頁(yè)巖氣,是指位于暗色泥巖或者高碳泥頁(yè)巖中,以吸附或者游離狀態(tài)為主要存在方式的天然氣聚集,地質(zhì)結(jié)構(gòu)復(fù)雜、蘊(yùn)藏機(jī)制莫測(cè)、開(kāi)采難度較高,事實(shí)上,自20世紀(jì)70年代就有企業(yè)開(kāi)始探索頁(yè)巖氣的開(kāi)采技術(shù),但直到90年代才有成熟的開(kāi)采、探測(cè)技術(shù),而頁(yè)巖氣可以通過(guò)成熟、穩(wěn)定的手段實(shí)現(xiàn)快速的發(fā)現(xiàn)、蘊(yùn)藏量預(yù)測(cè)和開(kāi)采,已經(jīng)距離頁(yè)巖氣開(kāi)采的提出者們的大膽想法,足足過(guò)了三十年。
“在勘探新的資源——頁(yè)巖氣——的過(guò)程中,要探測(cè)不同類型的巖層,但頁(yè)巖——泥頁(yè)巖和致密巖石——之間的區(qū)別并不大,這就對(duì)數(shù)據(jù)采集密度、精確度有著極高的要求,需要進(jìn)行很大量的數(shù)據(jù)分析,這些都需要工程技術(shù)、信息化技術(shù)的支撐。”中國(guó)石油大慶油田公司勘探開(kāi)發(fā)研究院總工程師張鐵鋼表示,在發(fā)現(xiàn)頁(yè)巖氣和未來(lái)頁(yè)巖油的工作中,工程技術(shù)、信息化技術(shù)——計(jì)算、分析、存儲(chǔ)——的需求量十分巨大,而也正是依靠——也必須依靠——這些技術(shù),才能夠?qū)崿F(xiàn)大慶讓老油田煥發(fā)青春的目標(biāo)。
張鐵鋼表示,大慶油田的宗旨,就是“圍繞資源優(yōu)化,結(jié)合能源應(yīng)用的特點(diǎn)高效利用工程和信息化技術(shù)”,讓大慶油田能夠不斷完成國(guó)家交予的能源支持任務(wù),實(shí)現(xiàn)讓大慶油田能夠持續(xù)實(shí)現(xiàn)產(chǎn)油、產(chǎn)氣的重要保障。
在英特爾2013年度企業(yè)高性能計(jì)算研討會(huì)上,來(lái)自全國(guó)能源行業(yè)的CIO代表們齊聚一堂,信息技術(shù)對(duì)國(guó)內(nèi)能源行業(yè)——尤其是石油行業(yè)——發(fā)展的重要推動(dòng)作用已經(jīng)被他們清晰地認(rèn)識(shí)到,他們來(lái)到冰城哈爾濱的目的,是希望能夠了解到信息技術(shù)的發(fā)展與走向,以及交流如何利用信息化技術(shù)更快一步達(dá)成“好找油,找好油”的目標(biāo),尋找更多的油氣資源。
而也正是在這次會(huì)議上,東方地球物理公司研究員處理中心總工程師賴能和老師提出:“不再需要關(guān)心處理器,而是要關(guān)心其它東西。”的驚人觀點(diǎn),為國(guó)內(nèi)能源行業(yè)、石油行業(yè)的信息化技術(shù)利用提出了新的發(fā)展思路。
賴能和:不要看CPU了
“不用太過(guò)看重CPU,現(xiàn)在的CPU已經(jīng)非??炝?。”賴能和談到,從2007年的宜賓到2013年的哈爾濱,七屆高性能計(jì)算會(huì)議一路走來(lái),他看到了x86架構(gòu)處理器在過(guò)去七年不斷的加速、加速、再加速,處理器的性能不斷提升,而且“是完全不需要關(guān)心它(CPU)的性能提升速度和步伐”,在這樣的背景下,石油行業(yè)的高性能計(jì)算卻仍然遇到了挑戰(zhàn)。
賴能和談到,伴隨油氣勘探采集與處理新機(jī)遇的,是高密度海量數(shù)據(jù)處理正面臨新的挑戰(zhàn):1、可控震源高效采集技術(shù)快速發(fā)展并廣泛應(yīng)用;2、高密度、高覆蓋采集與處理技術(shù)提高勘探深度;3、高密度財(cái)季成為新的趨勢(shì),數(shù)據(jù)體越來(lái)越大。
“高頻率、寬頻帶單點(diǎn)、單源的高效采集技術(shù),使得每天產(chǎn)生的數(shù)據(jù)量大增,總數(shù)據(jù)量相關(guān)前約270TB,相關(guān)后90TB,一天就是7.5TB的數(shù)據(jù)(相關(guān)前),現(xiàn)在一炮(探測(cè)炸點(diǎn))的數(shù)據(jù)相關(guān)后就是490MB,但是往往一天就要放5000炮。”賴能和認(rèn)為,石油能源行業(yè)的地質(zhì)、地震勘探正在朝著三維化、立體化、高密度、高覆蓋度發(fā)展,這有效提高了對(duì)地層探測(cè)的精確程度和成像效果,但問(wèn)題是:數(shù)據(jù)量越來(lái)越龐大,而高性能計(jì)算集群的計(jì)算性能卻永遠(yuǎn)滿足不了需求。
“CPU計(jì)算資源需求和海量數(shù)據(jù)存儲(chǔ)需求都在急劇增長(zhǎng),對(duì)傳統(tǒng)HPC技術(shù)提出了挑戰(zhàn)。”賴能和表示,無(wú)論是從總套數(shù)、每套核數(shù)、還是每套的計(jì)算性能上來(lái)看,油氣行業(yè)的高性能計(jì)算系統(tǒng)的水平都在提高,這說(shuō)明高精度的地震成像、地質(zhì)勘探算法需要海量的處理器資源,但既然已經(jīng)買(mǎi)了很多的處理器,且處理器的性能提升越來(lái)越快,甚至“僅從計(jì)算量上來(lái)看已經(jīng)問(wèn)題不大”,但為什么卻仍然難以滿足需求,無(wú)法得到更精確的處理結(jié)果呢?
賴能和答案是“效率”:“我們以前處理器的效率非常低,最高才百分之十幾,最低的時(shí)候只有2%,后來(lái)優(yōu)化之后,效率最高能夠接近40%,但是低的時(shí)候也只有15%,關(guān)鍵是要提高計(jì)算集群的效率。”賴能和提出,針對(duì)海量數(shù)據(jù)的高性能計(jì)算解決方案,要從五個(gè)角度來(lái)解決問(wèn)題:
1、 高性能:采用最先進(jìn)的CPU、PCIe架構(gòu)
2、 高配置:采用大內(nèi)存、大內(nèi)置盤(pán)
3、 高帶寬:采用全線速、無(wú)阻塞的高速網(wǎng)
4、 高效率:采用高可擴(kuò)展的并行存儲(chǔ)系統(tǒng)
5、 高吞吐:針對(duì)不同應(yīng)用,選擇存儲(chǔ)軟硬件架構(gòu)
“你像我們的第一套系統(tǒng),投入了2000多萬(wàn),全部使用高性能并行存儲(chǔ)系統(tǒng)、10GbE萬(wàn)兆以太網(wǎng),而且都裝了5塊15k轉(zhuǎn)的6G SAS硬盤(pán),使用雙路英特爾E5-2670服務(wù)器,經(jīng)過(guò)調(diào)優(yōu)后,并發(fā)運(yùn)行后的效率從之前的最低3.65%現(xiàn)在提高到了44.37%。”賴能和說(shuō),這一數(shù)據(jù)實(shí)際上還有提升的空間,“通過(guò)優(yōu)化配置,處理器的利用率能夠大幅度提升,我的觀點(diǎn)是,先不用著急買(mǎi)處理器,先把自己現(xiàn)在的處理器用好了再說(shuō)。況且用好了現(xiàn)在的東西,才好說(shuō)再去買(mǎi),到時(shí)候就可以說(shuō)‘你看,我們已經(jīng)用的很好了’。”
賴能和還展示了一套大約2、3年前采購(gòu)得高密度海量處理系統(tǒng)(基于至強(qiáng)X5660雙路服務(wù)器)的優(yōu)化結(jié)果:通過(guò)擴(kuò)展24GB內(nèi)存到96GB,增加計(jì)算節(jié)點(diǎn)內(nèi)置盤(pán)及更換512K Cache的RAID卡,全面升級(jí)萬(wàn)兆以太網(wǎng),新增14個(gè)計(jì)算和I/O節(jié)點(diǎn),并使用并行存儲(chǔ)系統(tǒng)取代原有的普通存儲(chǔ)——在作業(yè)數(shù)為10、50、100的測(cè)試中,此次改造分別提高了4倍、10倍和8倍。
“馬上我們計(jì)劃第三、四套高密度海量處理系統(tǒng),除了使用英特爾至強(qiáng)E5-2670雙路服務(wù)器之外,我們會(huì)加大內(nèi)存、內(nèi)置盤(pán)以及使用萬(wàn)兆以太網(wǎng),只有這樣才不會(huì)浪費(fèi)處理器極大的計(jì)算資源。”賴能和表示,使用高性能的處理器,必須要在網(wǎng)絡(luò)、內(nèi)置盤(pán)、帶寬等層面予以全面配合,再加上協(xié)處理器,才能夠達(dá)到想要的效果,處理器的效率才能夠發(fā)揮出來(lái),因此他對(duì)HPC新技術(shù)的應(yīng)用提出了基于石油行業(yè)的需求與展望。
1、 CPU+協(xié)處理器組成的協(xié)同計(jì)算平臺(tái):基于多核、眾核CPU技術(shù)、CPU+協(xié)處理器或CPU+GPU組成的HPC和多路服務(wù)器仍將成為主要的應(yīng)用平臺(tái)。
2、 高性能并行存儲(chǔ)軟硬件系統(tǒng)及固態(tài)硬盤(pán)SSD技術(shù):以大容量、高性能、低功耗、低熱量和低噪音的并行存儲(chǔ)和新型節(jié)能存儲(chǔ)介質(zhì)技術(shù)將高速發(fā)展。
3、 高速網(wǎng)絡(luò)技術(shù):萬(wàn)兆網(wǎng)絡(luò)技術(shù)將成為應(yīng)用主流。
4、 基于水冷等新型節(jié)能技術(shù),將成為關(guān)注的重點(diǎn)。
5、 云或移動(dòng)計(jì)算平臺(tái):基于計(jì)算、存儲(chǔ)、可視化資源池等基礎(chǔ)設(shè)施整合的新的商業(yè)模式,將向用戶提供服務(wù)。
張鐵鋼:老油田比新油田“有料”
“地質(zhì)學(xué)家有一個(gè)論斷:‘在一個(gè)大油田,已知油田中發(fā)現(xiàn)的儲(chǔ)量要比在新區(qū)發(fā)現(xiàn)的油田的儲(chǔ)量多60%’ ,甚至于說(shuō)基本上新的油氣資源都是在老油田之間更深的地方找到的。”中國(guó)石油大慶油田公司勘探開(kāi)發(fā)研究院總工程師張鐵鋼在接受DOIT記者采訪時(shí)表示,在中國(guó)的油氣行業(yè),每年都可以找到新的油田——正是在老油田或是老油田之間,他表示,無(wú)論是老油田煥發(fā)青春,還是繼續(xù)發(fā)掘新的油氣資源,對(duì)老油田的深耕必不可少。
因此,在我國(guó)傳統(tǒng)的油氣資源產(chǎn)區(qū)大慶油田,“利用多種綜合勘探手段判斷潛在資源”,是現(xiàn)在最重要的挖掘油氣資源的方式,據(jù)張鐵鋼介紹,最近幾年,大慶油田通過(guò)不斷挖掘老油田、老油田之間油氣產(chǎn)區(qū)的資源,不僅完成了國(guó)家要求的穩(wěn)產(chǎn)任務(wù),而且現(xiàn)在的油氣產(chǎn)量并不比20、30年前差,作為開(kāi)采已經(jīng)幾十年的老油田,“大慶穩(wěn)產(chǎn)4000萬(wàn)噸”的目標(biāo)仍然年年實(shí)現(xiàn)。
但實(shí)現(xiàn)穩(wěn)產(chǎn)、挖掘老油氣田資源,老油田比新油田“有料”不是簡(jiǎn)簡(jiǎn)單單就能夠完成的任務(wù),從油氣資源成像上來(lái)看,產(chǎn)油的致密砂巖和不含油的砂巖密度差不多,原來(lái)油氣資源豐富的時(shí)候,勘探開(kāi)采比較容易,技術(shù)探測(cè)相對(duì)比較簡(jiǎn)單,但“現(xiàn)在的判斷復(fù)雜度就高很多了,資源勘探的采集數(shù)據(jù)的密度較要加大,以前采集間隔小、數(shù)據(jù)量小,現(xiàn)在網(wǎng)格采集的密度則非常高,采集的點(diǎn)覆蓋密度小可能就遺漏了。”
張鐵鋼表示,如今大慶油氣勘探數(shù)據(jù)采集的密度越來(lái)越高,正如賴能和在會(huì)議演講上所說(shuō)的:“要高密度、高覆蓋的采集數(shù)據(jù),挖掘更多的油氣資源。”,但這樣做的成果也非常顯著,不僅是老油田大慶實(shí)現(xiàn)了年年穩(wěn)產(chǎn),我國(guó)位居老油田前列的克拉瑪依和勝利油田,“年年都能找到新的油田”,這其中,勝利油田就通過(guò)三維全覆蓋技術(shù)以及高密度三維技術(shù),不斷發(fā)現(xiàn)了新的油氣資源。
支撐三維全覆蓋技術(shù)、高密度三維技術(shù)的關(guān)鍵是先進(jìn)的工程建設(shè)與科學(xué)計(jì)算技術(shù),如張鐵鋼來(lái)說(shuō)“技術(shù)的進(jìn)步就會(huì)帶來(lái)資源的解放”。
“以往做地震、地質(zhì)測(cè)試研究,區(qū)塊都比較小,數(shù)據(jù)量很小,幾十GB很多,但是現(xiàn)在高密度采集48平方公里,16TB的數(shù)據(jù),尤其是針對(duì)已經(jīng)開(kāi)發(fā)過(guò)的油場(chǎng),進(jìn)行二次勘探,數(shù)據(jù)量更大、難度更大。”張鐵鋼介紹,現(xiàn)在使用高性能計(jì)算系統(tǒng)、多路服務(wù)器、英特爾至強(qiáng)處理器、高性能存儲(chǔ)系統(tǒng),多方協(xié)同三維數(shù)據(jù)解析的工作進(jìn)展順利,而基于虛擬化技術(shù)讓兩個(gè)專業(yè)軟件同時(shí)運(yùn)行,“這在以前是不可想象的”。
除此以外,在會(huì)議的演講上,張鐵鋼還介紹了大慶使用云計(jì)算技術(shù)構(gòu)建云門(mén)戶的經(jīng)驗(yàn),通過(guò)構(gòu)建云計(jì)算門(mén)戶,大慶油田在內(nèi)部服務(wù)、勘探資源的調(diào)配和快速上線上,獲得了很大的收益,而利用虛擬化技術(shù)對(duì)門(mén)戶服務(wù)器的優(yōu)化,目前大慶油田門(mén)戶服務(wù)器的利用高達(dá)70%,專業(yè)應(yīng)用的系統(tǒng)利用率從20%提升到了40%,并“利用虛擬機(jī)管理許可證,隨時(shí)利用空閑許可證,讓資源靈活和浮動(dòng)起來(lái)。”
“機(jī)器的性能和效率提高了,人的效率也就提高了,雖然初期需要購(gòu)買(mǎi)一些管理軟件,但長(zhǎng)期的效益是巨大的。”張鐵鋼向記者表示。
英特爾服務(wù)高性能計(jì)算:不止是CPU
無(wú)論是賴能和還是張鐵鋼,他們已經(jīng)意識(shí)到,單純依靠CPU提高工作負(fù)載能力、加速石油行業(yè)高性能計(jì)算性能的時(shí)代已經(jīng)一去不復(fù)返,在英特爾的處理器——至強(qiáng)和至強(qiáng)融核——不斷加速并將其他IO遠(yuǎn)遠(yuǎn)甩在身后的情形下,提高高性能計(jì)算的性能,正在成為一場(chǎng)“全面戰(zhàn)爭(zhēng)”。
在這場(chǎng)戰(zhàn)爭(zhēng)中,需要被現(xiàn)代化的包括一長(zhǎng)串名單:更快的、更大容量的內(nèi)存;應(yīng)當(dāng)被閃存(或者說(shuō)是SSD)取代的運(yùn)轉(zhuǎn)緩慢的傳統(tǒng)磁盤(pán);無(wú)法響應(yīng)網(wǎng)絡(luò)需求帶寬嚴(yán)重滯后的1Gb以太網(wǎng);應(yīng)當(dāng)更具擴(kuò)展性的文件系統(tǒng),凡此種種,這不僅是賴能和與張鐵鋼們的挑戰(zhàn),也是英特爾的挑戰(zhàn)。
因此,在高性能計(jì)算行業(yè),英特爾所提供的產(chǎn)品并不僅限于英特爾至強(qiáng)和至強(qiáng)融核處理器,而是一個(gè)全面的高性能計(jì)算效率與性能提高的方案。
首先,英特爾如今在提供面向數(shù)據(jù)中心的DC S3500和S3700固態(tài)硬盤(pán),這兩款產(chǎn)品雖然都基于SATA接口,但提供了足夠高性能計(jì)算平臺(tái)所需要的隨機(jī)小塊讀寫(xiě)性能,以及更長(zhǎng)期的壽命,而在PCIe閃存卡領(lǐng)域,英特爾的910系列閃存卡則更能夠顯著提高高性能計(jì)算系統(tǒng)每節(jié)點(diǎn)的IO吞吐量。
其次,英特爾一直在以太網(wǎng)領(lǐng)域提供大量的技術(shù)、產(chǎn)品和知識(shí)產(chǎn)權(quán),英特爾不僅提供萬(wàn)兆網(wǎng)以太網(wǎng)適配器,現(xiàn)在還在提供融合網(wǎng)絡(luò)適配器X520、X540系列,其中絕大部分都使用英特爾自己的控制器。
第三,英特爾在高性能計(jì)算的編譯器、編程工具等領(lǐng)域,提供了大量基于標(biāo)準(zhǔn)的開(kāi)發(fā)、編程工具以及不少行業(yè)標(biāo)準(zhǔn)的編譯器。這些工具包括了VTune性能分析器、英特爾編譯器(Intel Compilers)、Intel Thread Checker、Intel Performance Libraries、Intel Threading Tools、Intel Cluster Tools等,它們可以幫助高性能計(jì)算應(yīng)用軟件開(kāi)發(fā)商或最終用戶分析自己的高性能計(jì)算系統(tǒng)及應(yīng)用軟件特性,并最大限度優(yōu)化其高性能計(jì)算機(jī)軟硬件系統(tǒng),發(fā)掘其最大性能潛力。
第四,針對(duì)高性能計(jì)算目前的文件系統(tǒng)問(wèn)題,英特爾自2012年收購(gòu)超級(jí)計(jì)算機(jī)集群解決方案文件系統(tǒng)Lustre之后,今年正式發(fā)布了英特爾發(fā)行版的Lustre文件系統(tǒng),有效的提高了這一文件系統(tǒng)及大量高性能計(jì)算系統(tǒng)的的文件存儲(chǔ)能力。
除此以外,英特爾公司還推出了“真實(shí)應(yīng)用負(fù)載計(jì)劃”,來(lái)幫助用戶針對(duì)其真實(shí)的應(yīng)用負(fù)載,而非通用的基準(zhǔn)測(cè)試軟件來(lái)進(jìn)行調(diào)優(yōu),從而幫助他們從自己的系統(tǒng)上獲取最大化的收益——從以上這些內(nèi)容來(lái)看,英特爾在高性能計(jì)算領(lǐng)域絕不僅僅是推動(dòng)CPU的升級(jí)和發(fā)展那么簡(jiǎn)單,再有可能成為高性能計(jì)算瓶頸的任何地方,英特爾都在投入技術(shù)、精力和時(shí)間,從而形成全面的高性能計(jì)算技術(shù)、產(chǎn)品提供商。