專家聚集,探討高性能計(jì)算技術(shù)發(fā)展與應(yīng)用前景。
高性能計(jì)算應(yīng)用日趨廣泛
傳統(tǒng)的高性能計(jì)算主要應(yīng)用于教育、科研領(lǐng)域,在石油勘探、生命科學(xué)和實(shí)時(shí)金融服務(wù)等傳統(tǒng)行業(yè)也有眾多耳熟能詳?shù)膽?yīng)用。高性能計(jì)算涉及十多個(gè)子行業(yè),但無(wú)論是在設(shè)備規(guī)模、用戶數(shù)、運(yùn)行量方面,無(wú)論是在科研還是實(shí)際應(yīng)用方面,美國(guó)、德國(guó)和日本每年都?jí)艛嗔饲叭?/p>
國(guó)內(nèi)的應(yīng)用也在逐步的深入。
大范圍影響全國(guó)的霧霾正在嚴(yán)重影響公眾健康和生產(chǎn)生活質(zhì)量,是當(dāng)前我國(guó)關(guān)注的熱點(diǎn)話題之一;如何利用先進(jìn)的技術(shù)手段監(jiān)測(cè)并探索大氣污染成因已成為當(dāng)前最迫切需解決的難題。借助于高性能集群,中國(guó)科學(xué)院大氣物理研究所實(shí)現(xiàn)了未來(lái)七天的空氣質(zhì)量預(yù)報(bào)和污染來(lái)源解析,為各地環(huán)保部門提供可靠的實(shí)施方案和經(jīng)驗(yàn)。
移動(dòng)終端的普及、社交網(wǎng)絡(luò)的擴(kuò)散以及物聯(lián)網(wǎng)的廣泛應(yīng)用,帶來(lái)了數(shù)據(jù)爆炸式的增長(zhǎng)與相應(yīng)的大數(shù)據(jù)和分析需求壓力,高性能計(jì)算被越來(lái)越多的行業(yè)企業(yè)采用。
例如,在機(jī)器學(xué)習(xí)領(lǐng)域,科大訊飛取得了突破式進(jìn)展,在制造業(yè)CAE領(lǐng)域,中國(guó)商飛大量用于數(shù)字模擬,在手機(jī)里的揚(yáng)聲器或者耳機(jī)研發(fā),或者半導(dǎo)體工藝制程,瑞聲科技、中芯國(guó)際也是專業(yè)級(jí)的用戶。結(jié)合“中國(guó)制造2025”和產(chǎn)業(yè)升級(jí)需求,高性能計(jì)算的發(fā)展?jié)摿€將與日俱增。
互聯(lián)網(wǎng)企業(yè)青睞高性能計(jì)算
值得注意的是,很多互聯(lián)網(wǎng)企業(yè)意識(shí)到了高性能計(jì)算對(duì)他們下一步的發(fā)展的價(jià)值,F(xiàn)acebook成立了HPC工作組,百度正在計(jì)劃建造一臺(tái)性能達(dá)7千萬(wàn)億次)(7Pflops)的超算系統(tǒng),用于語(yǔ)音助手和圖片搜索領(lǐng)域,這方面谷歌已經(jīng)搶先了一步;京東則正在積極用于機(jī)器學(xué)習(xí)等方面的研究;阿里云基于公共云平臺(tái)的高性能計(jì)算產(chǎn)品也正式對(duì)外商用,用戶可通過(guò)阿里云官網(wǎng)購(gòu)買GPU服務(wù)器實(shí)例。
對(duì)傳統(tǒng)高性能計(jì)算行業(yè)來(lái)說(shuō)這是個(gè)好事,一方說(shuō)明高性能計(jì)算的市場(chǎng)在不斷擴(kuò)大,另一方面也意味著高性能計(jì)算正在走下神壇、走向大眾化,這樣也才能得到更理想和更廣泛的應(yīng)用。
此舉將推進(jìn)高性能計(jì)算的發(fā)展更加專業(yè)和深入。
與傳統(tǒng)高性能計(jì)算大多是在開(kāi)源環(huán)境運(yùn)行,關(guān)注的是浮點(diǎn)運(yùn)算值、Linpack以及TOP500的排名位置不同,企業(yè)級(jí)高性能計(jì)算運(yùn)行于多種環(huán)境,或采用商業(yè)軟件,或自行開(kāi)發(fā),由于投資主體是企業(yè)本身,因此更關(guān)心應(yīng)用的效果、更關(guān)注投入產(chǎn)出比。
云上高性能計(jì)算平臺(tái),前景尚未明朗
由于資投入、使用效率、能耗等的問(wèn)題,限制了大部分企業(yè)對(duì)于高性能計(jì)算的應(yīng)用。但對(duì)于不差錢的互聯(lián)網(wǎng)企業(yè)而言,這些都不是問(wèn)題。
而互聯(lián)網(wǎng)企業(yè)往往都是基于云計(jì)算的應(yīng)用,因此他們的高性能計(jì)算大都是以云上的架構(gòu)(HPC in cloud)來(lái)提供服務(wù)。
例如,剛剛上線的阿里云高性能計(jì)算平臺(tái),為用戶提供專屬100%物理機(jī),CPU、GPU不會(huì)發(fā)生爭(zhēng)搶,保證無(wú)性能波動(dòng),沒(méi)有虛擬化開(kāi)銷。據(jù)測(cè)算,假如有200萬(wàn)張圖片需要學(xué)習(xí),用一臺(tái)雙路E5-2650 v2的服務(wù)器訓(xùn)練需要16天時(shí)間,而如果用阿里云雙GPU物理機(jī)僅需要1天。
云上高性能計(jì)算的確有不少優(yōu)勢(shì),但這是否意味著將來(lái)傳統(tǒng)企業(yè)不用再投資建設(shè)數(shù)據(jù)中心,而是采用按需收費(fèi)的方式,結(jié)論還為時(shí)過(guò)早。
大量互聯(lián)網(wǎng)企業(yè)之所以關(guān)注和采用高性能計(jì)算,是因?yàn)樵频募軜?gòu)不能解決所有的問(wèn)題。
撇開(kāi)數(shù)據(jù)安全問(wèn)題,最關(guān)鍵的就是傳輸?shù)难舆t,在數(shù)據(jù)量巨大的時(shí)候,就要考慮是否會(huì)影響到業(yè)務(wù)的正常進(jìn)行。相比業(yè)務(wù)受影響,絕大部分用戶是不會(huì)因?yàn)檫\(yùn)營(yíng)成本的降低而放棄傳統(tǒng)高能性計(jì)算平臺(tái)的。
另外,傳統(tǒng)的高性能計(jì)算的服務(wù)對(duì)象多是科研人員,實(shí)時(shí)互動(dòng)對(duì)他們來(lái)說(shuō)也非常重要。這也是云平臺(tái)的一個(gè)短板。
普遍認(rèn)為,云端超算中心是一個(gè)創(chuàng)新的業(yè)務(wù)模式,但具體效果還需要時(shí)間來(lái)檢驗(yàn)。如何提供物超所值的服務(wù),怎樣與用戶更加密切互動(dòng),這是互聯(lián)網(wǎng)企業(yè)正在積極探索解決的問(wèn)題。
借鑒國(guó)外應(yīng)用,提升國(guó)內(nèi)水平
日本政府鼓勵(lì)產(chǎn)學(xué)研相結(jié)合,鼓勵(lì)企業(yè)應(yīng)用國(guó)家級(jí)的超算中心,方式是對(duì)哪些公開(kāi)成果的應(yīng)用收費(fèi)要低3倍以上。
“國(guó)內(nèi)的超算中心,包括高校的超算中心大多局限于開(kāi)發(fā)領(lǐng)域,應(yīng)當(dāng)借鑒美日的發(fā)展模式做更多有意義的工作?!鄙虾=煌ù髮W(xué)高性能計(jì)算中心副主任林新華博士表示,一味照搬照抄肯定是不可取的,但以往多年實(shí)際上也只是學(xué)到一些皮毛,甚至有些走樣。
上海交通大學(xué)高性能計(jì)算中心副主任林新華博士。
林新華認(rèn)為,資金、人才、軟件的缺乏,拖了我國(guó)高性能計(jì)算發(fā)展的后腿。國(guó)外開(kāi)發(fā)運(yùn)維一體化的趨勢(shì)短期在國(guó)內(nèi)還很難實(shí)現(xiàn)。他建議國(guó)家建立長(zhǎng)遠(yuǎn)規(guī)劃,把分散的硬件、軟件、人才以靈活的體制機(jī)制像容器一樣融合在一起,一方面,發(fā)展自主芯片產(chǎn)品,不完全依附于某一家廠商,堅(jiān)持兩條腿走路,另一方面加大投入力度、加快行業(yè)應(yīng)用,效果一定會(huì)大大改觀。
在運(yùn)維方面,林新華正嘗試采取收費(fèi)的方式。他解釋說(shuō)收費(fèi)的目的一是防止濫用,二是適當(dāng)補(bǔ)貼運(yùn)維成本。上海交大校級(jí)超算中心側(cè)重于校內(nèi)師生使用,雖然已經(jīng)面向社會(huì),讓他深感不足的是參與者寥寥。
高性能計(jì)算和大數(shù)據(jù)的融合理念最早是日本東京一所高校的教授提出的,但實(shí)際上二者還是沒(méi)有真正融合,林新華也不確定大數(shù)據(jù)對(duì)高性能計(jì)算能帶來(lái)哪些影響。
鞏固生態(tài)建設(shè),引領(lǐng)產(chǎn)業(yè)發(fā)展
在高性能計(jì)算的實(shí)際應(yīng)用中,計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、軟件等不同領(lǐng)域的“短板”卻一直在影響著整體系統(tǒng)的計(jì)算能力。
作為高性能計(jì)算領(lǐng)域的創(chuàng)新引領(lǐng)者和推動(dòng)者,英特爾近年來(lái)推出了英特爾至強(qiáng)處理器,至強(qiáng)融核處理器(Xeon Phi)、3D XPoint全新非易失性存儲(chǔ)技術(shù)、可擴(kuò)展系統(tǒng)框架(英特爾SSF)以O(shè)mni-Path架構(gòu)(Intel OPA)等眾多創(chuàng)新產(chǎn)品和技術(shù),能夠從各個(gè)環(huán)節(jié)優(yōu)化系統(tǒng),彌補(bǔ)系統(tǒng)“短板”,真正提升高性能計(jì)算系統(tǒng)的整體功效,以滿足企業(yè)對(duì)應(yīng)用模式和計(jì)算效率的急切需求,并推動(dòng)高性能計(jì)算解決方案的創(chuàng)新發(fā)展。
上海交大超算中心作為英特爾非常重要的客戶及合作伙伴,在教育和科研的層面,市場(chǎng)份額始終處于前三位,為國(guó)內(nèi)眾多躍躍欲試的985和211大學(xué)做出了非常好的范例。
在英特爾的支持下,上海交大正在致力推動(dòng)校級(jí)平臺(tái)上的開(kāi)放和創(chuàng)新,探索未來(lái)超算體系新架構(gòu),并且加快其與工業(yè)界的合作,力圖走出一條新路子,產(chǎn)生出世界上最好的、最高水平的成果,讓高性能計(jì)算走入實(shí)際生活中。
“英特爾關(guān)注高性能計(jì)算在中國(guó)的發(fā)展,正在努力營(yíng)造良好的生態(tài)系統(tǒng)、提供更好的產(chǎn)品和服務(wù),提升中國(guó)未來(lái)高性能計(jì)算水平?!庇⑻貭栂嚓P(guān)人士表示,英特爾將協(xié)調(diào)各個(gè)領(lǐng)域的性能并推動(dòng)創(chuàng)新,推動(dòng)高性能計(jì)算的快速發(fā)展和廣泛應(yīng)用。