下面是項(xiàng)之初的演講摘錄:
算力與文明的關(guān)系
我們先來(lái)看下算力發(fā)展的歷史,在遠(yuǎn)古時(shí)代,人類不但會(huì)利用工具去拓展體力,也會(huì)利用工具去拓展人的智力。古代人類能利用的算力只有自己的大腦,逐漸地人們開始會(huì)用小繩子、小木棍,去做一些計(jì)算,擴(kuò)充人腦的算力,算盤是中國(guó)古代人機(jī)結(jié)合算力的一個(gè)頂點(diǎn),至此之后就沒(méi)有再出現(xiàn)一個(gè)更大的變化,它只是衍生了更多類算盤的衍生品。而西方就走了一個(gè)完全不同的道路,它從計(jì)算尺,機(jī)械式計(jì)算機(jī)到差分機(jī)、解析機(jī),那個(gè)時(shí)候和算盤計(jì)算沒(méi)有太大的差距,但是從1945年馮諾依曼的第一臺(tái)現(xiàn)代意義上的計(jì)算機(jī)開始,就拉開了雙方的差距,至此一發(fā)不可收拾,出現(xiàn)了個(gè)人計(jì)算機(jī)、手機(jī),以及到現(xiàn)在的超算中心。美國(guó)從1945年第一臺(tái)馮諾依曼計(jì)算機(jī)開始,就奠定了其在第三次工業(yè)革命中的領(lǐng)導(dǎo)地位,到今天不管是個(gè)PC還是手機(jī),都是沿著原來(lái)計(jì)算機(jī)的模型繼續(xù)延伸,未來(lái)不知道會(huì)再延伸出怎樣的新的事物,但從現(xiàn)在看來(lái),還是沒(méi)有跳脫原來(lái)的框架。
在這個(gè)過(guò)程中,我們發(fā)現(xiàn)一個(gè)很有意思的現(xiàn)象,在東方計(jì)算的過(guò)程中,不管是算盤還是算籌,都是人的手高度參與計(jì)算過(guò)程。但西方從很早開始,就不希望人力參與計(jì)算過(guò)程,你只需有一個(gè)輸入,得到一個(gè)結(jié)果,這個(gè)可能是西方產(chǎn)生現(xiàn)代意義上的計(jì)算機(jī)的重要一點(diǎn)。當(dāng)電子系統(tǒng)成熟的時(shí)候,它就完全可以依靠外力去完成更大算力的計(jì)算,人如果要參與的話,計(jì)算瓶頸就變成人手的速度,而人手速度永遠(yuǎn)無(wú)法實(shí)現(xiàn)百萬(wàn)億次的計(jì)算量級(jí)。
另外一個(gè)角度,文明的發(fā)展,其實(shí)是會(huì)讓算力變得更強(qiáng)大,更強(qiáng)大的算力,就可以處理更多的信息,讓整個(gè)社會(huì)運(yùn)行得更高效,去回哺文明的發(fā)展,我覺(jué)得在算力和文明之間,是互相交互促進(jìn)的關(guān)系。
存算一體:解鎖“算力”和“功耗”難題的金鑰匙
數(shù)據(jù)中心、自動(dòng)駕駛,物聯(lián)網(wǎng)等應(yīng)用場(chǎng)景,都對(duì)算力產(chǎn)生了一個(gè)極大的需求。首先,新的算法模型對(duì)算力的需求每3.5個(gè)月就翻一倍,摩爾定律只能每18個(gè)月翻一番,正在逐漸失效。另外,因?yàn)榇鎯?chǔ)的發(fā)展速度一直小于計(jì)算的發(fā)展速度,存儲(chǔ)墻的存在限制了真實(shí)有效的算力提升,我們預(yù)測(cè)在未來(lái)很長(zhǎng)一段時(shí)間內(nèi),算力的供給,會(huì)遠(yuǎn)遠(yuǎn)小于算力的需求。其次,當(dāng)前的芯片能效比,遠(yuǎn)不能支撐算力繼續(xù)大步往前發(fā)展。比如著名的李世石與AlphGo下棋案例,雖說(shuō)李世石輸給了AlphGo,但是李世石的大腦能效比AlphGo要高很多,他下一盤棋大概需要2碗米飯的能量,但是AlphGo下一盤棋需要2萬(wàn)美元的電費(fèi),兩者完全不在一個(gè)量級(jí)上。如果要用更多AI取代人腦計(jì)算,就不能是現(xiàn)在的能效比水平,所需要的能效比,至少是更接近于人腦的水平。
存算一體,是目前能夠解決算力和功耗問(wèn)題的金鑰匙。存算一體的原理,大家也都比較了解了,它可以在電路層面把存儲(chǔ)和計(jì)算融合在一起,同時(shí)解決這兩個(gè)問(wèn)題,我們發(fā)現(xiàn)它一系列的優(yōu)勢(shì),也非常適用于自動(dòng)駕駛領(lǐng)域。
自動(dòng)駕駛的三個(gè)要素,第一是強(qiáng)智能,它是由算力、算法、數(shù)據(jù)三個(gè)要素決定的,會(huì)提升駕車及乘車的體驗(yàn)。第二是安全性,包括器件的功能安全,以及可靠性,低延時(shí)。第三是低成本,如英偉達(dá)最近發(fā)布的H100,功耗達(dá)到700 W,并采用HBM等封昂貴的封裝方案,讓芯片的成本動(dòng)輒上千美元,這在自動(dòng)駕駛端無(wú)法普及。
這些要素也對(duì)自動(dòng)駕駛芯片提出了更高的要求,需要更大的算力去映射強(qiáng)智能,需要更低的功耗去映射安全性以及更低的成本。
下面介紹一個(gè)存算一體的具體實(shí)現(xiàn)案例,大家都知道,自然風(fēng)冷是整車廠最喜歡的散熱方式。一般在15W以下,可以用自然風(fēng)冷,但是到80W以上就需要液冷,15W—80W會(huì)用風(fēng)扇的散熱。對(duì)整車廠的工程師來(lái)說(shuō),最喜歡自然散熱,不管是本身散熱系統(tǒng)的成本、可靠性,以及維護(hù)成本,它都是最優(yōu)的方式。如采用自然風(fēng)冷,在傳統(tǒng)的馮諾依曼架構(gòu)下,算力只能達(dá)到約20TOPS(16nm工藝),如果用存算一體技術(shù),可以做到超過(guò)60TOPS以上的算力。這個(gè)對(duì)于傳統(tǒng)架構(gòu)的產(chǎn)品,會(huì)有一個(gè)碾壓性的優(yōu)勢(shì)。
后摩智能的落地與展望
后摩智能成立于2020年,經(jīng)過(guò)一年多時(shí)間,首款存算一體芯片今年年初點(diǎn)亮后成功跑通了一些經(jīng)典的自動(dòng)駕駛算法模型,這款芯片可實(shí)現(xiàn)幾十TOPS的算力,能效比高達(dá)20TOPS/W。這是全球意義上的首款存算一體大算力芯片,它是完全按照商業(yè)量產(chǎn)的精度、容量,以及良率去設(shè)計(jì)的。后摩智能第一代芯片基于SRAM實(shí)現(xiàn),它與傳統(tǒng)馮諾依曼架構(gòu)芯片相比有約10倍的能效比優(yōu)勢(shì),算力可以突破到大幾百TOPS的范疇。到2025年以后,隨著先進(jìn)存儲(chǔ)MRAM、RRAM等落地,我們會(huì)進(jìn)一步提升算力的上限,同時(shí)能效比還可以做得更高,最終實(shí)現(xiàn)單芯片1000-2000TOPS的水準(zhǔn)。
很多朋友會(huì)問(wèn)我,存算一體芯片因?yàn)樵诘讓幼隽祟嵏残缘募軜?gòu)創(chuàng)新,它的使用成本是否會(huì)很高,或者不好用?這個(gè)其實(shí)是一個(gè)錯(cuò)誤的理解,對(duì)工程師來(lái)說(shuō),底層芯片架構(gòu),是透明的,你不用在乎它是存算一體、近存,還是馮諾依曼架構(gòu),你在乎的是工具鏈軟件層是不是好用。因此,我們特地自研了編譯器和工具鏈,它是一個(gè)更像英偉達(dá)的開放的平臺(tái),可以適應(yīng)不同的算法,比如在 TensoFlow、PyTorch上訓(xùn)練的模型,都可以在我們的芯片上得到支持。所以對(duì)工程師來(lái)說(shuō),他不需要改變?cè)械木幊塘?xí)慣,也沒(méi)有額外的學(xué)習(xí)成本,我們也會(huì)提供一個(gè)類CUDA的編程模式,讓工程師使用起來(lái)更偏向于他們?cè)瓉?lái)的習(xí)慣。
中國(guó)汽車在電氣化和智能化時(shí)代的崛起,將帶動(dòng)優(yōu)秀本土供應(yīng)鏈公司做大做強(qiáng)
我們發(fā)現(xiàn)一個(gè)很有趣的規(guī)律,也是對(duì)產(chǎn)業(yè)的一個(gè)思考,在一個(gè)國(guó)家或區(qū)域發(fā)生大的產(chǎn)業(yè)變革的時(shí)候,通常都會(huì)孵化出很好的上游供應(yīng)鏈公司。比如上世紀(jì)80年代的日本消費(fèi)電子時(shí)代,Walkman,攝像機(jī)和照相機(jī)等風(fēng)靡全球,這種繁榮拉動(dòng)了本土產(chǎn)業(yè)鏈上游公司的崛起,誕生了松下,索尼等優(yōu)秀的半導(dǎo)體公司。美國(guó)主導(dǎo)的PC產(chǎn)業(yè),戴爾、蘋果等個(gè)人PC熱賣也帶動(dòng)了Intel,AMD等公司成長(zhǎng)為世界級(jí)的半導(dǎo)體公司。同樣在歐洲,汽車領(lǐng)域的強(qiáng)勢(shì),也使得汽車電子芯片的主要供應(yīng)商也主要集中在歐洲。
這一系列的案例,都指向了今天的中國(guó),今天的中國(guó)已經(jīng)成為了最大的消費(fèi)電子以及新能源車的市場(chǎng),我們判斷,它一定會(huì)誕生出世界級(jí)的半導(dǎo)體公司,不止一個(gè),應(yīng)該會(huì)有數(shù)個(gè)世界級(jí)的半導(dǎo)體公司。本地化的需求,本地公司會(huì)有更快的相應(yīng)時(shí)間,其次,它會(huì)對(duì)于本土的需求更敏感。現(xiàn)在國(guó)內(nèi)的新能源車企競(jìng)爭(zhēng)非常激烈,大家都希望用差異化的供應(yīng)鏈,去提供差異化的用戶體驗(yàn),因此他們非常有愿意去使用創(chuàng)新供應(yīng)鏈產(chǎn)品。這對(duì)于一個(gè)半導(dǎo)體公司來(lái)說(shuō),是非常友好的一個(gè)環(huán)節(jié),大家都會(huì)給你機(jī)會(huì)試用初創(chuàng)公司的產(chǎn)品。我們也希望在這樣一個(gè)天時(shí)地利人和的時(shí)代把產(chǎn)品做好,可以更好地去fit in這些供應(yīng)鏈,做產(chǎn)品的迭代。
后摩智能的愿景是成為AI時(shí)代的算力平臺(tái)
最后,再跟大家分享下能效比和計(jì)算形態(tài)演進(jìn)的關(guān)系。在人類計(jì)算歷史上,能效比有千倍提升,通常會(huì)衍生出一種新的計(jì)算形態(tài),從最早的超算中心開始,到小型機(jī)、個(gè)人PC、手機(jī),都是這個(gè)趨勢(shì)。手機(jī)的能效比大概是1P/W的水準(zhǔn),但是這個(gè)水準(zhǔn)不足以支撐萬(wàn)物智能的時(shí)代,今天的數(shù)據(jù)量,已經(jīng)到了大幾十ZB的量級(jí),未來(lái)當(dāng)數(shù)據(jù)量變得更大,會(huì)用什么樣的架構(gòu)去適應(yīng)這個(gè)變化,我們覺(jué)得存算一體是個(gè)解決方案,后摩智能也希望在這個(gè)過(guò)程中貢獻(xiàn)自己的一份力量。
我們的愿景是希望成為AI時(shí)代的算力平臺(tái),從無(wú)人車、機(jī)器人落地,到乘用車,到人型機(jī)器人、元宇宙等。再到未來(lái)能效比變得更高的時(shí)候,會(huì)出現(xiàn)什么樣的應(yīng)用場(chǎng)景以及怎樣的一個(gè)強(qiáng)人工智能,讓我們拭目以待!
希望未來(lái)更快到來(lái)!
【關(guān)于后摩智能:后摩智能創(chuàng)立于2020年底,由吳強(qiáng)博士與多位國(guó)際頂尖學(xué)者和芯片工業(yè)界資深專家聯(lián)合組建,是國(guó)內(nèi)首家專注于存算一體技術(shù)的大算力AI芯片公司。后摩智能以國(guó)際前瞻的存算一體技術(shù)和存儲(chǔ)工藝,致力于突破智能計(jì)算芯片性能及功耗瓶頸,加速人工智能普惠落地。其提供的大算力、低功耗的高能效比芯片及解決方案,可應(yīng)用于智能駕駛、泛機(jī)器人等邊緣端,以及云端推理場(chǎng)景?!?/p>