后面的十月,我被邀請(qǐng)去上海世博參加了華為的全連接大會(huì),目睹了包括ModelArts在內(nèi)的三塊AI開發(fā)平臺(tái)的發(fā)布。
更早一些時(shí)候,曾經(jīng)流出過(guò)關(guān)于微軟的中國(guó)區(qū)數(shù)據(jù)中心即將使用華為的AI芯片的消息,所以那幾天在世博中心,我有一種強(qiáng)烈的直覺是:
未來(lái)在AI芯片領(lǐng)域,將會(huì)是華為和英偉達(dá)的“神仙打架”。
再接下來(lái)就是上周,在斯坦福大學(xué)發(fā)布了DAWNBenchmark的最新成績(jī)中,華為云ModelArts排名世界第一,僅需10分28秒,比第二名提升近44%。
對(duì)于這個(gè)結(jié)果我要解釋一下,為什么說(shuō)在DAWNBenchmark的深度學(xué)習(xí)測(cè)試中,訓(xùn)練時(shí)間變得這么重要。
近期BigGAN、NASNet、BERT等模型的出現(xiàn),預(yù)示著訓(xùn)練更好精度的模型需要更強(qiáng)大的計(jì)算資源。未來(lái)隨著模型的增大、數(shù)據(jù)量的增加,深度學(xué)習(xí)訓(xùn)練的加速性能則成為了重中之重。
在衡量深度學(xué)習(xí)的加速性能時(shí),主要通過(guò)兩個(gè)指標(biāo)來(lái)衡量,一個(gè)是吞吐量,即單位時(shí)間內(nèi)處理的數(shù)據(jù)量;另一個(gè)是收斂時(shí)間,即達(dá)到一定的收斂精度所需的時(shí)間。
你們可以這么理解,吞吐量就像是你一口氣能往嘴里塞多少干面包,而收斂時(shí)間則是你最終要花多久才能咽下去。
所以說(shuō),普通用戶在使用AI開發(fā)平臺(tái)時(shí),最終關(guān)注的一定是收斂時(shí)間。
畢竟,吃到肚子里的面包,才算是真正的營(yíng)養(yǎng)。
所以,出于對(duì)ModelArts在保證收斂精度前提下實(shí)操性的深切的好奇心,我去了在國(guó)際會(huì)議中心的華為ModelArts線下workshop。
我在9月份寫過(guò)的文章里,曾經(jīng)聊過(guò)我對(duì)普惠AI在“普惠性”上的看法,我認(rèn)為,普惠并不是指單一的便宜,更多指的是在面對(duì)基礎(chǔ)不同的用戶群的時(shí)候,都可以彈性自如的滿足各方的實(shí)際需求。
我記得我當(dāng)時(shí)舉了一個(gè)行業(yè)中的例子說(shuō),2017年的AI人才招聘缺口將達(dá)到500萬(wàn),所以一個(gè)可以適配各類初級(jí)開發(fā)者的AI云平臺(tái),將會(huì)是承載著AI未來(lái)的“飛天魔毯”。
但即便如此,我也全然沒有想到,當(dāng)ModelArts實(shí)操上手后,它的“普惠性”竟然可以達(dá)到人人可以上手的程度。
是的,你沒有聽錯(cuò),是人人可以上手。
接下來(lái),我將以一個(gè)“零基礎(chǔ)”使用者的視角,來(lái)做一個(gè)粗略的ModelArts體驗(yàn)。
進(jìn)入ModelArts開發(fā)平臺(tái)界面后,會(huì)有彈窗提示,你可以查看其簡(jiǎn)易的操作流程。
剛才我說(shuō)過(guò),在這個(gè)時(shí)代真正可以面向每一個(gè)人的AI開發(fā)平臺(tái),應(yīng)該做到收放自如的彈性,無(wú)論是面對(duì)高階開發(fā)者,還是入門級(jí)開發(fā)者,甚至是完全和行業(yè)無(wú)關(guān)的門外漢,都可以滿足其不同層級(jí)的需求。
比如這個(gè)自動(dòng)學(xué)習(xí)的板塊,雖然我已經(jīng)離開通信行業(yè)5年了,早已經(jīng)忘記了代碼世界里的所有關(guān)隘,但即便你和我一樣,也可以通過(guò)上傳數(shù)據(jù),并且進(jìn)行指向性的標(biāo)注,來(lái)完成定制化的模型訓(xùn)練。
當(dāng)然,如果你是一個(gè)高階開發(fā)者,ModelArts也將提供給你更全套的生產(chǎn)力,同時(shí)ModelArts繼承了很多華為的優(yōu)秀基因,極強(qiáng)的實(shí)用性體現(xiàn)在數(shù)據(jù)準(zhǔn)備、訓(xùn)練、部署、上線的全流程里,實(shí)現(xiàn)了“上手快、訓(xùn)練快和上線快”的極致體驗(yàn)。
但由于我今天采用的是“零基礎(chǔ)”和“無(wú)門檻”視角,所以我只展示“即便一個(gè)小學(xué)生都可以操作訓(xùn)練的模型”。
在自動(dòng)學(xué)習(xí)版塊,有圖像分類、物體監(jiān)測(cè)和預(yù)測(cè)分析三種訓(xùn)練模型。由于我今天寫文章使用的是MacBook,瀏覽器暫時(shí)不能支持某些頁(yè)面功能,所以我先簡(jiǎn)單聊一下實(shí)操的體驗(yàn)感受。
以“圖像分類”舉例,比如說(shuō)你想做一個(gè)花卉識(shí)別的訓(xùn)練模型,那么你需要上傳一些花卉的數(shù)據(jù)樣本,也就是你想要識(shí)別出的花卉的圖片,比如向日葵、水仙、玫瑰等等。
接下來(lái)你要針對(duì)上傳的數(shù)據(jù)樣本進(jìn)行標(biāo)注,為你即將訓(xùn)練的模型建立規(guī)則,也就是告訴機(jī)器“這些圖片中哪些是水仙,而哪些是玫瑰”。
完成這些步驟之后,ModelArts將為你建立的模型進(jìn)行訓(xùn)練,理論上你上傳的數(shù)據(jù)樣本越多,訓(xùn)練后的精度也就越高,目標(biāo)識(shí)別也就越準(zhǔn)確。
這種實(shí)操環(huán)節(jié)的易上手性,是絕大部分對(duì)AI并不了解的朋友想象不到的。
我時(shí)常和身邊的人講這樣一個(gè)道理。
在每一個(gè)擁有標(biāo)志性技術(shù)的時(shí)代里,技術(shù)真正向人們賦能的標(biāo)志,不在于享有技術(shù)紅利,而在于普通人對(duì)技術(shù)的駕馭。
比如說(shuō)煤炭被開掘出來(lái)之后,人們不光要享受它帶來(lái)的能源革命,同時(shí)每一個(gè)人都學(xué)會(huì)對(duì)煤炭的使用,才是技術(shù)真正接入時(shí)代的標(biāo)志性意義。
而在AI全面降臨的時(shí)代里,并不是說(shuō)它無(wú)處不在就已經(jīng)是足夠極致的體現(xiàn)了,而是當(dāng)每一個(gè)普通人都可以根據(jù)自己的需求,來(lái)完成AI的定制化需求的時(shí)候,這才是這個(gè)工具真正井噴的時(shí)刻。
我身邊的很多創(chuàng)業(yè)者,本身并不是開發(fā)者,他們不懂代碼,不懂神經(jīng)網(wǎng)絡(luò),也不懂深度學(xué)習(xí),但他們對(duì)人工智能有可能帶來(lái)的提效降本有根本性的需求。像華為云的ModelArts這樣的AI發(fā)開平臺(tái),才能滿足他們?cè)趯I(yè)技能有限的前提,依然可以定制化自我需求的可能性。
最后。
讀書的時(shí)候?qū)W習(xí)寫作,語(yǔ)文老師總會(huì)和我們講白居易的故事,說(shuō)他寫好一首詩(shī)都要讀給村口的老太太聽,她能聽得懂才算是一首好詩(shī)。
這其實(shí)講的是文學(xué)上的雅俗共賞。
換回技術(shù)的語(yǔ)境中,我想說(shuō):
技術(shù)究竟是否需要“雅俗共賞”呢?
如果一項(xiàng)大眾技術(shù),人們對(duì)它的認(rèn)知永遠(yuǎn)停留在望而生畏和云山霧罩,雖然看起來(lái)逼格滿滿,那么它一定不能為我們帶來(lái)足夠多的紅利。
拿AI來(lái)說(shuō),對(duì)于我身邊的絕大部分朋友來(lái)說(shuō),這都是一樣“知其然而不知其所以然”的東西。
AI行業(yè)之外的人們,通常對(duì)AI沒有一個(gè)清晰的認(rèn)知。如果你和他們講AI開發(fā)平臺(tái),他們會(huì)先入為主的認(rèn)為這是一個(gè)異常艱難精深的領(lǐng)域。
而當(dāng)我把試用ModelArts的過(guò)程講給他們聽,他們的反應(yīng)幾乎全都是“還能有這樣的操作”?
是的,的確可以有這樣的操作。
最后的最后,我想說(shuō)兩句話。
AI作為一項(xiàng)時(shí)代技術(shù),的確可以“雅俗共賞”。
AI作為一個(gè)全面到來(lái)的“全民工具”,一定是為我們賦能的,而不是耗能的。
以上。