然而,結(jié)局大家都看到了,ET準(zhǔn)確無誤地報(bào)出了5位觀眾手上的牌的花色和點(diǎn)數(shù),全場震驚。

14

其實(shí)ET并不是真的有“讀心術(shù)”,而是利用了一個(gè)名為De Bruijn序列的數(shù)學(xué)方程式,再加上強(qiáng)大的人工智能技術(shù),才完成了這場完美的表演show。

12

De Bruijn序列的原理很復(fù)雜,這里不詳述,感興趣的可以上網(wǎng)搜索下。但De Bruijn序列的結(jié)論很簡單,就是從這樣的序列中任意取出相鄰n個(gè)數(shù),它們的二進(jìn)制排列一定不相同。這就意味著,ET只需將5名觀眾手上的黑牌和紅牌(對應(yīng)二進(jìn)制里的0和1)按順序出來,就只有一個(gè)唯一的解。

簡單來說,將牌事先按順序排列,不管怎么切牌,排序組合的可能性縮減到32種,然后根據(jù)下面這張圖表尋找對應(yīng)的排列形式,答案就呼之欲出了。

如果一個(gè)普通的魔術(shù)師能完成這樣的魔術(shù)(需要對上面這張表倒背如流),你了解真相后可能會驚嘆他的記憶力。
但當(dāng)一個(gè)人工智能表演這個(gè)魔術(shù)時(shí),就不僅僅是記憶力這么簡單了。

在這場魔術(shù)秀中,阿里云ET全面展示了語音識別、語音合成、自然語言理解、實(shí)時(shí)圖像識別、機(jī)器學(xué)習(xí)等人工智能的綜合能力。

比如在與華少的交流中,ET不僅能“聽懂”華少的話并在屏幕下方實(shí)時(shí)打出字幕,還能給出相應(yīng)的回復(fù),對答如流。不僅如此,ET還“看出”了華少手中多出一副撲克牌。

節(jié)目中,被稱為“中國好舌頭”的華少在與ET的對話時(shí)刻意加快了語速,ET仍然準(zhǔn)確無誤實(shí)現(xiàn)了實(shí)時(shí)語音識別,并將字幕輸出在屏幕上。這背后,是阿里云iDST技術(shù)團(tuán)隊(duì)研發(fā)的智能語音交互(Intelligent Speech Interaction)系統(tǒng), 包含語音識別、語音合成、自然語言理解等技術(shù)。

而在ET識別黑牌的過程中,應(yīng)用到的就是人工智能的圖像識別技術(shù)。在觀眾抽取撲克牌時(shí),ET已經(jīng)完成了對5位觀眾的面部識別,并利用算法建立了器官輪廓定位,以便之后識別出是否有人轉(zhuǎn)身。

目前,阿里云ET的人臉?biāo)惴ㄒ呀?jīng)覆蓋了人臉檢測、器官輪廓定位、人像美化、性別年齡識別、1對1人臉認(rèn)證和1對多人臉識別等多個(gè)方向,用機(jī)器學(xué)習(xí)的方法,包括卷積神經(jīng)網(wǎng)絡(luò)、Supervised Descent Method等,實(shí)現(xiàn)了高精度和高效的技術(shù),人臉識別在LFW上識別率超過99.5%。

基于此,ET能夠輕松識別出黑牌觀眾轉(zhuǎn)身的動作,準(zhǔn)確報(bào)出5名觀眾的手牌。過程看似簡單,背后的算法和所需的大規(guī)模計(jì)算能力卻并非一朝一夕就能煉成的。

無論是語音識別還是圖像識別,阿里云ET的底層都依賴于深度學(xué)習(xí)算法以及大規(guī)模計(jì)算能力。一套復(fù)雜算法模型的訓(xùn)練往往需要千億級別的樣本數(shù)據(jù),這就對背后的計(jì)算能力提出了很高的要求。

其實(shí),ET能做的不僅僅是當(dāng)個(gè)魔術(shù)師這么簡單,借助深度神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)技術(shù),阿里云人工智能已經(jīng)具備利用數(shù)據(jù)為一整座城市提供思考和決策的能力,目前,杭州政府聯(lián)合阿里云等13家企業(yè),為這座擁有2200多年歷史的城市安裝了一個(gè)人工智能的杭州城市數(shù)據(jù)大腦,將杭州打造成一座能夠自我調(diào)節(jié)、與人類良性互動的城市。在交通領(lǐng)域的試點(diǎn)中,ET通過對路口交通狀況的預(yù)測調(diào)控紅綠燈,使部分路段的車輛通行速度最高提升了11%。

人工智能正在以超乎想象的速度融入你的生活,其實(shí)ET已經(jīng)成為你身邊一個(gè)真正的魔術(shù)師了呢。

 

分享到

xiesc

相關(guān)推薦