《人工智能》講述的是人工智能的進(jìn)化之旅及其對(duì)人類(lèi)的意義。在閱讀這本書(shū)的過(guò)程中,我們將遇到假裝有孌童癖的計(jì)算機(jī)、會(huì)跳舞的真空吸塵器、會(huì)下棋的人工智能以及旨在與死后的人進(jìn)行對(duì)話(huà)而被上傳了個(gè)人意識(shí)的計(jì)算機(jī)。

這是關(guān)于我們?nèi)绾卧O(shè)想未來(lái)的故事,以及在一個(gè)充滿(mǎn)技術(shù)的世界,我們?cè)诿媾R計(jì)算機(jī)智能不斷加速發(fā)展的情況下如何為人類(lèi)塑造自己的角色的故事。這是一個(gè)關(guān)于創(chuàng)造性的本質(zhì)、未來(lái)就業(yè)以及當(dāng)所有知識(shí)成為數(shù)據(jù)并且可以電子存儲(chǔ)時(shí),即將發(fā)生什么的故事。當(dāng)我們制造的機(jī)器比我們更加聰明,我們將要做什么,人類(lèi)現(xiàn)在還具備什么優(yōu)勢(shì),以及你和我是否也是一種會(huì)思考的機(jī)器。

1950 年,英國(guó)數(shù)學(xué)家和計(jì)算機(jī)科學(xué)家先驅(qū)人物艾倫?圖靈(Alan Turing)曾預(yù)測(cè),到20 世紀(jì)末,“詞語(yǔ)的使用與一般的教育主張將發(fā)生巨大改變,屆時(shí)人們談?wù)摍C(jī)器思維時(shí),不會(huì)有人對(duì)此進(jìn)行反駁”。

就像許多未來(lái)學(xué)家對(duì)技術(shù)的預(yù)測(cè)一樣,圖靈對(duì)未來(lái)非常樂(lè)觀,但并不過(guò)度樂(lè)觀。在21 世紀(jì)初期,與“智能”相關(guān)的技術(shù)以及“機(jī)器學(xué)習(xí)”已經(jīng)是很常見(jiàn)的話(huà)題,而這些概念在圖靈時(shí)代曾使許多人感到匪夷所思。

如今,人工智能作為一門(mén)學(xué)科已經(jīng)誕生60 年,它依然是人類(lèi)最重大、最具雄心的項(xiàng)目:努力建造真正的會(huì)思考的機(jī)器。隨著時(shí)光的流逝,技術(shù)人員離實(shí)現(xiàn)這個(gè)目標(biāo)越來(lái)越近,未來(lái)的一抹曙光也正在天際迅速明朗。

《人工智能》講述的正是這種熠熠生輝且近在咫尺的未來(lái),隱藏在角落里的變化,以及它們將如何永久性地改變我們的生活。

霍普菲爾德網(wǎng)的興起

與明斯基和派珀特的斷言相反的是,神經(jīng)網(wǎng)絡(luò)研究人員多年來(lái)一直認(rèn)為,神經(jīng)網(wǎng)絡(luò)能夠展現(xiàn)出新的能力,并且解決羅森布拉特感知器的問(wèn)題,但前提是在網(wǎng)絡(luò)輸入和輸出之間放置額外的“隱含”神經(jīng)元層。不幸的是,沒(méi)人知道如何訓(xùn)練這些多層神經(jīng)網(wǎng)絡(luò)。著名物理學(xué)家約翰?霍普菲爾德(John Hopfield)為具體應(yīng)當(dāng)如何做提供了建議。

霍普菲爾德對(duì)當(dāng)時(shí)人工智能的主流形式是什么并不感興趣。他說(shuō):“我從未深入研究過(guò)人工智能領(lǐng)域到底發(fā)生了什么。人工智能并不能解決現(xiàn)實(shí)世界里的問(wèn)題。我認(rèn)為沒(méi)必要去了解它。” 然而,多年以后,他一直苦苦追尋被他稱(chēng)作“需要用一生的時(shí)間去研究的問(wèn)題”。由于對(duì)人類(lèi)大腦十分感興趣,他考慮的問(wèn)題涵蓋范圍廣泛,從靈長(zhǎng)類(lèi)神經(jīng)解剖學(xué)到昆蟲(chóng)飛行的行為,再到大鼠海馬的學(xué)習(xí)乃至阿茲海默癥的治療。有一段時(shí)間,霍普菲爾德對(duì)細(xì)胞自動(dòng)機(jī)和自我復(fù)制的機(jī)器人的前景十分著迷。然而,幾個(gè)月的研究最終還是走進(jìn)了一條死胡同。

霍普菲爾德說(shuō):“放棄一個(gè)錯(cuò)誤的思想十分困難,畢竟我們已經(jīng)研究一年了?!钡?,在計(jì)算機(jī)內(nèi)部創(chuàng)造一個(gè)生命模型的想法卻一直都在。他對(duì)一個(gè)想法十分著迷,即用神經(jīng)網(wǎng)絡(luò)完成大腦能夠迅速且輕松完成但計(jì)算機(jī)卻不能完成的任務(wù)?;羝辗茽柕伦罱K選擇了聯(lián)想記憶,聯(lián)想記憶是指大腦如何以交互的方式工作,也就是看見(jiàn)一個(gè)人就能聯(lián)想起他的名字,或者聽(tīng)到他的名字就能想起他的長(zhǎng)相。聯(lián)想記憶背后的數(shù)學(xué)運(yùn)算使霍普菲爾德想到“自旋系統(tǒng)”的數(shù)學(xué)運(yùn)算,該運(yùn)算描述的是固體磁性的復(fù)雜形式。他的腦海中突然產(chǎn)生了一個(gè)想法?;羝辗茽柕禄貞浀溃骸吧窠?jīng)生物學(xué)和我所了解的物理系統(tǒng)之間突然產(chǎn)生了一種聯(lián)系。一個(gè)月之后,我已經(jīng)開(kāi)始寫(xiě)論文了?!?/p>

1982 年這篇論文發(fā)表后,一種全新的神經(jīng)網(wǎng)絡(luò)產(chǎn)生了?;羝辗茽柕戮W(wǎng)絡(luò)比羅森布拉特的感知器中的單層模擬神經(jīng)元復(fù)雜得多。他的思想再次激發(fā)了人們對(duì)神經(jīng)網(wǎng)絡(luò)的熱情,這也使他成為這一過(guò)程中出人意料的英雄。加州理工學(xué)院的一組追隨者開(kāi)始以“霍普集會(huì)”(Hop-Fest)的名義召開(kāi)會(huì)議?;羝辗茽柕碌陌l(fā)現(xiàn)吸引了一些世界上最偉大的理論物理學(xué)家參與到神經(jīng)網(wǎng)絡(luò)的研究當(dāng)中。該領(lǐng)域的研究人員多年來(lái)頭一次感覺(jué)到熱血沸騰。

然而,事情并沒(méi)有我們想象得那么容易。正如我們?cè)诘谝徽轮锌吹降模?0世紀(jì)80年代早期是“專(zhuān)家系統(tǒng)”的天下,資金也是空前的充裕。盡管后來(lái)這些“專(zhuān)家系統(tǒng)”的發(fā)展將遭遇困境,但在當(dāng)時(shí)卻是十分強(qiáng)大,人們根本不認(rèn)為它們會(huì)失敗。世界領(lǐng)先的神經(jīng)網(wǎng)絡(luò)專(zhuān)家特里?謝伊諾斯基(Terry Sejnowski)當(dāng)時(shí)正在普林斯頓大學(xué)讀霍普菲爾德的博士,他回憶道:“我們當(dāng)時(shí)好像是生活在恐龍時(shí)代的只有毛皮的哺乳動(dòng)物,在這些長(zhǎng)著麟甲的巨獸的腳下混日子,他們有數(shù)百萬(wàn)美元的機(jī)器和龐大的預(yù)算。那時(shí),所有人都專(zhuān)注于計(jì)算邏輯,但是我們明白,他們忽視了推動(dòng)人工智能向前發(fā)展所面臨的真正困難。”

幸運(yùn)的是,神經(jīng)網(wǎng)絡(luò)吸引了許多年輕且富有熱情的研究人員,其中就包括圣地亞哥加州大學(xué)的認(rèn)知科學(xué)家戴維?魯梅爾哈特(David Rumelhart)和詹姆斯?麥克蘭德(James McClelland),他們成立了一個(gè)“并行分布處理”小組,并產(chǎn)生了令人難以置信的影響力。

說(shuō)到這里就不得不提到另外一個(gè)人,他就是杰夫?辛頓(Geoff Hinton)。

神經(jīng)網(wǎng)絡(luò)的守護(hù)神

杰夫?辛頓出生于1947 年,是現(xiàn)代神經(jīng)網(wǎng)絡(luò)最重要的人物之一。作為一名謙遜的英國(guó)計(jì)算機(jī)科學(xué)家,他對(duì)其所在領(lǐng)域的發(fā)展產(chǎn)生的影響很少有人能企及。他出生于一個(gè)數(shù)學(xué)家家庭:他的曾祖父是著名的邏輯學(xué)家喬治?布爾(George Boole),他的布爾代數(shù)曾為現(xiàn)代計(jì)算機(jī)科學(xué)奠定了基礎(chǔ)。另一位親戚是數(shù)學(xué)家查爾斯?霍華德?辛頓(Charles Howard Hinton),因提出“四維空間”這一理念而聞名,阿萊斯特?克勞利(Aleister Crowley)在其小說(shuō)《月之子》中曾經(jīng)兩次提到了辛頓。

辛頓說(shuō):“我一直對(duì)人類(lèi)如何思考以及大腦如何工作很感興趣。”上學(xué)時(shí),一個(gè)同學(xué)說(shuō)大腦儲(chǔ)存記憶的方式和3D 全息圖像儲(chǔ)存光源信息的方式是一樣的。要想創(chuàng)建一個(gè)全息圖,人們會(huì)將多個(gè)光束從一件物品上反射回來(lái),然后將相關(guān)信息記錄在一個(gè)龐大的數(shù)據(jù)庫(kù)中。大腦也是這樣工作的,只是將光束換成了神經(jīng)元。由于這一發(fā)現(xiàn),辛頓在劍橋大學(xué)選擇了研究哲學(xué)和心理學(xué),之后又在蘇格蘭愛(ài)丁堡大學(xué)研究人工智能。辛頓在20 世紀(jì)70 年代中期來(lái)到寒冷的愛(ài)丁堡,人工智能領(lǐng)域遭遇的首個(gè)冬天幾乎在同一時(shí)期到來(lái)。盡管傳統(tǒng)人工智能剛剛遭受打擊,但辛頓的博士導(dǎo)師仍急于讓他遠(yuǎn)離神經(jīng)網(wǎng)絡(luò)。辛頓說(shuō):“他一直試著讓我放棄神經(jīng)網(wǎng)絡(luò)的研究并投入到符號(hào)人工智能領(lǐng)域。為了能夠有更多時(shí)間研究神經(jīng)網(wǎng)絡(luò),我必須不斷和他討價(jià)還價(jià)?!毙令D并沒(méi)有獲得其他的支持。學(xué)生們認(rèn)為他是瘋了才會(huì)在明斯基和派珀特完全否認(rèn)神經(jīng)網(wǎng)絡(luò)后還繼續(xù)研究。辛頓在愛(ài)丁堡期間,明斯基的學(xué)生帕特里克?溫斯頓(Patrick Winston)出版了一本早期人工智能教材。書(shū)中記載著有關(guān)神經(jīng)網(wǎng)絡(luò)的內(nèi)容:

許多古希臘人都支持蘇格拉底的一個(gè)觀點(diǎn),即深?yuàn)W且令人費(fèi)解的思想是上帝創(chuàng)造的。如今,對(duì)這些漂泊無(wú)定的人而言,甚至概率神經(jīng)元都相當(dāng)于上帝。很有可能的是,神經(jīng)元行為的隨機(jī)性的提高是癲癇病患者和醉酒的人的問(wèn)題,而不是聰明人的優(yōu)勢(shì)。

人們對(duì)溫斯頓的思想十分不屑,但是他當(dāng)時(shí)對(duì)神經(jīng)網(wǎng)絡(luò)的類(lèi)似于宗教信仰般的看法并不是完全錯(cuò)誤的。辛頓對(duì)人腦必須以某種方式工作這一認(rèn)識(shí)十分欣慰,很明顯,這是無(wú)法用傳統(tǒng)的符號(hào)人工智能來(lái)解釋的。他說(shuō):“大多數(shù)常識(shí)推理都是憑直覺(jué)或以類(lèi)比的方式做出的,其中并不涉及意識(shí)推理?!毙令D認(rèn)為,傳統(tǒng)人工智能的錯(cuò)誤之處在于:其認(rèn)為,任何事都是由一系列基本規(guī)則和有意識(shí)推理組成的。對(duì)符號(hào)人工智能研究人員來(lái)說(shuō),如果我們不能理解某一部分的意識(shí),這是因?yàn)槲覀冞€沒(méi)有弄懂其背后的推理。

畢業(yè)以后,辛頓暫時(shí)在英國(guó)蘇塞克斯從事博士后工作,之后收到了一份來(lái)自美國(guó)的工作邀請(qǐng)。于是,辛頓打點(diǎn)行裝,搬到了加州大學(xué),不久以后,又搬到了卡內(nèi)基–梅隆大學(xué)。在接下來(lái)的幾年里,他一直積極努力在神經(jīng)網(wǎng)絡(luò)領(lǐng)域取得開(kāi)創(chuàng)性進(jìn)展,即便到了今天,其成就仍對(duì)人工智能的研究產(chǎn)生著影響。

他最重要的貢獻(xiàn)之一,要算是他對(duì)另一位研究人員戴維?魯梅爾哈特的幫助,幫助他再次發(fā)現(xiàn)“反向傳播”流程,這大概是神經(jīng)網(wǎng)絡(luò)中最重要的算法,之后他們首次以可信的方式證明,“反向傳播”使神經(jīng)網(wǎng)絡(luò)能夠創(chuàng)建屬于自己的內(nèi)部表征。當(dāng)輸出與創(chuàng)造者希望的情況不符時(shí),“反向傳播”使神經(jīng)網(wǎng)絡(luò)能夠調(diào)節(jié)其隱藏層。發(fā)生這種情況時(shí),神經(jīng)網(wǎng)絡(luò)將創(chuàng)建一個(gè)“錯(cuò)誤信號(hào)”,該信號(hào)將通過(guò)神經(jīng)網(wǎng)絡(luò)傳送回輸入節(jié)點(diǎn)。隨著錯(cuò)誤一層層傳遞,網(wǎng)絡(luò)的權(quán)重也隨之改變,這樣就能夠?qū)㈠e(cuò)誤最小化。試想一下,有一個(gè)神經(jīng)網(wǎng)絡(luò)能夠識(shí)別圖像,如果在分析一張狗的圖片時(shí),神經(jīng)網(wǎng)絡(luò)錯(cuò)誤地判斷為這是一張貓的圖片,那么“反向傳播”將使其退回到前面的層,每層都會(huì)對(duì)輸入連接的權(quán)重做出輕微調(diào)整,這樣一來(lái),下次就能夠獲得正確的答案。

20 世紀(jì)80 年代創(chuàng)建的“NETtalk”項(xiàng)目是“反向傳播”的一個(gè)經(jīng)典案例。NETtalk的一個(gè)共同創(chuàng)建者特里?謝伊諾斯基將其描述為用于了解電腦是否能夠?qū)W習(xí)大聲朗讀書(shū)面文字的“夏季項(xiàng)目”。該項(xiàng)目面臨的最大挑戰(zhàn)在于語(yǔ)言一點(diǎn)也不簡(jiǎn)單。項(xiàng)目剛剛開(kāi)始的時(shí)候,謝伊諾斯基去圖書(shū)館借了一本有關(guān)音韻學(xué)的書(shū),即諾姆?喬姆斯基(Noam Chomsky)和莫里斯?哈雷(Morris Halle)所著的《英語(yǔ)語(yǔ)音模式》。謝伊諾斯基說(shuō):“這本書(shū)里都是各種事情的規(guī)則,例如字母e 出現(xiàn)在單詞末尾的時(shí)候應(yīng)該如何發(fā)音等。書(shū)中提到了例外情況,之后又列舉了例外情況中的例外。英語(yǔ)就是大量的復(fù)雜關(guān)聯(lián)。我們似乎選擇了世界上在規(guī)則性方面最糟糕的語(yǔ)言?!?/p>

一直以來(lái),傳統(tǒng)人工智能都在不斷嘗試將這些單獨(dú)的例子插入到一個(gè)專(zhuān)家系統(tǒng)中。謝伊諾斯基和一位名為查爾斯?羅森伯格(Charles Rosenberg)的語(yǔ)言研究人員決定通過(guò)創(chuàng)建一個(gè)由300個(gè)神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)這一目標(biāo)。當(dāng)時(shí),辛頓正在實(shí)驗(yàn)室訪問(wèn),他建議他們?cè)陧?xiàng)目的最開(kāi)始使用兒童書(shū)籍來(lái)訓(xùn)練該系統(tǒng),這本書(shū)的詞匯量一定要小。起初,這項(xiàng)任務(wù)十分艱難,計(jì)算機(jī)一次只能讀一個(gè)單詞,而他們必須為每個(gè)字母都標(biāo)注正確的音素。例如,字母e在“shed”、“pretty”、“anthem”、“café”或“sergeant”中的發(fā)音各不相同。謝伊諾斯基和羅森伯格每次進(jìn)行說(shuō)明的時(shí)候,他們創(chuàng)建的神經(jīng)網(wǎng)絡(luò)都悄悄地調(diào)節(jié)對(duì)每個(gè)連接的權(quán)重。該系統(tǒng)面臨的最大挑戰(zhàn)是使機(jī)器能夠正確發(fā)出每個(gè)單詞中間部分的音節(jié)。為了做到這一點(diǎn),神經(jīng)網(wǎng)絡(luò)必須使用中間字母左邊和右邊的字母給出的提示。

一天下來(lái),NETtalk已經(jīng)全部掌握了書(shū)中的100個(gè)單詞。這一結(jié)果令他們感到震驚。接下來(lái),他們讓NETtalk使用有20 000個(gè)單詞的韋伯詞典。幸運(yùn)的是,詞典中的所有音素都已經(jīng)標(biāo)注出來(lái)了。他們下午把單詞輸入到系統(tǒng)中,然后就回家休息了。當(dāng)他們第二天早上回到辦公室時(shí),系統(tǒng)已經(jīng)完全掌握了這些單詞。

最后的訓(xùn)練數(shù)據(jù)是一本對(duì)兒童說(shuō)話(huà)內(nèi)容進(jìn)行謄寫(xiě)的書(shū),以及一位語(yǔ)言學(xué)家記錄的兒童發(fā)出的實(shí)際音素的清單。這就意味著,謝伊諾斯基和羅森伯格能夠?qū)⒌谝粋€(gè)謄寫(xiě)本用于輸入層,將第二個(gè)音素清單用于輸出層。使用“反向傳播”以后,NETtalk能夠?qū)W習(xí)如何像孩子那樣說(shuō)話(huà)。一段NETtalk的錄音說(shuō)明了該系統(tǒng)在這方面取得了飛速的進(jìn)展。在訓(xùn)練之初,系統(tǒng)只能夠區(qū)分元音和輔音,其發(fā)出的噪聲則像是歌手表演前做的發(fā)聲練習(xí)。在訓(xùn)練了1 000 個(gè)單詞以后,NETtalk發(fā)出的聲音更接近人類(lèi)發(fā)出的聲音了。謝伊諾斯基說(shuō)道:“我們完全震驚了,尤其是在當(dāng)時(shí)計(jì)算機(jī)的計(jì)算能力還不如現(xiàn)在的手表的情況下。”

聯(lián)結(jié)主義者

有了杰夫?辛頓等人的幫助,神經(jīng)網(wǎng)絡(luò)開(kāi)始蓬勃發(fā)展。當(dāng)時(shí)有一個(gè)傳統(tǒng),那就是繼任的一代都會(huì)給自己重新命名,新研究人員們稱(chēng)自己為“聯(lián)結(jié)主義者”,因?yàn)樗麄儗?duì)復(fù)制大腦中的神經(jīng)聯(lián)結(jié)十分感興趣。到1991 年,僅在美國(guó)就有1 萬(wàn)名活躍的聯(lián)結(jié)理論研究人員。

忽然之間,各個(gè)領(lǐng)域都取得了突破性的進(jìn)展。例如,人們發(fā)明了專(zhuān)門(mén)用于預(yù)測(cè)股市的神經(jīng)網(wǎng)絡(luò)。大多數(shù)情況下,投資公司使用不同的網(wǎng)絡(luò)預(yù)測(cè)不同的股票,然后由交易商來(lái)決定投資哪只股票。然而,有些人在此基礎(chǔ)上更進(jìn)一步,賦予網(wǎng)絡(luò)本身自主權(quán),使其能夠自行買(mǎi)賣(mài)。無(wú)獨(dú)有偶,金融領(lǐng)域迅速涉足電子游戲領(lǐng)域,時(shí)刻準(zhǔn)備著為人工智能研究人員進(jìn)行投資。算法交易時(shí)代轟轟烈烈地開(kāi)始了。

當(dāng)時(shí)神經(jīng)網(wǎng)絡(luò)領(lǐng)域的另一個(gè)引人注目的應(yīng)用就是自動(dòng)駕駛汽車(chē)。發(fā)明自動(dòng)駕駛汽車(chē)一直是技術(shù)人員的夢(mèng)想。1925年,發(fā)明家弗朗西斯?霍迪納(Francis Houdina)展示了一款無(wú)線(xiàn)電控制的汽車(chē),他操控汽車(chē)行駛在曼哈頓的街頭,而車(chē)中無(wú)須人來(lái)操控方向盤(pán)。之后,自動(dòng)駕駛汽車(chē)測(cè)試使用導(dǎo)絲和車(chē)載傳感器使汽車(chē)能夠按照路上畫(huà)好的白線(xiàn)行駛,或通過(guò)識(shí)別出地下電纜發(fā)出的交流電行駛。1969年,約翰?麥卡錫發(fā)表了一篇標(biāo)題為“計(jì)算機(jī)控制汽車(chē)”的論文極具挑戰(zhàn)性。麥卡錫所提議的方案基本上是設(shè)計(jì)一個(gè)“自動(dòng)化司機(jī)”。他的項(xiàng)目需要一個(gè)能夠進(jìn)行公路導(dǎo)航的計(jì)算機(jī),計(jì)算機(jī)上僅帶有一個(gè)電視攝像機(jī)來(lái)輸入信息,該輸入使用與人類(lèi)司機(jī)相同的視覺(jué)輸入。麥卡錫假設(shè)用戶(hù)能夠使用鍵盤(pán)輸入地點(diǎn),并要求汽車(chē)立即載他們過(guò)去。緊急情況下,用戶(hù)可以使用額外的命令變更目的地,要求汽車(chē)停在洗手間或賓館門(mén)口,在有緊急情況時(shí)減速或加速。

類(lèi)似的項(xiàng)目直到20世紀(jì)90年代早期才得以實(shí)現(xiàn),當(dāng)時(shí)卡內(nèi)基—梅隆大學(xué)的研究人員迪安?波默洛(Dean Pomerleau)寫(xiě)了一篇激動(dòng)人心的博士論文,文章介紹了如何將“反向傳播”應(yīng)用于無(wú)人駕駛汽車(chē)。波默洛稱(chēng)其開(kāi)發(fā)的神經(jīng)網(wǎng)絡(luò)為神經(jīng)網(wǎng)絡(luò)中的無(wú)人駕駛汽車(chē)或ALVINN(控制器),并將道路上的原始圖像作為輸入信息,并實(shí)時(shí)輸出轉(zhuǎn)向控制信息。當(dāng)時(shí),還有許多其他傳統(tǒng)人工智能博士正在研究類(lèi)似的自動(dòng)駕駛項(xiàng)目。這些非神經(jīng)網(wǎng)絡(luò)的方法主要通過(guò)嚴(yán)謹(jǐn)?shù)南袼胤治鰧⒏鲌D像劃分為不同類(lèi)別,例如“道路”和“非道路”。然而,與許多傳統(tǒng)人工智能面臨的問(wèn)題一樣,計(jì)算機(jī)很難將信息解析為像實(shí)時(shí)路況那樣的非結(jié)構(gòu)化信息。假如一輛自動(dòng)駕駛汽車(chē)依靠這一技術(shù)進(jìn)行危險(xiǎn)的高速行駛,發(fā)生事故的可能性是很大的。波默洛回憶道:“它們可能將樹(shù)影或者樹(shù)木本身識(shí)別成道路,這樣車(chē)輛就會(huì)朝著樹(shù)直接開(kāi)過(guò)去,而不是避讓?!?/p>

為了訓(xùn)練ALVINN,駕駛員只需簡(jiǎn)單地駕駛一段路程。波默洛說(shuō)道:“駕駛員只需駕駛2—3 分鐘,ALVINN 系統(tǒng)就能夠了解并更新反向傳播網(wǎng)絡(luò)的權(quán)重。結(jié)束駕駛時(shí),駕駛員可以放開(kāi)方向盤(pán),系統(tǒng)會(huì)繼續(xù)駕駛車(chē)輛開(kāi)始一段新的路程。”波默洛的發(fā)明只關(guān)注了方向,卻無(wú)法控制速度或避開(kāi)障礙物,這兩點(diǎn)必須由駕駛員來(lái)完成。盡管如此,波默洛也取得了巨大的成功,1995 年,龐蒂克小型貨車(chē)上安裝了從舊汽車(chē)上回收的ALVINN 的升級(jí)版——RALPH(快速調(diào)節(jié)橫向位置處理器)。波默洛和一位名為托德?約赫姆(Todd Jochem)的研究人員為其配備了一臺(tái)電腦、640×480 像素的彩色照相機(jī)、全球定位系統(tǒng)接收器和光纖陀螺儀,之后他們駕駛該車(chē)橫穿美國(guó)。借鑒了1986 年“攜手美國(guó)” (Hands Across America)慈善活動(dòng)的名稱(chēng),他們將這次旅行稱(chēng)為“橫穿美國(guó)”(NO Hands Across America)。他們?cè)诼飞腺u(mài)10 美元一件的襯衫,用于支付食宿費(fèi)用。最后,這輛汽車(chē)一共行駛了2 797英里,途經(jīng)匹茲堡、賓夕法尼亞、圣地亞哥、加利福尼亞,中間還穿過(guò)了胡佛水壩,這一切都是汽車(chē)自動(dòng)駕駛完成的?!渡虡I(yè)周刊》的一位記者在報(bào)道這一事件時(shí),一名堪薩斯州騎兵要求其將車(chē)停到路邊。而波默洛和約赫姆乘自動(dòng)駕駛汽車(chē)旅行,甚至連雙手都無(wú)須握住方向盤(pán)。

15年后,谷歌在2010年10月發(fā)布了自己的無(wú)人駕駛汽車(chē)項(xiàng)目。然而,我們?nèi)砸兄x波默洛在神經(jīng)網(wǎng)絡(luò)領(lǐng)域做出的開(kāi)創(chuàng)性貢獻(xiàn),他證明了自己的觀點(diǎn)。

歡迎來(lái)到深度學(xué)習(xí)領(lǐng)域

神經(jīng)網(wǎng)絡(luò)在21世紀(jì)中葉迎來(lái)了又一次重大進(jìn)展。2005年,杰夫?辛頓在多倫多大學(xué)任教,此前不久,他一直在英國(guó)倫敦大學(xué)學(xué)院工作,在那里建立了蓋茨比計(jì)算神經(jīng)科學(xué)組。這時(shí),人們已經(jīng)清楚地認(rèn)識(shí)到,互聯(lián)網(wǎng)能夠生成大量數(shù)據(jù)集,這在10年前是想都不敢想的。如果說(shuō)以前的研究人員面臨的問(wèn)題是沒(méi)有足夠的數(shù)據(jù)來(lái)對(duì)系統(tǒng)進(jìn)行適當(dāng)?shù)挠?xùn)練,那么互聯(lián)網(wǎng)的興起則大大改善了這一狀況。如今,據(jù)國(guó)際數(shù)據(jù)公司等研究公司估測(cè),目前網(wǎng)上在線(xiàn)數(shù)據(jù)量約為4.4澤字節(jié)a。記者史蒂夫?洛爾(Steve Lohr)在其所著的極為有趣的《數(shù)據(jù)論》一書(shū)中指出,如果能將這些數(shù)據(jù)輸入iPad Air(蘋(píng)果超薄平板電腦)中,那么產(chǎn)生的堆棧將能夠覆蓋地球到月球距離的2/3。

然而,就像地球雖然有大量的水,但并不是所有水都可以喝一樣,這些數(shù)據(jù)中好多都是未標(biāo)記的。當(dāng)數(shù)據(jù)集較小時(shí),研究人員可以將主要精力放在正確標(biāo)記所有數(shù)據(jù)上,這對(duì)訓(xùn)練系統(tǒng)來(lái)說(shuō)更加有用。然而,隨著數(shù)據(jù)量的增加,研究人員就無(wú)法再這樣做。例如,2013 年3 月,網(wǎng)絡(luò)相冊(cè)Flickr 共有8 700 萬(wàn)注冊(cè)用戶(hù),他們每天上傳超過(guò)350 萬(wàn)張新圖片。從理論上看,這對(duì)那些想要建造一個(gè)能夠識(shí)別圖片的神經(jīng)網(wǎng)絡(luò)的人們來(lái)說(shuō)是一個(gè)天大的好消息,但同樣也提出了挑戰(zhàn)。正如我們所看到的,訓(xùn)練神經(jīng)網(wǎng)絡(luò)最簡(jiǎn)單的方法就是向其展示大量圖片,然后指出每張圖片都是什么。通過(guò)標(biāo)記圖片,訓(xùn)練員既提供了輸入(圖片),又提供了輸出(描述)。神經(jīng)網(wǎng)絡(luò)就可以反向傳播,以糾正錯(cuò)誤。這就是我們所了解的“監(jiān)督式學(xué)習(xí)”。但是,流通中還有許多未標(biāo)記或沒(méi)有正確標(biāo)記的圖片,計(jì)算機(jī)如何對(duì)其進(jìn)行識(shí)別呢?

幸運(yùn)的是,杰夫?辛頓掀起了一場(chǎng)“非監(jiān)督式學(xué)習(xí)”的革命,這種學(xué)習(xí)方式無(wú)須向計(jì)算機(jī)提供任何標(biāo)記。機(jī)器能夠訪問(wèn)的只有輸入,無(wú)須解釋它看到的是什么。首先,這聽(tīng)起來(lái)像是機(jī)器無(wú)法通過(guò)這種方式學(xué)習(xí)。如果沒(méi)有得到明確的解釋?zhuān)词故亲钪悄艿纳窠?jīng)網(wǎng)絡(luò)也不會(huì)知道某物到底是什么。實(shí)際上,辛頓發(fā)現(xiàn)的是“非監(jiān)督式學(xué)習(xí)”可以用來(lái)訓(xùn)練上層特征,而且每次只能訓(xùn)練一層。這一發(fā)現(xiàn)成為“深度學(xué)習(xí)”的催化劑,而“深度學(xué)習(xí)”就是當(dāng)前人工智能最炙手可熱的領(lǐng)域。

我們可以將深度學(xué)習(xí)網(wǎng)絡(luò)想象成工廠的一條生產(chǎn)線(xiàn)。輸入原材料后,它們將隨著傳送帶向下傳遞,后續(xù)的各個(gè)站點(diǎn)或?qū)訒?huì)分別提取不同的高級(jí)特性。為了繼續(xù)完成一個(gè)圖像識(shí)別網(wǎng)絡(luò)的案例,第一層將用來(lái)分析像素亮度。下一層將根據(jù)相似像素的輪廓來(lái)確定圖中存在的所有邊界。之后,第三層將用來(lái)識(shí)別質(zhì)地和形狀等。到達(dá)第四層或第五層時(shí),深度學(xué)習(xí)網(wǎng)絡(luò)已經(jīng)創(chuàng)建了復(fù)雜特性檢測(cè)器。這時(shí),它就能夠了解4個(gè)輪子、擋風(fēng)玻璃和排氣管通常是同時(shí)出現(xiàn)的,眼睛、鼻子和嘴也是同時(shí)出現(xiàn)的。它不知道的僅僅是汽車(chē)和人臉都是什么樣的。深度學(xué)習(xí)網(wǎng)絡(luò)能夠識(shí)別的許多特性可能都和手頭的任務(wù)無(wú)關(guān),但是其中有一些特性卻是和手頭任務(wù)高度相關(guān)的。

辛頓解釋道:“訓(xùn)練這些特性檢測(cè)器時(shí),每次訓(xùn)練一層,這一層都試圖在下面一層找到結(jié)構(gòu)模式。之后,就可以在頂部貼上標(biāo)簽并使用反向傳播來(lái)進(jìn)行微調(diào)?!苯Y(jié)果深深震撼了人工智能界。辛頓回憶道:“其中涉及一些數(shù)學(xué)問(wèn)題,這總會(huì)給人們留下深刻的印象。”

有關(guān)深度學(xué)習(xí)的消息迅速傳開(kāi)。辛頓實(shí)驗(yàn)室的兩名成員喬治?達(dá)爾(George Dahl)和阿卜杜勒–拉赫曼?穆罕默德(Abdel-rahman Mohamed)迅速論證了該系統(tǒng)不僅能夠進(jìn)行圖像識(shí)別,還能夠進(jìn)行語(yǔ)音識(shí)別。2009年,倆人將其新創(chuàng)建的語(yǔ)音識(shí)別神經(jīng)網(wǎng)絡(luò)與已經(jīng)使用了30多年的行業(yè)標(biāo)準(zhǔn)工具放到一起一較高下,結(jié)果是,深度學(xué)習(xí)網(wǎng)絡(luò)獲得了勝利。這時(shí),谷歌邀請(qǐng)辛頓的一位博士生納瓦迪普?杰特列(NavdeepJaitly)修補(bǔ)谷歌的語(yǔ)音識(shí)別算法。看了一眼之后,他建議用深度神經(jīng)網(wǎng)絡(luò)取代整個(gè)系統(tǒng)。盡管一開(kāi)始持懷疑態(tài)度,但杰特列的老板最終同意讓他嘗試一下。事實(shí)證明,新的程序比谷歌精心調(diào)試數(shù)年的系統(tǒng)表現(xiàn)還要出色。2012 年,谷歌將深度學(xué)習(xí)語(yǔ)音識(shí)別程序嵌入安卓移動(dòng)平臺(tái),錯(cuò)誤率與之前相比立刻下降了25%。

那年夏天,辛頓終于收到了谷歌的電話(huà)。這個(gè)搜索巨頭邀請(qǐng)他夏天到位于加利福尼亞州山景城的校園工作。盡管辛頓當(dāng)時(shí)已經(jīng)64 歲了,谷歌卻將他定為“實(shí)習(xí)生”,因?yàn)閱T工必須嚴(yán)格服從公司政策,即必須在公司工作好幾個(gè)月之后才能被授予“訪問(wèn)科學(xué)家”的頭銜。盡管如此,辛頓仍然加入了由20 歲出頭的年輕人組成的實(shí)習(xí)生組。他甚至還戴上了新實(shí)習(xí)生們專(zhuān)用的上面帶有螺旋槳圖案的帽子,被稱(chēng)作“新谷歌人”(Nooglers)。辛頓說(shuō): “我一定是史上最老的實(shí)習(xí)生?!碑?dāng)時(shí),他開(kāi)玩笑似的表示,那些并不知道他是誰(shuí)的年輕同事肯定是把他當(dāng)作“老笨蛋”了。

辛頓在谷歌的工作涉及為其他潛在的應(yīng)用提出有關(guān)深度學(xué)習(xí)的建議。那年夏天的工作進(jìn)展得十分順利,第二年,谷歌正式聘用了辛頓。除他之外,谷歌還聘請(qǐng)了他的兩名研究生,辛頓和這兩名研究生共同創(chuàng)建了一家名為“DNNresearch”的公司。辛頓在一篇聲明中寫(xiě)道:“我會(huì)繼續(xù)在多倫多大學(xué)兼職任教,在那里我還有很多出色的研究生,但是在谷歌我能夠看到我們?nèi)绾翁幚沓笮陀?jì)算?!痹谏窠?jīng)網(wǎng)絡(luò)領(lǐng)域孤獨(dú)地耕耘了30年后,杰夫?辛頓最終在世界最大的人工智能公司發(fā)揮了重要作用。

1998年,蘋(píng)果公司推出了其外觀線(xiàn)條呈圓形的iMac電腦;《哈利?波特》風(fēng)靡世界;第一款移動(dòng)MP3播放器上市;一位來(lái)自雷丁大學(xué)控制論專(zhuān)業(yè)的44歲教授在這一年進(jìn)行了一項(xiàng)非同尋常的運(yùn)算。凱文?沃維克(Kevin Warwick)教授進(jìn)行了一個(gè)非急需外科手術(shù),目的是將一個(gè)包在玻璃管內(nèi)的硅片植入自己的左臂皮膚之下。一旦植入人體,這款射頻識(shí)別設(shè)備(RFID)的芯片發(fā)出的無(wú)線(xiàn)電信號(hào),就能經(jīng)由實(shí)驗(yàn)室周?chē)奶炀€(xiàn),隨即傳入能夠控制沃維克周?chē)h(huán)境的中央計(jì)算機(jī)?!霸冢ㄎ业膶?shí)驗(yàn)室)的主入口處,當(dāng)我進(jìn)門(mén)時(shí),一個(gè)由計(jì)算機(jī)操作的音箱發(fā)出‘你好’的聲音?!焙髞?lái)凱文?沃維克記下了他的體驗(yàn):“計(jì)算機(jī)檢測(cè)到我進(jìn)入大樓的過(guò)程,當(dāng)我走近實(shí)驗(yàn)室的時(shí)候,為我開(kāi)了門(mén),點(diǎn)亮了燈。芯片植入體內(nèi)后的9天里,我僅僅沿著特定的方向行進(jìn),就可以觸發(fā)周?chē)奈矬w自己行動(dòng)?!?/p>

約20 年后再來(lái)看,沃維克的這項(xiàng)實(shí)驗(yàn)依然震憾人心、發(fā)人深省。與沃維克職業(yè)生涯的其他事情相比而言,這項(xiàng)實(shí)驗(yàn)最有意義。然而,在過(guò)去的幾十年里,我們對(duì)此事的驚詫程度可能多多少少發(fā)生了改變。盡管回避有人愿意采取這種侵入式手術(shù)的原因依然很容易,但關(guān)于為什么有人想這么做的問(wèn)題已經(jīng)不再重要。寫(xiě)這篇文章的時(shí)候,我的手腕上帶著一塊42 毫米的不銹鋼蘋(píng)果手表,搭配了米蘭風(fēng)格的表帶。這款表價(jià)格為599 英鎊,它能實(shí)現(xiàn)的功能遠(yuǎn)遠(yuǎn)超過(guò)凱文?沃維克在其植入式射頻識(shí)別設(shè)備上所設(shè)想的功能。一旦我收到一條短信或一個(gè)電話(huà),或者如果我的朋友在圖片分享網(wǎng)站Instagram貼了一張新圖,我只需要看看手表就一目了然。而且在超市購(gòu)物時(shí),我可以用手表刷卡支付。同樣,我也可以用手表打開(kāi)世界各地酒店的房門(mén)。外出的時(shí)候,手表連續(xù)發(fā)出的嘀嗒聲和震動(dòng)可以告訴我應(yīng)該走哪條路。一串嘀嗒聲提醒我右轉(zhuǎn),另一串嘀嗒聲則提醒我左轉(zhuǎn)。第一次震動(dòng)表明我的旅程結(jié)束了,而第二次震動(dòng)則告訴我到達(dá)目的地了。所有這些功能并不需要進(jìn)行侵入式手術(shù)。

如果你正在閱讀這本書(shū),你很可能對(duì)“智能設(shè)備”這個(gè)名詞并不陌生。除了種類(lèi)日益繁多的智能手表,如Pebble(一款智能手表)、Android Wear(安卓的可穿戴應(yīng)用程序)及其他設(shè)備,還有智能跑鞋,智能跑鞋能夠記錄步數(shù)、心跳頻率,并使用嵌入式屏幕傳達(dá)你的情緒,比如使用笑臉和愛(ài)心等符號(hào)。智能冰箱不但可以記錄溫度與冷藏的食品,還會(huì)在你最喜歡的食物就要吃完了或?qū)⒁冑|(zhì)的時(shí)候通知你。還有智能安全攝像頭、智能廚房秤、智能燈泡、智能馬桶、智能尿片和智能牙刷。2014年,谷歌以驚人的32億美元現(xiàn)金收購(gòu)了最著名的智能設(shè)備公司Nest Labs。Nest Labs由蘋(píng)果前雇員馬特?羅杰斯(Matt Rogers)和“iPod之父”托尼?法德?tīng)枺═ony Fadell)聯(lián)手創(chuàng)立,打造了多款可以聯(lián)網(wǎng)的智能設(shè)備,其中最重要的是智能恒溫器,通過(guò)一段時(shí)間的學(xué)習(xí),這款恒溫器可以了解用戶(hù)的習(xí)慣,并相應(yīng)自動(dòng)地調(diào)節(jié)溫度。

傳感器、人工智能算法與通過(guò)Wi-Fi(無(wú)線(xiàn)局域網(wǎng)技術(shù))實(shí)現(xiàn)的持續(xù)聯(lián)網(wǎng)狀態(tài)相結(jié)合,使這些設(shè)備變得“智能化”。以前,接入網(wǎng)絡(luò)而變得智能是一件令人們不得不“大費(fèi)周折”的事。今天,我們的在線(xiàn)連接很少出現(xiàn)中斷的現(xiàn)象??偟膩?lái)說(shuō),這些進(jìn)展使我們從用戶(hù)那里收集數(shù)據(jù)、分享數(shù)據(jù),并且?guī)椭脩?hù)理解數(shù)據(jù)成為可能?!皵?shù)據(jù)賦予我們力量,”世界第一個(gè)聯(lián)網(wǎng)電動(dòng)牙刷生產(chǎn)商Kolibree的營(yíng)銷(xiāo)與戰(zhàn)略總裁勒妮?布洛杰特(Renee Blodgett)表示:“這是我們第一次將刷牙方式、刷牙部位以及刷牙時(shí)哪里需要改進(jìn)結(jié)合在一起?!痹谖覀儞碛兄悄苎浪⒅埃ㄟ@對(duì)我而言,就是現(xiàn)在),我們不得不依靠一年前進(jìn)行年度檢查時(shí)牙醫(yī)的反饋。而通過(guò)智能牙刷,我們可以實(shí)時(shí)獲得這些信息。

智能設(shè)備成為現(xiàn)代生活的必需品

現(xiàn)在,我們處于未來(lái)技術(shù)的“早期采用”階段,未來(lái)技術(shù)的支持者聲稱(chēng),這些技術(shù)將像19 世紀(jì)末、20 世紀(jì)初電力時(shí)代的到來(lái)一樣,帶來(lái)一場(chǎng)巨大的變革。1879 年,美國(guó)發(fā)明家托馬斯?愛(ài)迪生已經(jīng)能夠在加利福尼亞州門(mén)洛帕克市自己的實(shí)驗(yàn)室里生產(chǎn)可靠耐用的電燈泡了。到了20 世紀(jì)30 年代,美國(guó)90% 的城市居民,以及越來(lái)越多的農(nóng)村地區(qū)的人們都可以利用這項(xiàng)技術(shù)。隨著開(kāi)關(guān)的撥動(dòng),電賦予人們控制光的能力,人們能夠控制自己家和工作場(chǎng)所的光線(xiàn)。這打破了生活的正常生物節(jié)奏,使人們能夠隨心所欲地安排自己的工作和娛樂(lè)時(shí)間。隨之而來(lái)的電網(wǎng)引入了大量的連接設(shè)備,創(chuàng)造了工業(yè),并永遠(yuǎn)地改變了人們的生活。

美國(guó)西爾斯百貨(當(dāng)時(shí)一家初具規(guī)模的郵購(gòu)公司)1917 年春季的商品目錄使公眾知道“電不僅僅可以用來(lái)照明”。事實(shí)確實(shí)如此。鐵熨斗、洗衣機(jī)和真空吸塵器使洗衣與清潔更加容易。由于效率的提高,不但清潔度上升了,而且家庭雇用的家政人員數(shù)量也越來(lái)越少。電冰箱取代了冰盒,使食物更加易于長(zhǎng)期保存。天熱的時(shí)候,我們可以使用電扇,而天冷的時(shí)候,我們可以使用輻射發(fā)熱器,這是人類(lèi)第一次能夠控制氣溫。電力為大眾帶來(lái)了電話(huà)與飛機(jī),并在即時(shí)通信年代,受到了新聞與娛樂(lè)行業(yè)的追捧。1938 年,美國(guó)前總統(tǒng)富蘭克林?羅斯福在佐治亞州巴恩斯維爾演講時(shí)宣稱(chēng),電力是現(xiàn)代生活的必需品。

我們能否開(kāi)啟一條同樣的智能設(shè)備變革之旅?或許是可以的。當(dāng)然,移動(dòng)無(wú)線(xiàn)網(wǎng)絡(luò)的崛起意味著設(shè)備的使用比以前更加方便?!拔锫?lián)網(wǎng)”(這個(gè)定義有時(shí)候顯得相當(dāng)笨拙)之夢(mèng)是,智能硬件要像一個(gè)世紀(jì)以前的電力那樣,成為21世紀(jì)重要的“現(xiàn)代生活的必需品”。那時(shí)我們進(jìn)入了電氣化時(shí)代,現(xiàn)在我們將進(jìn)入互聯(lián)時(shí)代。

當(dāng)前,智能設(shè)備領(lǐng)域充斥著大肆炒作之風(fēng),愛(ài)立信公司的分析師預(yù)測(cè),到2020年全球?qū)⒂屑s500億臺(tái)智能設(shè)備,相當(dāng)于人均6.8臺(tái)?!斑@不僅是一場(chǎng)進(jìn)化,這還是一場(chǎng)革命?!碧O(píng)果前雇員、現(xiàn)在掌管創(chuàng)業(yè)公司SITU(該公司生產(chǎn)量化卡路里攝入量的智能天平)的邁克爾?格羅特豪斯(Michael Grothaus)表示:“這是自個(gè)人電腦誕生以來(lái),技術(shù)界最激動(dòng)人心的事了?!?/p>

會(huì)思考的事物

1991年,劍橋大學(xué)計(jì)算機(jī)科學(xué)系特洛伊木馬研究室的研究人員提出了一個(gè)新的想法。他們?cè)谧约旱难芯渴抑蟹胖昧艘粋€(gè)共用的咖啡壺,然后決定安裝一臺(tái)攝像機(jī)用以監(jiān)視一天的咖啡用量。研究人員將攝像機(jī)設(shè)定為每秒捕捉一幀,然后將其編碼為灰度級(jí)的JPEG格式文件,最后將圖片文件通過(guò)早期的萬(wàn)維網(wǎng)發(fā)出去。通過(guò)各自的計(jì)算機(jī),該系研究人員可以登錄到“視頻”源中查看壺里是否還有剩余的咖啡,從而省去他們?nèi)ゴ蚩Х鹊臒o(wú)用功。

“‘咖啡俱樂(lè)部’的一些成員位于大樓的其他區(qū)域,他們不得不為打咖啡爬上爬下,如果特洛伊木馬研究室熬夜的黑客們先打了咖啡,那么其他成員打咖啡的結(jié)果常常是無(wú)功而返?!碑?dāng)時(shí)在系里工作的計(jì)算機(jī)科學(xué)家昆汀?斯塔福德– 弗雷澤(Quentin Stafford-Fraser)牢騷滿(mǎn)腹地說(shuō):“這樣打咖啡對(duì)計(jì)算機(jī)科學(xué)研究進(jìn)程造成的中斷,顯然使我們非常苦惱,于是‘XCoffee’(X 咖啡)就這樣誕生了?!?/p>

我之所以提出XCoffee,因?yàn)樗C明了一個(gè)非常重要的觀點(diǎn),即什么是我們認(rèn)為的“智能技術(shù)”。XCoffee也常常被看作智能設(shè)備現(xiàn)代趨勢(shì)的早期例子。某種程度而言,這是真的。與許多最新的智能配件一樣,XCoffee與網(wǎng)絡(luò)連接,因而也成了所謂的“物聯(lián)網(wǎng)”的一部分。但是對(duì)我而言,XCoffee更接近硬件極客所說(shuō)的“黑掉”的范例,“黑掉”這個(gè)術(shù)語(yǔ)就是俗話(huà)說(shuō)的解決棘手問(wèn)題的高明方法。成為今天我們稱(chēng)作智能設(shè)備(麻省理工學(xué)院媒體實(shí)驗(yàn)室稱(chēng)之為“會(huì)思考的事物”)的前提條件是,它必須以一種自我管理的反饋回路而存在,無(wú)須過(guò)多人工干預(yù)就能夠自動(dòng)運(yùn)行。物聯(lián)網(wǎng)并不僅僅把“物”連接到互聯(lián)網(wǎng)。傳統(tǒng)互聯(lián)網(wǎng)使人們能夠搜索、下載音樂(lè)或者閱讀信息。另一方面,物聯(lián)網(wǎng)主要用于非人類(lèi)實(shí)體的交流,這是越來(lái)越多的人熱衷于M2M(機(jī)器對(duì)機(jī)器)交流的原因。

智能設(shè)備應(yīng)該能夠感知自己所處的環(huán)境、識(shí)別特定狀態(tài)、觸發(fā)評(píng)估、產(chǎn)生行為等等,從而形成一個(gè)連續(xù)的環(huán)路。智能設(shè)備的“智能”在于中間的部分,那里負(fù)責(zé)處理感知到的信息,以及如何基于信息采取具體的行動(dòng)。一臺(tái)真正智能的咖啡機(jī)不只是提醒人們咖啡機(jī)空了,而是能夠計(jì)算出使用者可能口渴的時(shí)間,并且自己能及時(shí)重新加滿(mǎn)咖啡,調(diào)制出咖啡成品以滿(mǎn)足使用者的個(gè)體需求。甚至基于無(wú)人控制的桌對(duì)桌(desk-to-desk)送貨也是可能的。

“控制論”簡(jiǎn)史

我們將在本章討論的多數(shù)智能設(shè)備都包含機(jī)器學(xué)習(xí)的元素。正如圍繞人工智能的各種問(wèn)題都可以回溯至數(shù)百年前一樣,關(guān)于具有自我調(diào)節(jié)功能的機(jī)器的想法也同樣如此。早在公元前205年,寓居于埃及亞歷山大港的希臘數(shù)學(xué)家克特西比烏斯就建造了世界上第一臺(tái)能自我控制的設(shè)備??颂匚鞅葹跛沟淖髌肥且慌_(tái)水鐘,其最大特點(diǎn)就是擁有一個(gè)可以保持恒定流速的校正器。這臺(tái)水鐘通過(guò)設(shè)在水缸里的浮子計(jì)時(shí)。水從水缸底部的小孔滴落,浮子就隨著水位下降。每運(yùn)行一單位的時(shí)間,浮子頂端的類(lèi)似于人偶的器械就進(jìn)行一次齒輪機(jī)械操作。克特西比烏斯水鐘有多個(gè)不同版本,在不同版本中,它要么落下一塊卵石,要么鳴響一聲喇叭。

克特西比烏斯水鐘意義重大,因?yàn)樗谰眯缘馗淖兞宋覀儗?duì)人造之物的認(rèn)知。早在克特西比烏斯水鐘之前,人們認(rèn)為只有有生命的東西能夠根據(jù)環(huán)境的變化調(diào)整自己的行為。而克特西比烏斯水鐘誕生之后,自我調(diào)節(jié)反饋控制系統(tǒng)成了我們技術(shù)的一部分。

進(jìn)入20 世紀(jì),影響后世的人工智能先驅(qū)諾伯特?維納(Norbert Wiener)制定了反饋系統(tǒng)的數(shù)學(xué)理論。維納提出一個(gè)設(shè)想:智能行為是接收和處理信息的必然結(jié)果。這個(gè)設(shè)想就是眾所周知的控制論?!岸?zhàn)”期間,當(dāng)維納與其同事朱利安?畢格羅(Julian Bigelow)在從事旨在提高高射炮精確率工程的時(shí)候,他的反饋系統(tǒng)理論得到了細(xì)化。維納和畢格羅解決了向飛行中的飛機(jī)提高開(kāi)火準(zhǔn)確率的難題。這曾經(jīng)是個(gè)難題,因?yàn)榕谑直仨氼A(yù)先判斷目標(biāo)的位置。他們的解決方案是通過(guò)預(yù)測(cè)目標(biāo)飛行位置并相應(yīng)調(diào)?;鹋诘拿闇?zhǔn)器,從而自動(dòng)調(diào)整炮手的瞄準(zhǔn)過(guò)程。

維納關(guān)于感知和反饋?zhàn)鳛橐环N優(yōu)化性能的方法的設(shè)想不僅僅只是用于戰(zhàn)爭(zhēng)。維納與之前的研究者不同,他將反饋構(gòu)想成一種通用的普適原則。他認(rèn)為,反饋能夠以同樣的方式應(yīng)用于機(jī)器、組織、城市甚至是人的大腦。他在1905 年出版的《人類(lèi)的人類(lèi)用法》(The Human Use of Human Beings)一書(shū)中記錄下了許多這樣的設(shè)想,此書(shū)比“人工智能”的正式問(wèn)世早了6 年。作為一本出人意料的暢銷(xiāo)書(shū),它描述了智能自動(dòng)化推動(dòng)社會(huì)進(jìn)步的各種方式。維納拋棄了建造能夠思考的機(jī)器來(lái)替代人類(lèi)的想法,而是在他的書(shū)中討論了人類(lèi)與機(jī)器可以合作的方式。在導(dǎo)讀中,他寫(xiě)道:

這是本書(shū)的論點(diǎn):只有通過(guò)學(xué)習(xí)屬于社會(huì)的信息與掌握通信設(shè)施才能了解社會(huì);而且,在這些信息與通信設(shè)施未來(lái)的發(fā)展過(guò)程中,人與機(jī)器、機(jī)器與人以及機(jī)器與機(jī)器之間的信息注定要發(fā)揮越來(lái)越重要的作用。

控制論從來(lái)沒(méi)有像人工智能那樣獲得過(guò)大量的研究經(jīng)費(fèi)。然而,關(guān)于可以用于預(yù)測(cè)未來(lái)的數(shù)學(xué)反饋系統(tǒng)的設(shè)想幾乎是建造今天所有智能設(shè)備的基礎(chǔ)。例如,標(biāo)準(zhǔn)的“無(wú)聲”恒溫器通過(guò)傳感器收到溫度信息,并根據(jù)其冷熱程度,為你開(kāi)啟火爐或空調(diào)。另一方面,一個(gè)“智能”恒溫器能夠整合其他數(shù)據(jù)源,如當(dāng)天的天氣預(yù)報(bào)或家里人對(duì)房間溫度的歷史設(shè)定信息。它甚至可以根據(jù)房間內(nèi)多人的身體傳感器讀數(shù)的集合,選擇一個(gè)平均的溫度。代替那種簡(jiǎn)單的反應(yīng)式工作,智能設(shè)備的工作變成了預(yù)測(cè)式的。

這要求不同設(shè)備之間相互作用。與預(yù)先連接的同類(lèi)設(shè)備相比,這些智能設(shè)備可能是相對(duì)智能些,但離我們實(shí)際稱(chēng)之為的“智能”還相去甚遠(yuǎn)。但是當(dāng)設(shè)備彼此之間能夠分享數(shù)據(jù)和目標(biāo)時(shí),新的可能性就展現(xiàn)了出來(lái)。這就是專(zhuān)家所描述的“環(huán)境智能”,即通過(guò)使用嵌入網(wǎng)絡(luò)的智能,多種設(shè)備共同執(zhí)行各種任務(wù)。就像白蟻共同建造一處蟻穴一樣,整體是大于部分的總和的。

早期的自動(dòng)機(jī)器人

這種對(duì)機(jī)器與環(huán)境(或者更好的情況是,多種機(jī)器與其環(huán)境)之間突發(fā)行為的興趣源于控制論運(yùn)動(dòng),并引發(fā)了機(jī)器人領(lǐng)域的一些早期重要工作,如威廉?格雷?沃爾特(William Grey Walter)所從事的工作,他是一位出生在美國(guó)而生活在英國(guó)的神經(jīng)科學(xué)家。1949 年,沃爾特建立了世界上第一對(duì)三輪機(jī)器人,他稱(chēng)之為“烏龜”。與剛剛開(kāi)始研究數(shù)字計(jì)算機(jī)的計(jì)算機(jī)科學(xué)家不同,沃爾特依靠模擬電子學(xué)來(lái)仿制其機(jī)器人的大腦。他的目標(biāo)是證明少量腦細(xì)胞之間豐富的關(guān)系能夠產(chǎn)生復(fù)雜的行為。他對(duì)這樣的概念十分癡迷,即機(jī)器可以定義目標(biāo),并隨后通過(guò)學(xué)習(xí)自己的行為產(chǎn)生的后果從而完成目標(biāo)。

沃爾特的“ 烏龜” 分別名為埃爾默(Elmer)和埃爾希(Elsie),都裝配有光敏元件、標(biāo)志燈、觸摸感應(yīng)器、推進(jìn)馬達(dá)、轉(zhuǎn)向馬達(dá)和保護(hù)殼。盡管這對(duì)機(jī)器人還不能可靠地工作,但它們能夠自動(dòng)探測(cè)周?chē)沫h(huán)境。在沃爾特所著《活著的大腦》(The Living Brain)一書(shū)里,他回憶了一段經(jīng)歷:一位年長(zhǎng)的女士認(rèn)為這對(duì)自主漫游的機(jī)器人在追逐她,于是逃上樓將自己鎖在臥室。在沃爾特工作的位于布里斯托爾的博爾頓神經(jīng)學(xué)研究所(Burden Neurological Institute),沃爾特在技術(shù)人員W. J. 邦尼?沃倫(W. J. Bunny Warren)的幫助下,使烏龜機(jī)器人得到了改進(jìn)。他在1951 年的“不列顛節(jié)”(Festival of Britain)上展示了后續(xù)三臺(tái)“馬基納?斯巴卡拉特里克斯”(MachinaSpeculatrix)機(jī)器人,它們基于埃爾默和埃爾希原型進(jìn)行了許多重大改進(jìn)。其中包括當(dāng)電池即將耗盡時(shí),機(jī)器人會(huì)轉(zhuǎn)身向光源前進(jìn)。今天,雖然人們幾乎已經(jīng)遺忘了沃爾特的烏龜機(jī)器人,但是它們是早期自動(dòng)機(jī)器人的典范,能夠通過(guò)自己的行為,以試錯(cuò)的方式進(jìn)行學(xué)習(xí)。

談到威廉?格雷?沃爾特的烏龜機(jī)器人的后續(xù)產(chǎn)品,就不可能不提到iRobot公司創(chuàng)造的真空清潔機(jī)器人Roomba。Roomba呈小型圓盤(pán)狀,在計(jì)算機(jī)的引導(dǎo)下可以在家里自動(dòng)工作。盡管它可以通過(guò)基于反饋的“智能”對(duì)刺激做出反應(yīng),但一般情況下,它遵循一系列預(yù)先設(shè)計(jì)的清潔策略。首先,它會(huì)一直清理直至與障礙物發(fā)生碰撞,碰撞指示其改變線(xiàn)路并以新方向重新開(kāi)始清理。為了使之有效移動(dòng),Roomba包含了許多智能傳感器,其中兩個(gè)是紅外傳感器,幫助它檢查墻體以及被它稱(chēng)為“懸崖”的物體,比如樓梯和其他會(huì)造成下落的地方。當(dāng)Roomba撞到障礙物時(shí),觸摸感應(yīng)緩沖器會(huì)阻止其向前行進(jìn)。在Roomba的下面裝配有俗稱(chēng)的“壓電傳感器”,可以檢測(cè)到灰塵。如果在一個(gè)地方發(fā)現(xiàn)過(guò)多的灰塵,Roomba將重復(fù)其步驟以進(jìn)行第二次清理,第二次速度將放慢并清理得更加徹底。僅僅觀察這些簡(jiǎn)單的步驟,Roomba就展示出了一種看上去像是由人執(zhí)行的突發(fā)行為。

某種意義而言,“突發(fā)”這個(gè)詞表明這種行為是不可預(yù)測(cè)的,其實(shí)不然。如果完全基于上述的簡(jiǎn)單規(guī)則,我們可以理解為什么Roomba能以自己的方式行動(dòng)。然而,如同沃爾特的“烏龜”一樣,當(dāng)Roomba設(shè)法完成自己的任務(wù)時(shí),行為實(shí)體(behavioural agent)與環(huán)境的結(jié)合可能產(chǎn)生一些意想不到的響應(yīng)。

單獨(dú)一臺(tái)Roomba的運(yùn)行和表現(xiàn)都非常好。但是,就像沃爾特通過(guò)其烏龜機(jī)器人所發(fā)現(xiàn)的,當(dāng)不止一臺(tái)實(shí)體相互作用的時(shí)候,事情就真的變得很有趣了。沃爾特最有趣的觀察結(jié)果是,當(dāng)這些“烏龜”彼此圍繞旋轉(zhuǎn)的時(shí)候,他發(fā)現(xiàn)了它們“跳舞”的方式。這種舞蹈由一種看上去由機(jī)器人儀式化的碰撞和后退組成。這是他裝在烏龜機(jī)器人身上的標(biāo)志燈造成的,當(dāng)轉(zhuǎn)向馬達(dá)開(kāi)啟的時(shí)候標(biāo)志燈就亮了,而轉(zhuǎn)向馬達(dá)停止時(shí)標(biāo)志燈就熄滅了。由于每個(gè)烏龜機(jī)器人依靠對(duì)方的標(biāo)志燈來(lái)定位,它們就像同一物種的兩個(gè)生物首次見(jiàn)面一樣彼此吸引。當(dāng)“烏龜”走過(guò)顯現(xiàn)它們身影的鏡子時(shí),會(huì)發(fā)生同樣的現(xiàn)象。沃爾特宣布,如果這是一種動(dòng)物行為的話(huà),這種行為“或許可以證明烏龜機(jī)器人具有自我意識(shí)”。

即使Roomba 的熱衷者也不愿意承認(rèn)兩臺(tái)交互的真空清潔機(jī)器人具有“自我意識(shí)”,但沃爾特表明多重代理系統(tǒng)使智能設(shè)備變得更加有趣,這點(diǎn)是沒(méi)有錯(cuò)的。舉例來(lái)說(shuō),如果你家的門(mén)能夠自動(dòng)開(kāi)或關(guān),從而使Roomba 可以一次清掃多個(gè)房間,這將產(chǎn)生什么效果呢?這在某些場(chǎng)合是令人滿(mǎn)意的,比如,如果你有一只寵物而你不希望它進(jìn)入某一房間,或者如果你有一個(gè)特殊的房間在供暖,你不想它進(jìn)入這個(gè)房間。同樣,如果Roomba 能夠接入裝在前門(mén)或汽車(chē)?yán)锏膫鞲衅?,并且知道在你去上班的時(shí)候就開(kāi)始工作,那么你回家的時(shí)候清潔工作就已經(jīng)完成了?;蛟S,這就是那些制造智能設(shè)備的大公司正在努力的方向。

2015年6月之前,我從來(lái)不會(huì)花很多時(shí)間考慮諸如哪個(gè)城市的居民睡眠最少,抑或通勤不足5英里的上班人士是否比距離更遠(yuǎn)的人鍛煉得更多這樣的問(wèn)題。然而對(duì)于感興趣的人而言,答案分別是:日本東京的市民睡眠最少(平均每天睡5小時(shí)44分鐘);“是的,通勤不足5英里的上班人士比距離更遠(yuǎn)的人鍛煉得更多”(每天多走422步)。

這是班達(dá)爾?安塔比(Bandar Antabi)告訴我的。安塔比無(wú)疑是世界上最佳的酒吧競(jìng)猜選手。你若問(wèn)他,他會(huì)告訴你,如果你希望夜晚早點(diǎn)降臨的話(huà),那么你最佳的居住地是澳大利亞的布里斯班,在那兒,人們大約晚上10點(diǎn)57分就要進(jìn)入夢(mèng)鄉(xiāng),而“夜貓子”的首選居住之地應(yīng)該是俄羅斯的莫斯科,那里通常凌晨12點(diǎn)46分才是人們?nèi)胨臅r(shí)間。他說(shuō),在情人節(jié)女人會(huì)比平時(shí)少吃約3%的大蒜,但是當(dāng)天男人會(huì)多吃37%。瑞典的斯德哥爾摩人是最活躍的步行者(按每天平均量計(jì)算),而巴西圣保羅人是世界上最不活躍的步行者,等等,就像你把達(dá)斯汀?霍夫曼(Dustin Hoffman)在《雨人》中的角色放在維基百科上數(shù)小時(shí)一樣,很快你就得到了所有答案。

班達(dá)爾是個(gè)非常聰明的人,但他也是個(gè)非常不擅長(zhǎng)處理瑣事的人。他能采集這些信息是因?yàn)樽鳛樘厥忭?xiàng)目主管,他所任職的公司Jawbone已經(jīng)花費(fèi)多年時(shí)間不知疲倦地在收集這些信息。

1999 年,Jawbone 以為美軍開(kāi)發(fā)降噪技術(shù)而起家,隨后才涉足藍(lán)牙頭戴設(shè)備、揚(yáng)聲器以及后來(lái)的可穿戴生活記錄儀等領(lǐng)域。就是可穿戴生活記錄儀這種裝滿(mǎn)傳感器的智能設(shè)備使Jawbone 今天聞名于世,如UP3,它是一種如同手表的細(xì)腕帶,專(zhuān)注地記錄著從你的睡眠模式、呼吸節(jié)奏、心率到“皮膚電反應(yīng)”等所有事情的設(shè)備。Jawbone 的大量用戶(hù)所生成的原始數(shù)據(jù)使班達(dá)爾知道了如此多的“真相”?,F(xiàn)在,這些數(shù)據(jù)包括了3 萬(wàn)億步、2.5 億次睡眠以及將近200 萬(wàn)頓飯。隨著時(shí)間的流逝,數(shù)據(jù)將繼續(xù)增加,還可能納入幾十種其他的計(jì)量?jī)?nèi)容,如用戶(hù)每天攝入的咖啡因總量等。簡(jiǎn)而言之,Jawbone 希望成為你計(jì)量生物學(xué)上的記錄者。

“我們的任務(wù)是建立這種個(gè)性化的數(shù)據(jù)集,它整合了你的個(gè)人身份、檔案、生物學(xué)信息、年齡、身高、性別、飲食偏好、情緒等信息。”班達(dá)爾告訴我這些的時(shí)候,我在Jawbone 英國(guó)公司的總部諾丁山辦公大廈13 層,坐在他的對(duì)面,喝著一杯星巴克咖啡。他繼續(xù)說(shuō)道:“我們也想了解你的相關(guān)活動(dòng)。你什么時(shí)候坐著,什么時(shí)候活動(dòng)且消耗卡路里,你的睡眠質(zhì)量如何。通過(guò)挖掘這些信息,隨著時(shí)間的推移,我們可以為你提供大量的信息。我們正在建立一個(gè)關(guān)于你的健康的場(chǎng)景化數(shù)據(jù)集。”

Jawbone 與許多技術(shù)硬件公司建立了有經(jīng)紀(jì)人參與的合作,但是如果只是分享數(shù)據(jù)的話(huà),這些業(yè)務(wù)是不值得我花費(fèi)筆墨的。你的恒溫器真的需要知道在昨夜的晚餐中你吃了什么嗎?如果你的電視知道你一周要慢跑4 次,這會(huì)對(duì)你有什么好處呢?班達(dá)爾說(shuō),實(shí)際上這意義深遠(yuǎn)?!坝袛?shù)據(jù)雖然是好事,”他對(duì)我說(shuō),“但是理解數(shù)據(jù)才是我們關(guān)注的?!?/p>

“理解數(shù)據(jù)”意味著可以通過(guò)恰當(dāng)?shù)娜斯ぶ悄芩惴?,以具有上下文意義的方式分析你的數(shù)據(jù)。“我們可以使用這種技術(shù),以一種有利的方式將數(shù)據(jù)用于適合的設(shè)備。”他繼續(xù)說(shuō)道,“比如,你可以將Jawbone的智能設(shè)備與你的智能恒溫器配對(duì),那么當(dāng)你睡覺(jué)的時(shí)候,臥室里的溫度可以自動(dòng)調(diào)節(jié)至最有利于你睡眠的狀態(tài)。當(dāng)你醒來(lái)時(shí),溫度可以再次改變。”

這些數(shù)據(jù)處理即通常所說(shuō)的事件驅(qū)動(dòng)程序或者IFTTT規(guī)則(通過(guò)不同平臺(tái)的條件來(lái)決定是否執(zhí)行下一條命令)。這些簡(jiǎn)單的規(guī)則,依據(jù)簡(jiǎn)單的方法,將服務(wù)環(huán)節(jié)串聯(lián)了起來(lái)。IFTTT規(guī)則先驅(qū)林登?蒂貝茨(Linden Tibbets)曾將這些規(guī)則稱(chēng)為“數(shù)字傳送帶”,因?yàn)樗鼈兛梢允怪悄芗夹g(shù)的創(chuàng)造者或用戶(hù)將完全割裂的概念聯(lián)系起來(lái)。這種在智能設(shè)備領(lǐng)域可能或者當(dāng)前正在發(fā)生作用的交互例子不勝枚舉,比如,如果你的汽車(chē)知道你昨夜沒(méi)有睡好,它可以從你的智能恒溫器提取數(shù)據(jù),這些數(shù)據(jù)如果顯示出你遇到寒冷會(huì)更精神,它就可以打開(kāi)空調(diào),確保你能保持足夠的清醒。通過(guò)你的可穿戴健身記錄儀,它可以了解到當(dāng)你聽(tīng)某一類(lèi)型音樂(lè)時(shí)你的表現(xiàn)最佳,因此,它可以自動(dòng)播放金屬樂(lè)隊(duì)的音樂(lè)使你一天都活躍起來(lái)。它甚至可以知道昨夜你和朋友外出聚會(huì),現(xiàn)在仍然還處于醉酒狀態(tài)。為了實(shí)現(xiàn)這點(diǎn),它使用嵌入在變速桿上的傳感器,分析你手掌汗液里的酒精含量。如果遇到這種狀況,它會(huì)讓汽車(chē)熄火,并建議你呼叫一輛優(yōu)步(Uber)出租車(chē)。

還有一個(gè)例子,你的智能電視可以收到你的睡眠記錄,并可以基于你一天的時(shí)間安排為你提供定制化收看電視節(jié)目的時(shí)間建議。如果晚上9 點(diǎn)放棄看讓你腦子興奮好幾個(gè)小時(shí)的《權(quán)力游戲》(Game of Thrones)這樣的節(jié)目后,為什么不選擇看《摩登家庭》(Modern Family)呢?或許你在觀看一個(gè)你喜歡的烹飪節(jié)目,智能電視就將節(jié)目中的食譜發(fā)送至智能冰箱,冰箱監(jiān)控著所有食物,所以它知道里面是否存放有烹飪這道菜所必需的各種原料。如果沒(méi)有的話(huà),它可以將所需原料加入家庭采購(gòu)雜貨的快遞清單之中。隨著越來(lái)越多的設(shè)備與網(wǎng)絡(luò)連接,能夠提取彼此的數(shù)據(jù)并由事件驅(qū)動(dòng)程序?qū)⑺鼈兿嗷リP(guān)聯(lián),技術(shù)迷期待已久的夢(mèng)想即將實(shí)現(xiàn)了。

分享到

liwz

need 500 dollars today

相關(guān)推薦