閱讀理解是衡量人們如何掌握并理解其正在閱讀的內容的一項技能。閱讀理解的提高涉及到閱讀和大量的實踐來衡量和辨別不同的文字用法和上下文內容。同樣的道理也適用于人工智能。
Facebook公布的多項數(shù)據表明,人工智能已被用于訓練其自制的神經網絡之中。其中有些文本是經典小說,如拉迪亞德·吉卜林的《叢林之書》,J·M·巴里的《彼得·潘》,以及劉易斯·卡羅爾的《愛麗絲夢游仙境》;其他一些文本則是童話故事集合,如安德魯·朗格的童話書,納撒尼爾·霍桑的《重講一遍的故事》,和奧斯卡·王爾德的《快樂王子與其他故事》。這些大多是從網上免費圖書館古登堡計劃獲得的。
基于這些書籍來培訓其人工智能系統(tǒng),F(xiàn)acebook正試圖確保系統(tǒng)可以對讀取以及邏輯關聯(lián)方面的過程管理。該項目的核心便是Facebook所謂的“兒童圖書測試” ,它可以使用這個指標來確定人工智能的進展。
根據其分析文章來看,F(xiàn)acebook研究員訓練了一種運用列表書籍作為樣品的神經網絡。在此之后,他們從未閱讀的故事中以簡短摘錄的形式將其呈現(xiàn)出來。隨即人工智能被要求選擇一個選項列表中的單詞,該詞可填補在最后一句空白處丟失的字。
言外之意閱讀法
人工智能選擇”獅鷲”一詞填空
由于能夠解答這些問題,研究人員認為,這表明一項人工智能系統(tǒng)可以在情境中更廣范圍地做出裁決或判斷。該技能在表示和記憶信息碎片方面是至關重要的,這將提高人工智能在處理讀取之外的需求方面的表現(xiàn)能力;另一個Facebook設計的智力測驗旨在理解中短篇小說思想之間的關系。
“我們的團隊訓練電腦如何看句子的上下文并更準確地預測那些較難詞匯,名詞和名字,這往往是句子的最重要的部分,”Facebook的CEO馬克·扎克伯格在帖子中解釋道。
“當計算機關注適量的相關內容時,它所做的預測是最準確的,不是太多,也不是太少,”他說,并稱其為“金發(fā)原則?!?/p>
這些結果被納入M項目 — 即目前正在測試中的Facebook Messenger數(shù)字助理程序 —?在人工智能可以像人類一樣成熟地探究、理解和回答問題之前仍需要更多的研究與處理過程。
但重要的是,計算機程序也逐漸學會那些人類自然習得的認知行為;這是一個艱難的過程(也許比任何人想象的更困難),但程序在穩(wěn)步發(fā)展。最終的目標是做出人工智能(或約如此)的程序和算法,即可以更自然地與人類交互,并與Siri(語音控制功能)或Cortna(微軟個人智能助理)相結合,形成其對語言變化的理解能力,或是形成微妙的諷刺、挖苦或急躁等情緒的語言特點。
當我們學習如何將直覺與認知的復雜性融入計算機程序中時,也許會在前進的道路上更多一點地了解我們自己。
原文標題:Facebook Is Training Its Artificial Intelligence to Understand Language
(DOIT獨家譯稿)
更多行業(yè)資訊,請關注DOIT官方微信號DOIT(微信號:doitmedia),關注科技與數(shù)據經濟,洞察IT新走向。