科大訊飛研究院副院長(zhǎng)付瑞吉

付瑞吉:各位來(lái)賓大家下午好,首先非常感謝DOIT的邀請(qǐng)。我是來(lái)自科大訊飛AI研究院的付瑞吉,今天的題目就是人工智能技術(shù)的最新進(jìn)展和產(chǎn)業(yè)應(yīng)用,跟大家介紹一下科大訊飛這些年在人工智能領(lǐng)域的研究進(jìn)展和應(yīng)用。

我們都知道,從去年開(kāi)始,阿爾法狗戰(zhàn)勝李世石,使得人工智能變成了一個(gè)家喻戶曉的概念,瑞銀集團(tuán)交易大廳以前坐滿了交易員,現(xiàn)在基本上是空了,人工智能已經(jīng)取代了交易員,完成一比一的交易。孫正義提出未來(lái)產(chǎn)業(yè)機(jī)器人將決定GDP的全球排名,我們以前講人口紅利,可能以后就是機(jī)器人紅利了,人工智能在全球范圍內(nèi)變成一個(gè)非常重要的戰(zhàn)略性的戰(zhàn)略高地。

迄今為止,工業(yè)界人工智能成功的經(jīng)驗(yàn),剛才提到了ABC成為主流,我們有深度學(xué)習(xí)算法,大數(shù)據(jù),計(jì)算能力,變成了一個(gè)人工智能里面的標(biāo)配,要想成功這三個(gè)方面必須得全部具備,在訊飛這些年來(lái)摸索產(chǎn)品階段,人工智能包括語(yǔ)音的這些產(chǎn)品成功經(jīng)驗(yàn)中,總結(jié)了這樣一條,我們叫聯(lián)誼效益,就像一滴水一塊石頭到湖面上泛起了漣漪,我們新的產(chǎn)品發(fā)布的時(shí)候有各種缺陷,準(zhǔn)確率沒(méi)有那么高,這個(gè)時(shí)候它的水波振幅非常大,代表了我們的錯(cuò)誤率會(huì)比較高,但是總有一部分發(fā)燒友容忍度比較高的用戶會(huì)用我們的產(chǎn)品,這個(gè)時(shí)候會(huì)為我們貢獻(xiàn)真實(shí)的用后數(shù)據(jù),這些數(shù)據(jù)也用我們的云服務(wù)收集回來(lái),幫助我們迭代的改進(jìn)我們的算法,形成這樣的閉環(huán),用用戶不斷的數(shù)據(jù)迭代改進(jìn)我們的算法,使得我們產(chǎn)品的準(zhǔn)確率提高,它的振幅變小,會(huì)吸引更多的人去利用,漣漪就會(huì)不斷的擴(kuò)大,直到覆蓋到整個(gè)湖面,使這個(gè)產(chǎn)品覆蓋更多的用戶。

訊飛總結(jié)了它的應(yīng)用模式,分為兩個(gè)方面,第一個(gè)方面,我們叫和自然交互去結(jié)合,自然交互改變生活,就是說(shuō)我們可以跟智能家具和可穿戴設(shè)備包括智能汽車,我們知道現(xiàn)在越來(lái)越多的設(shè)備沒(méi)有屏幕,小型化,可穿戴,跟它交互的時(shí)候,以往像手機(jī)一樣的觸摸已經(jīng)不能滿足我們的需求,那么我們用更加自然的交互方式,用語(yǔ)音交互,更好的去使得交互更加的流暢。

和行業(yè)交互,更好的顛覆行業(yè),包括智慧城市和醫(yī)療等等,我們后面會(huì)看到各種的案例。

訊飛2014年開(kāi)始定義了人工智能的三個(gè)階段。

第一個(gè)階段是計(jì)算智能,計(jì)算機(jī)可以算,這個(gè)是計(jì)算機(jī)誕生那一天就有優(yōu)勢(shì),速度就是快,存儲(chǔ)的就是多,我們每天用的搜索引擎或者地圖搜索遠(yuǎn)遠(yuǎn)超過(guò)人類,這都是屬于計(jì)算智能。阿爾法狗一定意義也是計(jì)算智能。

第二個(gè)階段是感知智能,對(duì)應(yīng)的就是我們的能聽(tīng)會(huì)說(shuō),能看會(huì)認(rèn),這個(gè)是類似所有動(dòng)物都有的智能,都有視覺(jué)和聽(tīng)覺(jué)。這個(gè)階段隨著深度學(xué)習(xí)的突飛猛進(jìn)的進(jìn)步,計(jì)算機(jī)的能力已經(jīng)越來(lái)越逼近人類,在某些任務(wù)上,已經(jīng)超過(guò)了人類。

第三個(gè)階段是認(rèn)知職能,能理解會(huì)思考,里面核心的就是人類語(yǔ)言的語(yǔ)境,人類語(yǔ)言包含信息非常豐富,里面涵蓋的知識(shí)也是非常的豐富,計(jì)算機(jī)如何理解語(yǔ)音,更好的為我們服務(wù),這個(gè)是我們現(xiàn)在人工智能所面臨的非常難的一個(gè)難題,也是各大研究機(jī)構(gòu)爭(zhēng)相研究的話題。

訊飛提出的這三個(gè)階段,基本作為業(yè)界公認(rèn)的共識(shí)。

我們看訊飛在這些年的研究進(jìn)展。

首先是感知智能方面,訊飛是做語(yǔ)音起家的,從99年創(chuàng)業(yè)開(kāi)始,做語(yǔ)音的合成,實(shí)際就將文字轉(zhuǎn)化成流暢的語(yǔ)音,相當(dāng)于給機(jī)器撞上了嘴巴。訊飛現(xiàn)在的技術(shù)達(dá)到世界第一,從06年開(kāi)始參加暴風(fēng)雪大賽,連續(xù)12年都是冠軍,現(xiàn)在可以做到非常流暢的去合出人的聲音,有不同的音色,有可能有人看到過(guò)奧巴馬的視頻。

第二個(gè)是語(yǔ)音識(shí)別技術(shù),相當(dāng)于撞上了人工的耳朵,不僅是要識(shí)別出語(yǔ)音中的內(nèi)容,還有說(shuō)話人的識(shí)別語(yǔ)種識(shí)別等等,訊飛輸入法特別好,準(zhǔn)確率達(dá)到了98%。

還有訊飛獨(dú)創(chuàng)技術(shù),是語(yǔ)音的評(píng)測(cè)技術(shù),是我們從05年開(kāi)始研究的,以往的口語(yǔ)考試都是老師評(píng)分,現(xiàn)在用機(jī)器評(píng)分,比人更加準(zhǔn)確,更加接近于專家的評(píng)分,所以在全國(guó)的普通話水平考試?yán)?,已?jīng)全面的應(yīng)用到了訊飛的技術(shù),在一些中高考的英語(yǔ)口語(yǔ)考試也在不斷的推廣應(yīng)用。

訊飛也做圖象識(shí)別,我們這里舉了一個(gè)例子,是手寫(xiě)圖文識(shí)別,比如考試完以后,我們要對(duì)作文進(jìn)行識(shí)別,這里面的難度就是學(xué)生可能寫(xiě)的字非常潦草,而且手機(jī)上的手寫(xiě)輸入法沒(méi)有筆順的信息,訊飛基于大量的數(shù)據(jù),用深度神經(jīng)網(wǎng)絡(luò)端到端的學(xué)習(xí)已經(jīng)達(dá)到了國(guó)際領(lǐng)先的水平,已經(jīng)在教育和快遞單領(lǐng)域開(kāi)始使用。

下面的例子就是在掃描閱卷里,我們首先掃描完了以后識(shí)別文字,進(jìn)行自動(dòng)的評(píng)分,當(dāng)然后面自動(dòng)評(píng)分的部分屬于認(rèn)知智能的部分,比如這個(gè)是英文的,我們會(huì)判斷它的語(yǔ)法錯(cuò)誤,拼寫(xiě)的錯(cuò)誤,還有它的句子是不是流暢,還有它是不是地道等等,從各個(gè)方面去評(píng)價(jià),最后給出一個(gè)分?jǐn)?shù),這個(gè)分?jǐn)?shù)我們同樣跟專家進(jìn)行了比較,我們的評(píng)分水平是更接近于專家的。

這個(gè)例子也是醫(yī)學(xué)領(lǐng)域的圖象識(shí)別,我們參加了醫(yī)學(xué)影響比賽,做的是肺部結(jié)節(jié)的檢測(cè),X光片,這個(gè)結(jié)節(jié)可能是肺癌的征兆,我們都知道傳統(tǒng)來(lái)說(shuō)這種片都是醫(yī)生用肉眼去看,經(jīng)常會(huì)有一些漏診,我們?cè)谝粋€(gè)北京的知名三甲醫(yī)院,醫(yī)生的閱片漏診率達(dá)到30%,本來(lái)可能他是有肺癌,醫(yī)生閱片的時(shí)候漏掉了,尤其是肺癌早期不明顯的情況下,給漏掉了,耽誤了最佳的治療時(shí)間,我們的閱片技術(shù)可以很好的解決這個(gè)問(wèn)題,我們現(xiàn)在準(zhǔn)確率可以達(dá)到94%。

剛才講的是感知智能,2014年我們也依托于863的類答題項(xiàng)目提出訊飛超腦計(jì)劃,目標(biāo)就是讓機(jī)器人考上大學(xué),為人答題。我們這些年也有一些進(jìn)展,在知識(shí)圖譜的構(gòu)建有一些進(jìn)展,我們?nèi)ツ陞⒓恿吮荣?,這個(gè)比賽是給你一段話,讓你把中間的概念識(shí)別出來(lái),鏈接數(shù)據(jù)庫(kù)對(duì)應(yīng)的試題里,里面最難的任務(wù)就是有一些重名,比如布什有重名,比如小布什,我們?nèi)〉玫牡谝幻?/p>

第二個(gè)例子,我們?cè)谒固垢=衲甑臋C(jī)器閱讀理解任務(wù)上取得第一名,這個(gè)任務(wù)是非?;鸬?,微軟還有臉書(shū)等等都在參加,給你一篇文章,讓后讓機(jī)器閱讀,之后提問(wèn)題,讓機(jī)器回答,我們的準(zhǔn)確率是排在第一的。

大家都知道曉譯翻譯機(jī),現(xiàn)在可以支持中文到英文、法文和西班牙文等多種語(yǔ)言的相互翻譯,中國(guó)人出國(guó)旅游的時(shí)候非常方便,在京東多次斷貨。第二個(gè)產(chǎn)品,丁東音響,跟京東合作的國(guó)內(nèi)首款智能音響,把它放在客廳可以交互,獲得互聯(lián)網(wǎng)的內(nèi)容,也可以去控制智能家電,比如打開(kāi)空調(diào)等等,第三個(gè)是阿爾法小蛋,是面向兒童的產(chǎn)品,可以跟小朋友進(jìn)行交流。第四個(gè)是曉曼機(jī)器人,可以做智慧導(dǎo)診,比如患者來(lái)了以后想找一個(gè)科室,找不到可以直接問(wèn)機(jī)器人。

還有就是智慧城市,我們也是打通了各種大數(shù)據(jù),去做交通和公安等等,其實(shí)最終的目的是方便老百姓辦事,這是我們的理念,有一個(gè)例子,在杭州或者浙江某一個(gè)地方,老百姓辦事的效率從原來(lái)的需要10到20天的時(shí)間,縮短到了1到2天,原來(lái)需要跑2到3次,現(xiàn)在就一次搞定了。

機(jī)器人可以做人臉認(rèn)證,去替代柜臺(tái)的辦事人,幫你去開(kāi)各種證明等等。

智慧教育方面,可以自動(dòng)的閱卷,幫助老師減負(fù),幫助學(xué)生更好的批改作文,另一方面是個(gè)性學(xué)習(xí),每次考試完成以后,人工智能可以分析出你這個(gè)學(xué)生知識(shí)點(diǎn)的掌握情況,根據(jù)知識(shí)點(diǎn)的掌握情況去布置個(gè)性化的作業(yè),比如發(fā)現(xiàn)你某個(gè)知識(shí)點(diǎn)掌握的不好,這個(gè)時(shí)候可以布置這方面的作業(yè)多一些,對(duì)于那些掌握的比較好的知識(shí)點(diǎn),這方面就不需要做重復(fù)練習(xí)了,所以每次考試完了以后,每個(gè)人的課后的錯(cuò)題作業(yè)都是不一樣的,都是個(gè)性化的,對(duì)于老師來(lái)說(shuō)也是一樣的,可以分析出整個(gè)班級(jí)或者是整個(gè)年紀(jì)的情況,老師可以做針對(duì)性的教學(xué),實(shí)現(xiàn)因材施教。

智慧醫(yī)療大家都聽(tīng)說(shuō)了,今年我們機(jī)器人全球首次的通過(guò)的職業(yè)醫(yī)師資格考試,以456的高分通過(guò),分?jǐn)?shù)線360,成績(jī)非常好,在安徽省內(nèi)達(dá)到5%以上的排名。我們是通過(guò)閱讀大量的醫(yī)學(xué)資料教科書(shū)以及很多的真實(shí)病例學(xué)習(xí)到的大量醫(yī)學(xué)知識(shí),使得人工智能有一些醫(yī)學(xué)的能力,結(jié)合當(dāng)前的患者的信息去判斷到底可能是什么疾病,或者要做進(jìn)一步的什么檢查去確認(rèn),最終給出一些診療的方案。

最后,我們覺(jué)得一家的力量有限,我們把人工智能的能力統(tǒng)統(tǒng)打包到云平臺(tái)上,我們叫UI開(kāi)放平臺(tái),把人臉識(shí)別和語(yǔ)音合成以及手勢(shì)翻譯等等的能力放在云平臺(tái)上封裝起來(lái),供廣大的開(kāi)發(fā)者使用,現(xiàn)在支持的用戶數(shù)達(dá)到14億,人交互35億,支持的第三方開(kāi)發(fā)者達(dá)到了43萬(wàn)。

希望跟大家一起來(lái)在中國(guó)用人工智能改變世界,謝謝大家。

 

分享到

xiesc

相關(guān)推薦