眾所周知,機器翻譯技術(shù)涉及計算機、認知科學、語言學等學科,一直被科學界公認為是人工智能領(lǐng)域最難的課題之一。過去的幾十年,受限于技術(shù)方法,計算力和訓練數(shù)據(jù)等原因,一直未能有有效的突破口。近年來,人工智能技術(shù)的不斷發(fā)展,讓自然語言處理和語義分析技術(shù),乃至深層網(wǎng)絡(luò)技術(shù)都取得了長足的進步,而Microsoft Translator則正是基于這些人工智能領(lǐng)域的前沿技術(shù),為用戶提供優(yōu)異的翻譯服務(wù),進而彌合人與人之間的溝通障礙。

早期,基于“統(tǒng)計機器翻譯”技術(shù),Microsoft Translator就將“翻譯”轉(zhuǎn)變成了一個機器學習的課題,讓計算機不斷地對訓練數(shù)據(jù)中的人工譯文和語言轉(zhuǎn)換結(jié)果進行判斷與學習,在不斷的糾錯與改正中,促進系統(tǒng)算法的自我完善與優(yōu)化。同時,Microsoft Translator還能通過統(tǒng)計建模技術(shù)和高效的算法,不斷學習優(yōu)化的機器翻譯系統(tǒng)能學會根據(jù)上下文的語境,而不是單詞的意思和生硬的語法規(guī)則來匹配最恰當?shù)姆g結(jié)果。

隨著人工智能技術(shù)的不斷發(fā)展,深度神經(jīng)網(wǎng)絡(luò)技術(shù)在過去的幾年已經(jīng)開始使用在許多人工智能領(lǐng)域, 而Microsoft Translator所有的翻譯服務(wù)也已全部使用了最先進的深層神經(jīng)網(wǎng)絡(luò)技術(shù)。神經(jīng)機器翻譯,簡言之就是對源語言的句子進行編碼,轉(zhuǎn)化為計算機可以“讀懂”的形式,然后通過一個解碼的過程輸出譯文。

此外,Microsoft Translator背后的微軟機器翻譯系統(tǒng),不僅應(yīng)用了最新的神經(jīng)網(wǎng)絡(luò)技術(shù),還加入了自己獨有的技術(shù)。首先,它借鑒了人類在翻譯的思維方式,并且應(yīng)用了對偶學習(Dual Learning)。對偶學習能夠保證翻譯的一致性在中翻英、英翻中的過程中做到聯(lián)合優(yōu)化。其次,推敲網(wǎng)絡(luò)(Deliberation Networks),當機器翻譯完成翻譯后,為了讓其做的更好,研究人員使用推敲網(wǎng)絡(luò)讓機器不斷推敲,不斷修改,把翻譯完的結(jié)果再輸入,再全盤考慮,做到不斷優(yōu)化。第三,一致性規(guī)范(Agreement Regularization)。讓翻譯可以從左到右進行,也可以從右到左進行,最終讓兩個過程生成一致的翻譯結(jié)果。

目前,在Microsoft Translator中已有21種語言應(yīng)用了神經(jīng)網(wǎng)絡(luò)翻譯,相比傳統(tǒng)統(tǒng)計機器翻譯,神經(jīng)網(wǎng)絡(luò)機器翻譯在翻譯質(zhì)量上針對不同語言有著6%至43%不等的提升。借助深層神經(jīng)網(wǎng)絡(luò),以及對數(shù)千小時不同語言的音頻數(shù)據(jù)進行分析和學習,Microsoft Translator已經(jīng)可以“聽懂”人類的自然語音,比如,去掉“嗯”、“啊”、“這個”、“那個”之類的贅詞以及重復(fù)、口吃等語病,并添加斷句、標點符號,從而讓文本更貼近用戶本來的意圖,也更易閱讀和翻譯。

而在文本翻譯基礎(chǔ)上增強的語音翻譯引擎,Microsoft Translator還增加了更多口語文本語料庫,從而為口語會話類翻譯構(gòu)建了更好的模型。而在文本到語音的轉(zhuǎn)換過程,如果翻譯的目標語言是Microsoft Translator目前所支持的 18 種轉(zhuǎn)換語言之一,那么Microsoft Translator就能使用語音合成技術(shù)將翻譯后的文本轉(zhuǎn)換成語音播放出來。整個語音翻譯過程中,深層神經(jīng)網(wǎng)絡(luò)技術(shù)的引入,極大程度的讓Microsoft Translator更好的獲取和理解上下文及完整句子,降低了翻譯的錯誤率,提高了可靠性,從而輸出更高質(zhì)量和更自然的翻譯結(jié)果。

如果說,Microsoft Translator的智能來自于機器學習、深層神經(jīng)網(wǎng)絡(luò)、自然語言語義等技術(shù),那么它的可靠運行與不斷優(yōu)化,則離不開微軟在各領(lǐng)域的資源優(yōu)勢。例如,作為一項云服務(wù),Microsoft Translator運行于Microsoft Azure云平臺,Azure提供了機器學習等高級分析功能的運行平臺,同時也確保了其作為SaaS云服務(wù)的高可用性和數(shù)據(jù)安全性,并且它還可以根據(jù)需要彈性擴展運算規(guī)模。另一方面,覆蓋全球的必應(yīng)搜索引擎,也為Microsoft Translator提供了全球規(guī)模的語言素材與學習資料,讓機器學習系統(tǒng)得以不斷地成長和完善。而微軟旗下多樣化的產(chǎn)品與服務(wù),也為Microsoft Translator提供了施展才華的廣闊天地。從2006年起,Microsoft Translator便逐漸開始為越來越多的微軟產(chǎn)品提供自動文本翻譯功能,例如Office、必應(yīng)搜索、IE和Edge瀏覽器、Skype、微軟小娜(Cortana)等等。

向業(yè)界開放提供多種翻譯服務(wù) 成為用戶的多國語言實時翻譯官

早在2014年,Microsoft Translator就推出了語音翻譯服務(wù),2016年3月又面向開發(fā)者開放了語音翻譯的API。目前,Microsoft Translator支持對包括中文普通話在內(nèi)的9種語言的實時語音翻譯。在Skype Translator以及Windows、iOS或者Android版的Microsoft Translator應(yīng)用中,甚至在日常使用的PowerPoint中,用戶都可以體驗到這項私人實時口譯服務(wù)。

在2018微軟人工智能大會的現(xiàn)場,微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負責人沈向洋博士接待了一位特殊的來賓——來自南京理工大學的碩士研究生宋昊旻。宋昊旻在一歲時失去了聽力,被醫(yī)生判定終生都會是聾啞人,堅強的昊旻在媽媽的支持下,堅持訓練出發(fā)聲能力,并成功考上了南京理工大學的本科和碩士研究生。在會議現(xiàn)場,昊旻在微軟語音服務(wù)的幫助下,與沈向洋進行了順暢的對話溝通。根據(jù)昊旻聲音定制的語音識別模型能夠以極高的準確度、近乎實時地將他略顯吃力的語音轉(zhuǎn)換為更加流暢的普通話,還能同步翻譯成英語或其它語種,真正實現(xiàn)無障礙溝通。在大會現(xiàn)場,宋昊旻滿含熱淚激動地表示:“這些技術(shù)真的改變了我們的生活,讓我們與這個世界的聯(lián)系更多更廣了,也變得更加自信了!”其實,微軟已經(jīng)讓Microsoft Translator就走進了大學課堂,讓聽障學生幫助緊跟老師課堂的節(jié)奏、盡快掌握知識。在美國羅切斯特理工學院一堂普通的生物課上,除了有站在講臺上授課的教授,旁邊還有負責將教授上課內(nèi)容翻譯為手語的翻譯員,以及在課堂大屏幕上顯示的實時字幕。坐在臺下上課的有不少是有聽力障礙的學生。羅切斯特理工學院有大約1500名聽力存在障礙的學生,而其中的大約700名學生會和健聽學生一起上課,他們通過綜合利用手語翻譯員和實時字幕中的信息來掌握課堂知識。而讓課堂內(nèi)容實時以字幕形式呈現(xiàn)的就是來自微軟的Microsoft Translator,該系統(tǒng)利用自動語音識別功能將教授原始用口語講解的內(nèi)容轉(zhuǎn)化為流暢的、含標點符號的文字。

再如,Microsoft Translator的現(xiàn)場翻譯功能(Live Feature),就借助智能手機、平板電腦和個人計算機等設(shè)備為多人、多語言、面對面交談提供現(xiàn)場翻譯。其不但支持眾多語言的翻譯功能,而且還可以提供離線翻譯選項。用戶既可以用鍵盤輸入或者粘貼文本,也可以利用麥克風直接錄入語音,或者是將看到的外國文字拍攝下來,讓軟件自動識別并翻譯。在最新版本中,Microsoft Translator還加入了支持9種語言的實時語音翻譯功能,讓語言不通的兩個人,僅憑一部手機就能進行面對面的實時語音交流。

在今年的微軟全球開發(fā)者大會上,微軟還展示了這項人工智能翻譯服務(wù)在會議室中的應(yīng)用。演示中,智能會議室搭配了360度全景攝像頭和陣列麥克風,它們可以幫助會議組織者確定參加會議都有什么人,這些智能設(shè)備可以用不同的語言跟參會者打招呼,也能非常準確地復(fù)述他們所說的話,實現(xiàn)不同國家不同語言的無縫交流。微軟多年以來都致力于翻譯服務(wù),也正是這些日積月累的研發(fā),這項功能最終將會在這套智能會議室解決方案中扮演重要的角色。

此外,Microsoft Translator移動端應(yīng)用絕對是海外旅行必備的利器,它不但可以幫助海外旅行者問路,還能靠拍照辨認街道、商鋪和沒有圖片的菜單,甚至可以讓旅行者和五湖四海的新朋友進行一次真正有意義的談話,每個人只需在各自的智能設(shè)備上打開Microsoft Translator應(yīng)用程序,掃描二維碼并進入聊天界面,即可開始交流,真正體會到四海一家的暢快溝通。

而“海淘”則是Microsoft Translator的另一個用武之地。基于Microsoft Translator技術(shù)的必應(yīng)翻譯提供了在線文本翻譯和網(wǎng)站翻譯功能,用戶只需輸入海淘網(wǎng)址,就能實現(xiàn)整個網(wǎng)頁的機器翻譯,這項功能同樣支持50多種語言,讓你的海外購物無障礙。

與此同時,Microsoft Translator針對PowerPoint的Presentation Translator插件功能還能在幻燈片播放的過程中實時地顯示翻譯字幕,其支持包括中文普通話在內(nèi)的10種語言的語音輸入,并可翻譯成60多種語言的文本字幕。不僅如此,在演講中,觀眾們還可以通過Microsoft Translator APP加入會議,在智能手機、平板設(shè)備或電腦上看到各自選定的語言字幕。同時,Presentation Translator功能還能將演講者或老師的口語轉(zhuǎn)化為實時字幕,并將翻譯的文字結(jié)果保存在手機中,幫助聽障礙人士理解演講或講課內(nèi)容,更加輕松、高效地學習及參與討論。

現(xiàn)在,Microsoft Translator也更多的出現(xiàn)在了我們周圍的產(chǎn)品之中。去年微軟就與華為合作,首先在具有AI芯片的Mate 10手機上實現(xiàn)了AI驅(qū)動型離線翻譯功能。而這一功能現(xiàn)在擴展到所有安卓、iOS和亞馬遜Fire設(shè)備。近日,搭載微軟AI翻譯系統(tǒng)的“AI翻譯機”也已經(jīng)在國內(nèi)的小米有品首發(fā)上架,不僅內(nèi)置了來自微軟的人工智能翻譯引擎,還整合了微軟語音、自然語言理解和機器翻譯三大模塊。在翻譯過程中,可以將結(jié)果譯回原文多次比對并進行學習優(yōu)化,從而使翻譯結(jié)果更加準確。而在我們最熟悉的微信中也有Microsoft Translator的身影。我們只需在對話界面中,長按對話氣泡內(nèi)出現(xiàn)的法語、日語或者阿拉伯語等文本,選擇“翻譯”,就會出現(xiàn)Microsoft Translator給你帶來的中文譯文。

未來,機器翻譯技術(shù)的發(fā)展雖然面對著很多不同的挑戰(zhàn),但也會在前行的道路上解決遷移學習、通用領(lǐng)域?qū)W習、自適應(yīng)等不同的難題,從而實現(xiàn)貼合用戶的個性化對話定制等功能。Microsoft Translator凝聚了微軟研究院20多年自然語言處理領(lǐng)域的研究成果,匯集了機器學習、大數(shù)據(jù)、 語言學、云計算等幾種前沿技術(shù)。目前全球已有數(shù)千間企業(yè)在使用微軟自動翻譯技術(shù),提高業(yè)務(wù)效率和服務(wù)質(zhì)量。

歡迎于各大應(yīng)用商店搜索“微軟翻譯”或“Microsoft Translator”下載體驗支持多人、多語言、跨設(shè)備的現(xiàn)場翻譯功能的Microsoft Translator 服務(wù),即刻開啟交流暢通無阻的全新世界吧!

分享到

xiesc

相關(guān)推薦