對話式人工智能開啟更廣闊前景
對話式人工智能正在成為新一代智能應(yīng)用的核心?,F(xiàn)代開發(fā)者必須懂得如何打造一個對話機器人,以及如何部署和運行它,因為這是來自客戶的呼聲——企業(yè)迫切需要能夠針對銷售咨詢、人力資源、招聘、客戶支持和服務(wù)等不同應(yīng)用場景進行定制、優(yōu)化和訓(xùn)練的智能業(yè)務(wù)機器人。
Azure Bot Services對話機器人服務(wù)讓開發(fā)者和企業(yè)能夠輕松開發(fā)出自己的對話機器人,發(fā)布兩年來已經(jīng)有30萬開發(fā)者采用該服務(wù)開發(fā)。對話機器人服務(wù)能夠根據(jù)業(yè)務(wù)需求進行定制,還支持發(fā)布到微軟小娜(Cortana)上,并能利用簡單易用的開發(fā)工具為小娜賦予更多業(yè)務(wù)技能。微軟已經(jīng)與亞馬遜合作,將微軟小娜結(jié)合到Alexa智能音箱中,讓用戶通過Alexa調(diào)用小娜及其背后的人工智能服務(wù)。
微軟小冰是面向情商(EQ)維度發(fā)展的人工智能系統(tǒng),已在五個國家落地。今天,微軟宣布一項人工智能內(nèi)容創(chuàng)造的全新技能,為每個孩子定制專屬于他們的有聲童話故事,將于“六一”兒童節(jié)正式上線。家長可以設(shè)置童話故事的主人公和故事傾向,如更偏教育意義等,然后安排微軟小冰完成創(chuàng)作。微軟小冰采用專門訓(xùn)練的深度學(xué)習(xí)模型,能夠從故事文本階段即進行定制化生成,并自動分配聲音角色和背景音樂,在短短20秒內(nèi)即可完成一集約10分鐘左右的有聲童話故事,語音講述的質(zhì)量能達到主流專業(yè)人類播音員的水準。該項服務(wù)完全免費,微軟會持續(xù)向訂閱家庭每天推送最新作品,讓每個家庭的孩子都可以擁有一位專屬于自己的故事主播。
目前,微軟小冰團隊已經(jīng)進入內(nèi)容創(chuàng)造領(lǐng)域并開始落地生產(chǎn),內(nèi)容涉及歌曲演唱、電臺電視臺節(jié)目、新聞評論、詩歌生成和有聲讀物等。在有聲讀物領(lǐng)域,微軟已擁有接近4萬集有聲童話內(nèi)容。這些有聲讀物全部由人工智能技術(shù)生成,在與人類主播質(zhì)量相當?shù)那疤嵯?,?shù)量足以陪伴一個孩子從2歲到9歲的全部時光。6個月來,這些有聲讀物已順利投放到占中國市場90%的兒童早教機、故事機和在線播客平臺,播放總時長超過400萬小時。
此外,微軟還將向合作伙伴和開發(fā)者開放“全雙工語音技術(shù)(Full Duplex)”,將“人機交互”進化為能像人類一樣自然的“人機交流”,開發(fā)者可以使用這項技術(shù)打造自己的對話應(yīng)用。今年四月,微軟正式在美國和中國同步宣布了Full Duplex感官,并已完成產(chǎn)品化落地。自2016年8月起,微軟(亞洲)互聯(lián)網(wǎng)工程院通過人類用戶主動發(fā)起的方式,在明確告知用戶小冰并非人類的前提下,已讓小冰與人類用戶完成了累計超過60萬通電話交流。小米生態(tài)鏈企業(yè)億聯(lián)客開發(fā)的Yeelight語音助手是全球首個搭載全雙工語音交互感官的智能設(shè)備,其硬件產(chǎn)品已開始進入千家萬戶。
開源框架讓更多開發(fā)者駕馭機器學(xué)習(xí)
今天人工智能的發(fā)展處于一個百家爭鳴的發(fā)展階段,開源框架內(nèi)的人工智能技術(shù)發(fā)展得尤其活躍。而不斷敞開胸懷擁抱開源的微軟,也與時俱進地推出了開放人工智能平臺(Open AI)戰(zhàn)略及開發(fā)工具,積極參與和推動技術(shù)的創(chuàng)新與快速發(fā)展。
在支持諸如TensorFlow、CNTK等業(yè)界主流的深度學(xué)習(xí)平臺的同時,微軟還發(fā)起了開放神經(jīng)網(wǎng)絡(luò)交換(ONNX)項目,旨在推動人工智能研究的互操作性,讓任何深度學(xué)習(xí)框架在任何芯片與任何設(shè)備上都能運行。目前,已經(jīng)有15家公司支持ONNX,并且還有更多公司正在加入進來?,F(xiàn)在已經(jīng)有PyTorch等六種頂級框架支持ONNX,其它框架則可以通過轉(zhuǎn)換器獲得支持。
在Build 2018微軟全球開發(fā)者大會上,微軟宣布推出跨平臺、開源機器學(xué)習(xí)框架ML.NET開放預(yù)覽。ML.NET讓任何 .NET開發(fā)者都能開發(fā)出自己的定制化機器學(xué)習(xí)模型,并將其融入到自己的應(yīng)用中去——開發(fā)者完全無需具備開發(fā)和調(diào)試機器學(xué)習(xí)模型的經(jīng)驗。這一框架最初由微軟研究院開發(fā),并且在Windows、Bing、Azure等微軟產(chǎn)品上都得到了成功的應(yīng)用。通過將這一技術(shù)框架開源,微軟希望能夠為每一位開發(fā)者賦予駕馭機器學(xué)習(xí)的能力。
微軟Project Brainwave能利用Azure上最先進的FPGA基礎(chǔ)架構(gòu)完成實時的人工智能處理。用戶只需通過實時的單一批數(shù)據(jù),就能得到以往需要多得多的批數(shù)據(jù)處理才能得到的性能,真正實現(xiàn)人工智能的實時計算。而且,F(xiàn)PGA運算不僅僅只在云端提供——通過合作伙伴,也可以通過Azure Stack混合云在本地提供FPGA。如此強大的實時計算能力不僅存在于云端,同時也適用于邊緣計算,這將讓更多創(chuàng)新成為可能。
微軟研究院,開啟人工智能的未來
今天,人工智能已經(jīng)在潛移默化間給人們生活、工作的方式帶來巨大的改變,那么未來的人工智能技術(shù)將如何發(fā)展?將近20年前,微軟在北京成立了微軟亞洲研究院,與微軟研究院遍布全球各地的科研實驗室一起,以全球最頂尖的智慧解決計算機科學(xué)中最具挑戰(zhàn)性的難題,并為未來5到10年的發(fā)展開啟更多可能。
作為美國以外規(guī)模最大、功能最全的研究機構(gòu),微軟亞洲研究院在計算機視覺、自然語言理解等方面取得了舉世矚目的突破,甚至已經(jīng)接近或者達到了人類的水平:在計算機視覺方面,2015年微軟亞洲研究院發(fā)布的152層殘差網(wǎng)絡(luò)(ResNet)的圖像識別準確率已經(jīng)達到96%,勝過人類;2017年8月,微軟在Switchboard語音識別基準測試中的錯誤率已經(jīng)降低至5.1%,達到了媲美人類專業(yè)速記員的水平;2018年1月,微軟亞洲研究院自然語言計算組率先在斯坦福大學(xué)發(fā)起的SQuAD文本理解挑戰(zhàn)賽上獲得超越人類的分數(shù);2018年3月,微軟亞洲研究院與微軟雷德蒙研究院宣布,其研發(fā)的機器翻譯系統(tǒng)在通用新聞報道測試集newstest2017的中-英測試集上,第一個達到了可以與人工翻譯媲美的水平。
微軟亞洲研究院開發(fā)的OCR (Optical Character Recognition光學(xué)字符識別)技術(shù),將為各種人工智能應(yīng)用增加圖形文字識別功能,目前支持從Office到Skype、Bing、HoloLens的微軟應(yīng)用,能識別打印字體、美術(shù)字、手寫字體,可以滿足從智能云到邊緣計算的各種場景。目前手寫識別OCR引擎V3.0版本的精度達到了70.5%,已經(jīng)部署于微軟認知服務(wù),可供開發(fā)者用于自己開發(fā)的智能應(yīng)用。