佚名 發(fā)表于:14年12月20日 00:37 [轉(zhuǎn)載] 賽迪網(wǎng)
12月19日電據(jù)美國(guó)《福布斯》12月18日?qǐng)?bào)道,百度語(yǔ)音識(shí)別技術(shù)取得世界級(jí)突破,在嘈雜環(huán)境下的語(yǔ)音識(shí)別率明顯優(yōu)于Google、蘋(píng)果等科技巨頭。
這項(xiàng)技術(shù)突破是百度CEO李彥宏的前瞻性視野和技術(shù)布局結(jié)出的碩果之一。2013年初,百度成立深度學(xué)習(xí)研究院,李彥宏親自擔(dān)任院長(zhǎng),將語(yǔ)音和圖像作為重點(diǎn)突破方向,面向全球廣攬賢才。今年5月,百度研究院組建,下轄北京深度學(xué)習(xí)實(shí)驗(yàn)室、大數(shù)據(jù)實(shí)驗(yàn)室和硅谷人工智能實(shí)驗(yàn)室。李彥宏將全球最為知名的人工智能專(zhuān)家吳恩達(dá)招致麾下,出任百度首席科學(xué)家。如今,群星璀璨的百度研究院云集了一大批世界頂級(jí)人工智能專(zhuān)家,在語(yǔ)音和圖像等領(lǐng)域取得了突出進(jìn)展,引領(lǐng)著全球人工智能的技術(shù)創(chuàng)新。這些技術(shù)成果正在被快速應(yīng)用于百度生態(tài)的產(chǎn)品與服務(wù)當(dāng)中,讓用戶廣為受益。
《福布斯》報(bào)道說(shuō),百度研發(fā)的“Deep Speech”是一款采用深度學(xué)習(xí)技術(shù)的語(yǔ)音識(shí)別系統(tǒng),它可以在飯店等嘈雜環(huán)境下實(shí)現(xiàn)將近 81% 的辨識(shí)準(zhǔn)確率。相比之下,其他商業(yè)版語(yǔ)音識(shí)別 API,包括Bing、Google 以及 Wit.AI 等的最高識(shí)別率卻只有65%。與頂級(jí)的學(xué)術(shù)型語(yǔ)音識(shí)別模型相比,Deep Speech也高出了9個(gè)百分點(diǎn)。吳恩達(dá)透露,“Deep Speech”的成功很大程度上要取決于百度規(guī)模龐大的深度學(xué)習(xí)基礎(chǔ)設(shè)施,這比他在斯坦福和谷歌使用的系統(tǒng)運(yùn)行速度快了近40倍。
過(guò)去的半個(gè)世紀(jì)里,伴隨創(chuàng)新加速,用戶的技術(shù)使用門(mén)檻在不斷降低,移動(dòng)時(shí)代表達(dá)需求的方式更是發(fā)生著巨大變化。在今年百度世界大會(huì)上,李彥宏提出他對(duì)于未來(lái)科技發(fā)展的行業(yè)洞察——科技正在回歸人性。語(yǔ)音的歷史已有二十萬(wàn)年,是人類(lèi)自然的、低門(mén)檻的表達(dá)方式之一。他認(rèn)為:“未來(lái)5年,消費(fèi)者使用語(yǔ)音和圖像表達(dá)需求的比例將超過(guò)50%”。
首屆百度技術(shù)節(jié)進(jìn)一步明確了百度語(yǔ)音技術(shù)的應(yīng)用方向——推動(dòng)手機(jī)和物聯(lián)網(wǎng)兩場(chǎng)革命。當(dāng)前,物聯(lián)網(wǎng)將傳感器、控制器、人和物等通過(guò)互聯(lián)網(wǎng)技術(shù)連接在一起,語(yǔ)音技術(shù)的成熟將進(jìn)一步提升物聯(lián)網(wǎng)的智能化連接。未來(lái)人們?nèi)粘J褂玫募译娫O(shè)備,如電視機(jī)、微波爐、音樂(lè)播放器等,都可以通過(guò)語(yǔ)音指令操控,提升用戶在移動(dòng)時(shí)代的智能生活體驗(yàn)。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.