相比去年云棲大會發(fā)布的版本,“聽悟”今年在技術(shù)和產(chǎn)品功能上進(jìn)行了全方位升級,新增三大核心AI能力:中英文自由說,采用內(nèi)嵌多語種專家模塊的“混合專家系統(tǒng)”,無需手動切換語種即可準(zhǔn)確識別中英大篇幅混說的場景;會議實時翻譯,邊說邊翻譯,無需等待,讓跨國溝通更加高效順暢;QA問答對抽取,結(jié)合說話人特征、多階段訓(xùn)練技術(shù),自動提取問題,讓訪談?wù)砀p松。
同時,針對會議行業(yè)伙伴及企業(yè)用戶的多樣化需求,“聽悟”發(fā)布了PaaS產(chǎn)品形態(tài),以簡單易調(diào)用的接口方式開放核心能力,并提供多種前沿創(chuàng)新算法,從而滿足企業(yè)在音視頻會議、培訓(xùn)直播、招聘面試、智能客服等多種細(xì)分場景的不同需求。
阿里巴巴達(dá)摩院語音實驗室負(fù)責(zé)人鄢志杰表示,“過去十年‘人-機(jī)’交流是語音AI解鎖的核心場景,更復(fù)雜的‘人-人’交流是下一個高地,未來聽悟?qū)⒃凇?人’交流場景繼續(xù)深入探索,提供安全、保真、精準(zhǔn)的AI識別、分析與理解能力,并基于內(nèi)容為企業(yè)提供多種智能辦公服務(wù),讓AI真正為人所用,替人分擔(dān),協(xié)助處理重復(fù)繁瑣的工作事務(wù)。”