「AI 文本理解」模型

·AI有聲內(nèi)容創(chuàng)作平臺,批量高效的生產(chǎn)工具

值得提及的是,火山語音還自主打造了AI有聲內(nèi)容創(chuàng)作平臺,以實現(xiàn)AI多角色有聲內(nèi)容的批量高效生產(chǎn)。簡單來說用戶只需將目標(biāo)書籍文本導(dǎo)入,即可由平臺自動完成角色的抽取、對話/旁白的區(qū)分,同時判定對話所屬的角色和情感。在配音環(huán)節(jié),用戶可以自主選擇配置AI音色來匹配書中各角色,也可選擇簡單標(biāo)定角色人設(shè),依據(jù)平臺內(nèi)置策略一鍵配音。完成配音后,平臺即會根據(jù)自動預(yù)測的信息完成音頻的自動合成和拼接,僅需幾小時便可完成一部數(shù)千章的成品有聲書的生產(chǎn)!

此外,為了滿足連載追更用戶的聽書訴求,平臺還實現(xiàn)了連載自動更新的功能,即收到線上文本更新的通知后,幾秒鐘之內(nèi)即可完成更新章節(jié)音頻的生產(chǎn)和上線,用戶可以通過聽書功能實時追更、無需等待。

最后,為了滿足用戶差異化的創(chuàng)作需求,該平臺還提供了一系列音頻調(diào)整和精修功能,例如指定特定詞語發(fā)音;控制句子的停頓、連讀、語速和音調(diào)等,可以讓AI自動合成的音頻演繹更加完美。

火山語音,長期以來面向字節(jié)跳動各大業(yè)務(wù)線提供優(yōu)質(zhì)的AI語音技術(shù)能力以及全棧語音產(chǎn)品解決方案。目前團隊的語音識別和語音合成覆蓋了多種語言和方言,多篇論文入選各類AI 頂級會議,技術(shù)能力已成功應(yīng)用到抖音、剪映、番茄小說等多款產(chǎn)品上,并通過火山引擎開放給外部企業(yè)。

分享到

zhupb

相關(guān)推薦