為了滿足更多業(yè)務(wù)場(chǎng)景中對(duì)實(shí)體信息的識(shí)別,本次更新新增了二十余種系統(tǒng)內(nèi)置常用實(shí)體,如,數(shù)字、金額、銀行卡號(hào)、郵編、車牌號(hào)等。

2、賬號(hào)體系升級(jí)

為滿足不同客群的需求,本次對(duì)系統(tǒng)的賬號(hào)體系進(jìn)行了全面升級(jí),在之前的多租戶賬號(hào)體系上,增加了多渠道賬號(hào)體系,實(shí)現(xiàn)渠道間的租戶端、管理端數(shù)據(jù)全隔離。

3、情緒識(shí)別結(jié)果輸出

情緒識(shí)別結(jié)果輸出基于情緒引擎分析,自動(dòng)檢測(cè)會(huì)話內(nèi)容中文本蘊(yùn)含的情緒特征,幫助企業(yè)更全面的把握產(chǎn)品體驗(yàn)、監(jiān)控客戶服務(wù)質(zhì)量。

4、NLP原子能力不斷擴(kuò)容

本次升級(jí)除了對(duì)產(chǎn)品體驗(yàn)、數(shù)據(jù)安全、穩(wěn)定運(yùn)行等方面進(jìn)行了數(shù)十項(xiàng)優(yōu)化處理,我們也在持續(xù)不斷擴(kuò)容NLP原子能力。

中文分詞

將自然語言文本切分成語義合理、完整的詞匯序列,并為每個(gè)詞匯賦予一個(gè)詞性,如:動(dòng)詞、名詞、介詞等。

文本糾錯(cuò)

自動(dòng)更正文本中存在錯(cuò)誤的字段,減少由此帶來的語義解析不準(zhǔn)確或閱讀障礙。

知識(shí)聚類

在沒有業(yè)務(wù)場(chǎng)景和標(biāo)準(zhǔn)問的情況下,通過聚類算法對(duì)無標(biāo)簽數(shù)據(jù)集自動(dòng)構(gòu)建業(yè)務(wù)場(chǎng)景和標(biāo)簽。協(xié)助運(yùn)營(yíng)人員進(jìn)行數(shù)據(jù)預(yù)處理,提升數(shù)據(jù)運(yùn)營(yíng)效率,減輕運(yùn)營(yíng)人員工作量。

中心詞提取

基于BERT多任務(wù)訓(xùn)練和MMR重排算法,借助積累的通用、專業(yè)詞庫對(duì)結(jié)果再處理,自動(dòng)提取體現(xiàn)文本核心主題的關(guān)鍵詞語。

文本相似度計(jì)算

基于海量數(shù)據(jù)訓(xùn)練的網(wǎng)絡(luò)模型,計(jì)算兩個(gè)句子之間的相似度,實(shí)現(xiàn)高精度語義相似度比對(duì)。文本相似度可以幫助用戶快速實(shí)現(xiàn)推薦、檢索、排序等應(yīng)用。

句式識(shí)別

輸入對(duì)話中自然語句,返回對(duì)應(yīng)的句式分類結(jié)果。支持陳述句、疑問句、感嘆句和祈使句識(shí)別。

文本摘要

基于深度語義分析模型,自動(dòng)抽取文本中的關(guān)鍵信息生成簡(jiǎn)短的文本摘要。

來源:互聯(lián)網(wǎng)科技看點(diǎn)

分享到

zhangnn

相關(guān)推薦