此次合作,雙方將聚焦中國人保財險智能化系統(tǒng)建設(shè),以云知聲醫(yī)療文書OCR文字識別、大規(guī)模醫(yī)療知識圖譜、醫(yī)療審核知識服務(wù)模型等AI技術(shù)為支撐,針對商業(yè)險案件理賠中的醫(yī)療費用相關(guān)內(nèi)容,實現(xiàn)醫(yī)療費用的全自動智能化審核,打造有溫度有效率的保險審核服務(wù)。
據(jù)悉,此次與中國人保財險的合作,得益于云知聲在醫(yī)療質(zhì)量管理領(lǐng)域、特別是病歷質(zhì)控方面的深厚技術(shù)積累——應(yīng)用臨床知識圖譜及自然語言處理技術(shù),打造具有醫(yī)學(xué)知識和最佳臨床實踐的虛擬醫(yī)生,充分理解電子病歷針對患者的診療行為,發(fā)現(xiàn)電子病歷中的不完整、不規(guī)范、不一致、不合理等問題,以此提升醫(yī)療病歷質(zhì)量。而這些能力也可應(yīng)用到商業(yè)險理賠的醫(yī)療費用審核上。
值得一提的是,此次合作并不是云知聲與中國人保財險的首次攜手。早在此前,云知聲就曾助其打造智能監(jiān)管平臺,用于醫(yī)保基金常規(guī)監(jiān)管及飛行檢查等場景使用。能夠再次贏得中國人保財險的青睞,云知聲的AI技術(shù)底色不容忽視。
從感知到認知 云知聲的AI進化之路
云知聲誕生于2012年。彼時,人工智能的第三波發(fā)展浪潮正逐步萌芽。同年6月,云知聲搭建起開放語音云平臺,開始了其在人工智能領(lǐng)域的探索。12月,云知聲深度學(xué)習(xí)語音識別技術(shù)上線,識別率提升至90%以上,成為國內(nèi)最早的深度學(xué)習(xí)商業(yè)化應(yīng)用之一。2013年,云知聲開啟自然語言對話系統(tǒng)和知識圖譜技術(shù)的研發(fā),從感知逐步發(fā)展到認知階段;同年,云知聲“算力-算法-大數(shù)據(jù)” AI基礎(chǔ)架構(gòu)三駕馬車基本成型。對云知聲來說,這無疑是AI能力的又一次躍升。2014年,為解決邊緣側(cè)AI落地問題,云知聲官宣“云端芯”戰(zhàn)略,打造從感知到認知完整的技術(shù)鏈路,構(gòu)建起軟硬件一體的AI全棧技術(shù)與服務(wù)能力。同年,云知聲發(fā)布了業(yè)內(nèi)第一個可實時定制優(yōu)化的對話式交互開放平臺,支持智能車機、家居、音箱、客服等多個領(lǐng)域的口語對話交互。
在探索對話式交互之外,云知聲于2015年開啟認知智能技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用與實踐,并將語言、知識、決策列為其發(fā)展的核心要素——
“在語言方面,其自主研發(fā)的醫(yī)療預(yù)訓(xùn)練語言模型CirBERTa一度登頂中文醫(yī)療信息處理挑戰(zhàn)榜榜首;在知識方面,云知聲構(gòu)建了業(yè)內(nèi)最大的醫(yī)療知識圖譜之一,并憑借“大規(guī)模知識圖譜構(gòu)建技術(shù)及應(yīng)用”獲得2019年北京市科技進步一等獎;在決策方面,云知聲基于圖嵌入學(xué)習(xí)的決策模型已經(jīng)成功應(yīng)用到病歷質(zhì)控、醫(yī)療審核和臨床輔助決策系統(tǒng)中。從2019年至2022年,云知聲的認知智能技術(shù)在國內(nèi)外相關(guān)評測中榮獲7冠5亞,持續(xù)領(lǐng)跑AI賽道。發(fā)展至今,在算力方面,云知聲超算平臺深度學(xué)習(xí)浮點計算能力可達8億億次/秒;算法方面,云知聲已經(jīng)自主積累了完整的語音、語言和視覺AI算法能力。
成立十余年間,云知聲累計儲備知識產(chǎn)權(quán)1300余項,其中專利900余項(80%均為發(fā)明專利),連續(xù)三年參與承建科技部的國家重點研發(fā)計劃——“科技創(chuàng)新2030”新一代人工智能重大項目,并先后獲得中國智能科技最高獎——“吳文俊人工智能科技進步獎”和“北京市科技進步一等獎”“國家級專精特新小巨人”等重要獎項。
深化大語言模型技術(shù),打造ChatGPT行業(yè)版
近日,OpenAI發(fā)布了超級對話模型ChatGPT,其突出的意圖理解、上下文學(xué)習(xí)、思維鏈等能力在業(yè)界引起了廣泛的關(guān)注,被認為是認知智能技術(shù)的一次飛躍,給通用人工智能(AGI)帶來了曙光,也給AI行業(yè)帶來了巨大的機會。很多人預(yù)測,2023年將成為“真正的AI元年”。
盡管ChatGPT預(yù)訓(xùn)練大模型的強大威力讓人驚嘆,但仍有關(guān)鍵問題懸而未決:首先,針對知識性問題,ChatGPT可能以流暢的文本展現(xiàn)錯誤的知識,即“一本正經(jīng),胡說八道”,讓非專業(yè)人員難以發(fā)覺;其次,ChatGPT訓(xùn)練成本高達千萬美元以上,每次請求的成本也高達幾美分,其高昂的費用也束縛著每個自身不具有預(yù)訓(xùn)練大模型開發(fā)能力的玩家,阻礙了其在多個行業(yè)的廣泛應(yīng)用。針對上述問題,在預(yù)訓(xùn)練模型領(lǐng)域發(fā)力已久的云知聲給出解題思路:
01在知識類問題的解答上,云知聲將利用其在CirBERTa中已經(jīng)成功應(yīng)用的持續(xù)學(xué)習(xí)和知識嵌入技術(shù),基于公司在醫(yī)療領(lǐng)域的知識圖譜積累,優(yōu)化ChatGPT模型的知識獲取和更新機制,以保證ChatGPT回答中的知識正確性,并給出知識溯源信息。
02面對逐漸攀升的訓(xùn)練成本,云知聲認為,以一個通用大模型來解決所有行業(yè)深度問題是不現(xiàn)實的。云知聲將打造ChatGPT行業(yè)版,致力以少2個數(shù)量級的參數(shù)規(guī)模,在特定行業(yè)領(lǐng)域的問題上,達到甚至超過ChatGPT的表現(xiàn)。同時,參數(shù)規(guī)模的大幅減少,也將大大降低了訓(xùn)練和服務(wù)成本,讓大語言模型技術(shù)實現(xiàn)真正廣泛應(yīng)用。云知聲將以醫(yī)療行業(yè)為切入口,將其推廣到更多領(lǐng)域,如司法、教育、康養(yǎng)等。隨著圖像生成工具、聊天工具等AIGC走向大眾,人工智能普及應(yīng)用的風(fēng)潮將愈演愈烈。云知聲也將在AI賦能百業(yè)的道路上繼續(xù)深踩油門,持續(xù)迭代AI關(guān)鍵技術(shù),挖掘更多場景需求,實現(xiàn)自身技術(shù)、能力與行業(yè)需求的有效結(jié)合,創(chuàng)造更多社會價值。