兩年前,大語言模型(LLM)的出現(xiàn),引發(fā)了全球科技從業(yè)者的普遍關(guān)注和行業(yè)熱潮。ChatGPT 月活用戶數(shù)以史上最快速度達(dá)到 1 億,AI 行業(yè)迎來“ChatGPT時(shí)刻”。經(jīng)過一段時(shí)間的狂奔,LLM性能階段性趨于飽和,大模型底層推動(dòng)力逐漸收斂到少數(shù)擁有核心數(shù)據(jù)及算力資源的公司,行業(yè)注意力也更多轉(zhuǎn)到了以Agent為代表的行業(yè)應(yīng)用側(cè)。
如何解放 LLM 應(yīng)用的局限性。王維強(qiáng)調(diào),高質(zhì)量的行業(yè)數(shù)據(jù)和專業(yè)工具是 AI 繼續(xù)發(fā)展的關(guān)鍵壁壘和門檻,行業(yè)應(yīng)用需要系統(tǒng)性地解決專業(yè)嚴(yán)謹(jǐn)和安全可信等問題。螞蟻數(shù)科“蟻天鑒”產(chǎn)品,集大模型安全測(cè)評(píng)與防御為一體,讓大模型在生產(chǎn)和使用過程中更安全、可控、可靠。
他認(rèn)為,高質(zhì)量數(shù)據(jù)可以更好地模擬客觀世界,提升模型的準(zhǔn)確性和穩(wěn)定性。過去十年,伴隨著AI發(fā)展的范式轉(zhuǎn)移,對(duì)數(shù)據(jù)的要求也在持續(xù)改變。機(jī)器學(xué)習(xí)從“以模型為中心”轉(zhuǎn)向“以數(shù)據(jù)為中心”。在當(dāng)下的 LLM時(shí)代,行業(yè)應(yīng)用要做到安全可信,其核心是如何結(jié)合專業(yè)人工+AI算法的高效標(biāo)注,產(chǎn)生高質(zhì)量的標(biāo)注數(shù)據(jù)。
而面向未來的AGI時(shí)代,隨著互聯(lián)網(wǎng)公開數(shù)據(jù)逐步耗盡,以及GPT-o1帶來的強(qiáng)化學(xué)習(xí)訓(xùn)練新范式,都預(yù)示著數(shù)據(jù)合成的重要性進(jìn)一步提升。王維指出,如何通過仿真引擎、自博弈(self-play)強(qiáng)化學(xué)習(xí)的方式,合成出更多互聯(lián)網(wǎng)所不覆蓋的高質(zhì)量、高價(jià)值領(lǐng)域數(shù)據(jù),將是到達(dá)AGI時(shí)代的關(guān)鍵。
他也提醒道,AI 是把雙刃劍,AIGC濫用所帶來的風(fēng)險(xiǎn)需要系統(tǒng)性應(yīng)對(duì)。不久前,“AI 教父” 杰弗里?辛頓(Geoffrey E. Hinton)在采訪中再次強(qiáng)調(diào)了其對(duì)AI安全問題的強(qiáng)烈擔(dān)憂。他與另外兩位圖靈獎(jiǎng)得主約書亞?本吉奧(Yoshua Bengio)、姚期智及來自世界各地的幾十位科學(xué)家共同簽署了一封公開信——“AI 安全國際對(duì)話威尼斯共識(shí)”,呼吁為推動(dòng)人工智能的發(fā)展制定更好的保障措施。
他們?cè)诠_信中警告道,“隨著人工智能的快速發(fā)展,這些‘災(zāi)難性的結(jié)果’隨時(shí)可能發(fā)生?!本科鋯栴}根源,在于 AIGC 的濫用不僅會(huì)產(chǎn)生虛假信息和網(wǎng)絡(luò)釣魚攻擊,還可能引發(fā)全球性的詐騙活動(dòng)。其中,值得關(guān)注的一大風(fēng)險(xiǎn)來源便是Deepfake, 即基于深度學(xué)習(xí)算法,從大量的視頻和圖像數(shù)據(jù)中學(xué)習(xí),偽造出逼真的面部動(dòng)畫和語音。
王維介紹,螞蟻數(shù)科旗下身份安全品牌 ZOLOZ 為此專門研發(fā)了綜合防控產(chǎn)品 ZOLOZ Deeper,以應(yīng)對(duì)在開戶、登錄、支付等各種場(chǎng)景的深度偽造風(fēng)險(xiǎn)。在服務(wù)印尼某頭部銀行后,產(chǎn)品上線一個(gè)月時(shí)間內(nèi)實(shí)現(xiàn)了 Deepfake 風(fēng)險(xiǎn)“0 漏過”。