谷歌聯(lián)邦學習研討會
會上,楊強教授發(fā)表了特邀報告——《安全的聯(lián)邦遷移學習:在保護隱私的前提下共享知識》(Secure Federated Transfer Learning:Knowledge Sharing without Compromising Privacy)。他在報告中指出,聯(lián)邦學習技術(shù)將成為破解智能時代數(shù)據(jù)保護和用戶隱私保護難題的利器,成為推動人工智能產(chǎn)業(yè)化成功的重要驅(qū)動力。
楊強教授特邀報告
聯(lián)邦學習將引領(lǐng)下一波機器學習技術(shù)商業(yè)化浪潮
人工智能不斷進化的背后,也是機器學習的不斷進化。那么,機器學習正在朝哪個方向發(fā)展?這種趨勢又將如何影響整個人工智能產(chǎn)業(yè)?
人工智能落地面臨的主要困境是數(shù)據(jù)問題,“小數(shù)據(jù)”和“數(shù)據(jù)孤島”一定程度上阻礙了人工智能的商業(yè)化進程。針對小數(shù)據(jù)難題,楊強教授和團隊提出了“遷移學習”的理論體系,并將其應用于推薦系統(tǒng)等實際應用中,讓機器具備了知識遷移、“舉一反三”的學習能力,在第30屆神經(jīng)信息處理系統(tǒng)大會(NIPS 2016)上,著名人工智能專家吳恩達總結(jié)機器學習發(fā)展趨勢時曾表示:“在監(jiān)督學習之后,遷移學習將引領(lǐng)下一波機器學習技術(shù)商業(yè)化浪潮。”
隨著數(shù)據(jù)隱私保護和數(shù)據(jù)安全形勢日益嚴峻,GDPR等一系列嚴格的數(shù)據(jù)隱私保護法律法規(guī)出臺,出于政策法規(guī)、商業(yè)競爭等因素,機構(gòu)間數(shù)據(jù)很難互通, “數(shù)據(jù)孤島”成為人工智能落地的更大阻礙之一,遷移學習或許能解決小數(shù)據(jù)問題,但如何實現(xiàn)行業(yè)內(nèi)甚至跨行業(yè)的更大范圍合作,對人工智能商業(yè)化來說更為重要。這不僅僅是技術(shù)問題,更成為一個復雜的社會問題。
聯(lián)邦學習作為分布式的機器學習范式,可以有效解決數(shù)據(jù)孤島問題,讓參與方在不共享數(shù)據(jù)的基礎(chǔ)上聯(lián)合建模,能從技術(shù)上打破數(shù)據(jù)孤島,實現(xiàn)AI協(xié)作。谷歌在2016年提出了針對手機終端的聯(lián)邦學習,微眾銀行AI團隊則從金融行業(yè)實踐出發(fā),關(guān)注跨機構(gòu)跨組織的大數(shù)據(jù)合作場景,首次提出“聯(lián)邦遷移學習”的解決方案,將遷移學習和聯(lián)邦學習結(jié)合起來。據(jù)楊強教授在“聯(lián)邦學習研討會”上介紹,聯(lián)邦遷移學習讓聯(lián)邦學習更加通用化,可以在不同數(shù)據(jù)結(jié)構(gòu)、不同機構(gòu)間發(fā)揮作用,沒有領(lǐng)域和算法限制,同時具有模型質(zhì)量無損、保護隱私、確保數(shù)據(jù)安全的優(yōu)勢。
開源框架推動聯(lián)邦學習落地應用
近年來對聯(lián)邦學習的研究不斷涌現(xiàn),谷歌TensorFlow Federated(TFF)開源框架和微眾銀行Federated AI Technology Enabler(FATE)開源框架的推出更是加速了聯(lián)邦學習從概念走向行業(yè)落地應用。
2019年3月,谷歌開源了TFF,可用于去中心化數(shù)據(jù)的機器學習及運算實驗,為開發(fā)者提供分布式機器學習,以便在沒有數(shù)據(jù)離開設(shè)備的情況下,便可在多種設(shè)備上訓練共享的機器學習模型。
而FATE是2019年2月微眾銀行AI團隊對外發(fā)布的自主研發(fā)開源項目,也是全球首個聯(lián)邦學習開源框架,為聯(lián)邦AI生態(tài)提供了工業(yè)級別的聯(lián)邦學習框架。提供了基于數(shù)據(jù)隱私保護的分布式安全計算框架,為機器學習、深度學習、遷移學習算法提供高性能的安全計算支持,安全計算包括同態(tài)加密、秘密共享、哈希散列等多種多方安全計算協(xié)議。同時,FATE提供了一套友好的跨域交互信息管理方案,解決了聯(lián)邦學習信息安全審計難的問題。簡單易用的開源工具平臺能有效幫助多個機構(gòu)在滿足用戶隱私保護、數(shù)據(jù)安全和政府法規(guī)的前提下,進行多方數(shù)據(jù)使用和聯(lián)合建模。目前FATE已經(jīng)在信貸風控,客戶權(quán)益定價,監(jiān)管科技等領(lǐng)域推動應用落地。
走向未來的聯(lián)邦學習技術(shù)
未來,聯(lián)邦學習將走向何方?谷歌研討會上總結(jié)了未來聯(lián)邦學習的主要研究方向:讓聯(lián)邦學習更加高效和有效;拓展聯(lián)邦學習邊界,解決更多問題;探索聯(lián)邦學習新的應用場景;增強聯(lián)邦學習的健壯性和抵御攻擊的能力;突破準確性和實用性目標,更加關(guān)注隱私、安全和公平。
谷歌聯(lián)邦學習研討會閉幕總結(jié)
6月17日,國家新一代人工智能治理專業(yè)委員會發(fā)布《新一代人工智能治理原則——發(fā)展負責任的人工智能》,提出了人工智能治理的框架和行動指南。新發(fā)布的《治理原則》,強調(diào)了和諧友好、公平公正、包容共享、尊重隱私、安全可控、共擔責任、開放協(xié)作、敏捷治理等八條原則。這些原則也正與聯(lián)邦學習的發(fā)展方向相一致,而相關(guān)政策對于隱私保護和開放協(xié)作的要求也為聯(lián)邦學習的進一步發(fā)展提供了政策驅(qū)動力。
無論是從技術(shù)發(fā)展路徑,還是政策法規(guī)大環(huán)境來看,可以預見的是,聯(lián)邦學習將成為下一個推動機器學習取得商業(yè)化成績的主要驅(qū)動技術(shù),對于聯(lián)邦學習的研究和落地探索不會停止。在科技之外,聯(lián)邦學習涉及經(jīng)濟學、法律等多領(lǐng)域,在公平有效的激勵機制下,多方共同參與,建立公平健康可持續(xù)的合作生態(tài),才能真正實現(xiàn)“君子和而不同”的“聯(lián)邦”初衷,讓科技向善,普惠大眾。