柴洪峰教授介紹說:“中國(guó)銀聯(lián)有豐富的大數(shù)據(jù)資源,涉及43億張銀行卡,超過9億的持卡人,超過一千萬(wàn)戶的商戶,每天有七千萬(wàn)筆的交易數(shù)據(jù),每天核心交易數(shù)據(jù)都要超過TB級(jí),我們銀聯(lián)的數(shù)據(jù)資源無(wú)論宏觀層面還是微觀層面都有很高的價(jià)值。這個(gè)價(jià)值體現(xiàn)在哪?我就要說一下銀聯(lián)的數(shù)據(jù)價(jià)值,支付數(shù)據(jù)的特點(diǎn)是更具參考性,他們可以衡量真實(shí)的購(gòu)買行為,從而促進(jìn)用戶定向,個(gè)性定價(jià),產(chǎn)品推薦,用戶忠誠(chéng)度和流失建模等策略。”
壓力與挑戰(zhàn)
銀聯(lián)開展大數(shù)據(jù)工作有很多背景要素,從銀聯(lián)支付數(shù)據(jù)看,銀聯(lián)數(shù)據(jù)處理過程中也遇到了挑戰(zhàn)。銀聯(lián)原來(lái)的處理方法已經(jīng)滿足大數(shù)據(jù)的需求,從銀聯(lián)自身業(yè)務(wù)看,很多精細(xì)化的業(yè)務(wù)也需要大數(shù)據(jù)的強(qiáng)力支撐。從合作伙伴角度來(lái)看,合作伙伴對(duì)多樣性的數(shù)據(jù)服務(wù)有需求,從電子商務(wù)這個(gè)行業(yè)來(lái)看,通過大數(shù)據(jù)的挖掘來(lái)提升行業(yè)發(fā)展水平。從國(guó)家示范項(xiàng)目建設(shè)來(lái)看,大數(shù)據(jù)相關(guān)工作也是銀聯(lián)承接國(guó)家項(xiàng)目的工作重點(diǎn),銀聯(lián)也在這方面加大了力度。銀聯(lián)對(duì)大數(shù)據(jù)有個(gè)指導(dǎo)思想,首先我們希望整合各類內(nèi)外部的數(shù)據(jù),通過大家合作,基于這些數(shù)據(jù),建立相應(yīng)大數(shù)據(jù)基礎(chǔ)設(shè)施,可以使這些數(shù)據(jù)可以安全方便獲取,基于大數(shù)據(jù)的平臺(tái),我們會(huì)開展大跨度的數(shù)據(jù)統(tǒng)計(jì)分析以及深度化的數(shù)據(jù)挖掘工作,這些分析和挖掘工作對(duì)外對(duì)內(nèi)合作伙伴都進(jìn)行服務(wù)。
大數(shù)據(jù)系統(tǒng)實(shí)踐
銀聯(lián)大數(shù)據(jù)分四個(gè)層次,這個(gè)層次就是基礎(chǔ)數(shù)據(jù),基礎(chǔ)平臺(tái),基礎(chǔ)數(shù)據(jù),模型研究和應(yīng)用服務(wù),建設(shè)大數(shù)據(jù)平臺(tái)是銀聯(lián)開展大數(shù)據(jù)工作的第一步,有一個(gè)云平臺(tái),充分匯集各方面的數(shù)據(jù),我們集成常見的分布式機(jī)器學(xué)習(xí)算法,我們已經(jīng)支撐了十幾個(gè)業(yè)務(wù)應(yīng)用系統(tǒng)在實(shí)際生產(chǎn)著。我們和新華社一塊聯(lián)合發(fā)布了銀行卡消費(fèi)信心指數(shù),BCCI,通過這個(gè)指數(shù)可以讀出居民消費(fèi)水平和居民消費(fèi)結(jié)構(gòu)的變化。銀聯(lián)大數(shù)據(jù)也在BCCI指數(shù)上有所體現(xiàn)。我們利用大數(shù)據(jù),也為持卡人提供數(shù)據(jù)服務(wù),首先持卡人可以通過銀聯(lián)錢包這一手機(jī)APP平臺(tái),查詢到自己各張銀行卡的歷史交易。同時(shí)可以向持卡人提供更為豐富的持卡人帳單這些服務(wù)??蛻舻募?xì)分工作也是今后電子商務(wù)與電子支付行業(yè)的熱點(diǎn)和重點(diǎn),銀聯(lián)大數(shù)據(jù)實(shí)踐,基于外部數(shù)據(jù)和數(shù)據(jù)量化的指標(biāo)以及數(shù)據(jù)總體特征,基于數(shù)據(jù)量化指標(biāo),我們可以分析出每個(gè)持卡人的個(gè)體特征,基于持卡人個(gè)體特征和總體特征,我們可以為持卡人打上各類類型的標(biāo)簽。如商旅標(biāo)簽,醫(yī)療標(biāo)簽,購(gòu)車標(biāo)簽,形成我們每個(gè)人購(gòu)買習(xí)慣、生活習(xí)慣的圖象。除了持卡人維度,我們?cè)谏虘艟S度上做了相應(yīng)的工作,我們?yōu)樯虘籼峁┫鄳?yīng)的商業(yè)智能分析,可以使商戶認(rèn)識(shí)到自身的經(jīng)營(yíng)情況,我們還為商戶提供同業(yè)商戶的比較,為商戶提供最佳合作對(duì)象,也是他這個(gè)鏈條當(dāng)中的合作對(duì)象的聯(lián)合服務(wù)。同時(shí)我們也為商戶提供了客戶忠誠(chéng)度、流失商戶的分析、回頭客的分析等等。
同時(shí)我們大數(shù)據(jù)還應(yīng)用到了風(fēng)險(xiǎn)控制領(lǐng)域。我們利用機(jī)器學(xué)習(xí)的方法,對(duì)銀聯(lián)歷史數(shù)據(jù)進(jìn)行挖掘,得到了七大交易的判斷模型,可以對(duì)銀聯(lián)轉(zhuǎn)接交易系統(tǒng)進(jìn)行實(shí)時(shí)的判斷。銀聯(lián)大數(shù)據(jù)還有一個(gè)實(shí)踐,就是數(shù)據(jù)集合工作,這源于我們對(duì)大數(shù)據(jù)不同階段的認(rèn)識(shí)。我們認(rèn)為大數(shù)據(jù)從1.0、2.0、3.0不同發(fā)展階段,各階段的成熟度逐步提升,我們很清楚銀聯(lián)大數(shù)據(jù)資源有很高的質(zhì)量和價(jià)值,但有些不足。使得我們對(duì)終端客戶的到達(dá)能力還是有限的,因此我們希望通過數(shù)據(jù)的集合工作,融合內(nèi)外部的數(shù)據(jù),從而使銀聯(lián)的數(shù)據(jù)得到價(jià)值的提升。
我們?cè)跀?shù)據(jù)集合方面嘗試從兩個(gè)角度,第一利用公開的外部技術(shù)進(jìn)行集合,我們利用爬蟲技術(shù),在互聯(lián)網(wǎng)上找持卡人、商戶的信息。另外通過合作伙伴的數(shù)據(jù)進(jìn)行集合,如通信運(yùn)營(yíng)商的相關(guān)數(shù)據(jù),大家都知道斯諾登事件,說一個(gè)消息,如果利用一個(gè)月你的電話信息和一個(gè)月的信用卡信息,基本上分析這個(gè)人是什么樣的人,什么行為的人,是什么家庭背景的人,就能分析出來(lái)了,我們現(xiàn)在正在和通信運(yùn)營(yíng)商來(lái)做這項(xiàng)工作。
對(duì)于金融的大數(shù)據(jù),我們還是認(rèn)為這將是大數(shù)據(jù)最有可為的領(lǐng)域之一。金融機(jī)構(gòu)可以說是大數(shù)據(jù)天生的合作者,一方面自身有著強(qiáng)烈的利用技術(shù)紅利帶來(lái)收益沖動(dòng),另一方面又有國(guó)內(nèi)較好良好的信息化基礎(chǔ),從數(shù)據(jù)層面,金融領(lǐng)域有著優(yōu)質(zhì)的數(shù)據(jù)資源,從技術(shù)層面看,金融企業(yè)的技術(shù)團(tuán)隊(duì)也有強(qiáng)大的實(shí)力,從思維層面看,金融行業(yè)擁有最專業(yè)的金融能力,可以研究和開發(fā)最專業(yè)的金融大數(shù)據(jù)的產(chǎn)品和服務(wù)。面向金融大數(shù)據(jù)帶給行業(yè)的變革將是全方位的,例如在信用風(fēng)險(xiǎn)評(píng)估方面,實(shí)際我們征用系統(tǒng)還有待進(jìn)一步挖掘,服務(wù)于這個(gè)社會(huì)。同時(shí)也可以在客戶服務(wù)方面基于大數(shù)據(jù)的技術(shù),也可以實(shí)現(xiàn)對(duì)客戶智能化的服務(wù)。在智能運(yùn)營(yíng)方面,大數(shù)據(jù)技術(shù)也可以對(duì)金融企業(yè)的數(shù)據(jù)進(jìn)行分析,從而幫助金融機(jī)構(gòu)進(jìn)行運(yùn)營(yíng)決策,降低成本,在產(chǎn)品創(chuàng)新方面,大數(shù)據(jù)參與新產(chǎn)品的設(shè)計(jì),結(jié)合各方的數(shù)據(jù),使企業(yè)產(chǎn)品推陳出新??傊鹑诜?wù)將從粗放式管理轉(zhuǎn)向科學(xué)化的管理,從以利潤(rùn)為中心轉(zhuǎn)向以客戶為中心。銀聯(lián)大數(shù)據(jù)將圍繞客戶服務(wù)展開,結(jié)合內(nèi)外部的資源,形成對(duì)持卡人的各方面認(rèn)知,如消費(fèi)習(xí)慣、生活習(xí)慣,基于持卡人的認(rèn)知,我們可以形成持卡人的響應(yīng)預(yù)測(cè)。比如精準(zhǔn)營(yíng)銷,個(gè)性化服務(wù),在商戶層面,我們同樣會(huì)基于大數(shù)據(jù)的資源,形成對(duì)商戶各方面進(jìn)一步深度的認(rèn)知。如商戶的客戶群體經(jīng)營(yíng)狀況,基于這些認(rèn)識(shí),我們將會(huì)形成商戶的響應(yīng)預(yù)測(cè),如商戶的發(fā)展預(yù)測(cè),信用評(píng)估。
銀聯(lián)大數(shù)據(jù)工作將圍繞提供穩(wěn)定、高效、豐富的數(shù)據(jù)服務(wù)開展工作,我們還將提升大數(shù)據(jù)系統(tǒng)的穩(wěn)定性和效率。我們認(rèn)為在大數(shù)據(jù)快速發(fā)展的背景下,合作共贏是大勢(shì)所趨,合作共贏第一方面是數(shù)據(jù)的互補(bǔ),數(shù)據(jù)的共享,可以融合,創(chuàng)造新的價(jià)值。第二方面是資源的互補(bǔ),資源的協(xié)同合作將帶來(lái)挖掘能力的提升,合作共贏的第三方面是業(yè)務(wù)互補(bǔ)。業(yè)務(wù)的互補(bǔ)與互用將發(fā)揮出大數(shù)據(jù)的最大效用,通過數(shù)據(jù)、資源等多方面的合作,必然可以產(chǎn)生眾多聯(lián)合跨界的創(chuàng)新成果??梢越o大家大數(shù)據(jù)建設(shè)帶來(lái)更廣闊的想象發(fā)展空間。合作共贏是銀聯(lián)的一貫態(tài)度,我們的合作領(lǐng)域可以在很多方面,包括技術(shù)交流合作,數(shù)據(jù)的開放共享,模型模式的研究,行業(yè)的最佳實(shí)踐,以及數(shù)據(jù)的應(yīng)用合作,銀聯(lián)愿攜手各方合作伙伴,共建銀行卡產(chǎn)業(yè)的大數(shù)據(jù)生態(tài)系統(tǒng)。
技術(shù)展望
我們對(duì)大數(shù)據(jù)的展望。首先大數(shù)據(jù)是在發(fā)展中完善的。在很多角度都體現(xiàn)了兩面性,大數(shù)據(jù)一方面在很多行業(yè)被廣泛應(yīng)用,一方面又不夠成熟。大數(shù)據(jù)使用了全新的技術(shù)框架,但有時(shí)又不適宜傳統(tǒng)的應(yīng)用場(chǎng)景,大數(shù)據(jù)概念已經(jīng)充分被解讀,但高價(jià)值的應(yīng)用卻不豐富。大數(shù)據(jù)一方面百花齊放,一方面存在應(yīng)用對(duì)接不平滑的現(xiàn)象。我們認(rèn)為再經(jīng)過一段大家的努力,大數(shù)據(jù)的價(jià)值可以得到進(jìn)一步的凸顯,但是是不是一個(gè)通用性的技術(shù),有待考量。
第二個(gè)感悟,關(guān)于數(shù)據(jù)開放中的信息安全問題,數(shù)據(jù)開放帶來(lái)數(shù)據(jù)價(jià)值的提升,帶來(lái)1+1>2的效果,但是也會(huì)帶來(lái)信息安全的問題,如個(gè)人隱私泄露的問題,更好的提升大數(shù)據(jù)的價(jià)值,我們需要法律政策層面的指導(dǎo)。更需要政府和企業(yè)的眾多嘗試,也需要在座各位朋友們大家互相支持,能夠產(chǎn)生合作。