隨著大數(shù)據(jù)、機器學習、圖像識別等核心技術的發(fā)展,人工智能正在重構金融服務業(yè)態(tài)。從最初的理念滲透到運營的各個層面,金融機構的業(yè)務流程正在加速向智能化過渡。同時,通過數(shù)據(jù)、技術的驅動,實現(xiàn)高精度反作弊識別,對數(shù)據(jù)更多維度的深度挖掘,將提高金融與場景的融合,重構金融體驗。
作為大數(shù)據(jù)領域的領先人物,白冬立從熱云數(shù)據(jù)近年的的創(chuàng)新與實踐成果出發(fā),與參會人員和嘉賓分享了金融領域大數(shù)據(jù)營銷、反作弊等前沿見解。
白冬立首先介紹了2017年移動廣告點擊數(shù)據(jù),2017年熱云數(shù)據(jù)所服務的1000多家2B客戶,2017年在廣告投放過程中的數(shù)據(jù),也就是廣告點擊數(shù)據(jù)。大家可以看到我們所服務的客戶2017年在互聯(lián)網(wǎng)尤其是移動互聯(lián)網(wǎng)營銷這方面,投放量實際上是逐步在上升的。但是通過監(jiān)測發(fā)現(xiàn),75%以上都是欺詐流量。2017年所監(jiān)測到的全網(wǎng)廣告點擊數(shù)量超過2000億次。到12月份我們知道國內這么多的客戶累計9.5億的設備在移動互聯(lián)網(wǎng)領域的用戶行為數(shù)據(jù),而這些用戶行為數(shù)據(jù)是從廣告點擊開始跳轉到應用的下載頁面,從下載頁面再到產(chǎn)品被使用、激活后續(xù)的行為數(shù)據(jù)包括付費,電商客戶、金融客戶也會把一些消費的數(shù)據(jù)或者說貸款數(shù)據(jù)報送給我們。
白冬立表示熱云數(shù)據(jù)能夠監(jiān)測廣告平臺帶來的客戶的真實性,是否具有欺詐行為,也包括數(shù)據(jù)背后都有什么屬性。當我們有了這么多互聯(lián)網(wǎng)行為數(shù)據(jù)之后,這個服務到底能為客戶帶來什么樣的價值?我們拿到的都是真實的每天上網(wǎng)、使用APP或者玩游戲,甚至是購物的真實行為數(shù)據(jù),將會補充我們真實的數(shù)據(jù)模型。
另外,白冬立介紹到,在這基礎上還做了反欺詐和反作弊的算法服務,因為我們積累了很多數(shù)據(jù),所以我們認為基于歷史數(shù)據(jù)行為其實是可以做這樣的事情,由于我們有些設備的行為已經(jīng)非常清晰了,不用做任何算法、不用做機器學習和人工智能處理就基于真實行為本身可以做一些參考,所以我們做了這樣的服務,另外,各種各樣的流量入口、流量來源、信息流、廣告來檬、Adx/DSP、WAP站最上層的是真實客戶、欺詐流量或者欺詐設備,有這樣的體系我們就可以去為金融以及互聯(lián)網(wǎng)客戶從用戶獲取新增客戶判斷用戶或者設備真假性。一旦我們已經(jīng)知道這個人是誰了、知道真與假了,剩下的事情就是如何留存,或者說讓他盡可能在我們這多消費、讓我們維護他。
剛才我提到了過程當中的防欺詐和反作弊的算法服務,基于我們的統(tǒng)計和數(shù)據(jù)就可以做一些事情。首先第一個設備級的反作弊,因為我們知道現(xiàn)在我們的客戶80%甚至90%以上都是通過移動設備去操作,我們做一件事情就是設備級反作弊是不是模擬器、機刷、是不是預裝等等的,首先先把藍牙識別出來。第二就是黑名單的反作弊,基于我們對用戶歷史行為數(shù)據(jù)的統(tǒng)計和分析得出來的數(shù)據(jù)庫,經(jīng)常作弊的設備做了一個黑名單,我們發(fā)現(xiàn)有很多這樣的移動設備行為已經(jīng)很清晰的知道作弊,一旦發(fā)現(xiàn)有這樣一個設備我們潛意識就認為這是有問題的,所以我們會做標注,會打分評級降低,這個行為跟專家講的基于單個用戶的征信不一樣的地方就在于我們數(shù)據(jù)的量級其實可以做到全網(wǎng)的反作弊模型,
這涉及兩個方面:第一個是跨APP的機器學習,人工智能算法。判斷的標準就在于假設說一個用戶同時或者在很短的時間范圍內再多家相同類型、不同類型APP當中都有異常行為,或者可能會傷害到客戶利益的行為我們都認為有可能在作弊。
第二個就是跨推廣媒體的學習,我們會在多家推廣媒體有做線下的、做視頻廣告和信息流投放的,經(jīng)過這幾步設備級以及我們基于黑名單庫、全網(wǎng)跨APP/跨媒體數(shù)據(jù)分析的話,我們就能夠通過用戶行為數(shù)據(jù)的角度幫助客戶做防欺詐和反作弊工作。
DMP方面,白冬立介紹,把每個客戶身上帶的行為、屬性都做了一些標準化,有了這樣的一個標準化的系統(tǒng)我們就可以對外提供一些服務了,我們會把這些數(shù)據(jù)以標準API接口的形式開放出來,當然我們其實沒有太多客戶的隱私數(shù)據(jù),都是一些互聯(lián)網(wǎng)的行為數(shù)據(jù)去掉敏感的信息之后提供出來的,假設說有一個客戶想要知道用戶的互聯(lián)網(wǎng)行為數(shù)據(jù)我們這里就有一些,我們跟運營商去做“三號合一”做唯一設備識別就可以獲取到一些數(shù)據(jù),都是一些什么數(shù)據(jù)呢?大概就是這樣的8大類、62個標簽以及400多個二級標簽?;緦傩源蠹叶己苁煜ち?,行為習慣以及興趣偏好,更多的我認為我們的價值停留在用戶互聯(lián)網(wǎng)行為數(shù)據(jù)偏好這塊,如果大家對這塊數(shù)據(jù)有訴求的話我們可以提供這方面的支持和保障。
基于數(shù)據(jù)、算力和新的人工智能算法的提升,白冬立認為,未來各行業(yè)將迎來人工智能爆發(fā)的時代,而熱云數(shù)據(jù)作為第三方獨立的大數(shù)據(jù)服務提供商,會在這個大趨勢里有更加廣闊的發(fā)展空間,為客戶提供更多的優(yōu)質數(shù)據(jù)產(chǎn)品服務。