国产精品一区二区av交换,中文字幕人成无码免费视频,永久免费av无码网站性色av,欧美一道本一区二区三区,樱桃熟了a级毛片

阿里巴巴將如何運(yùn)營數(shù)據(jù)

中國企業(yè)家 發(fā)表于:13年11月12日 10:55 [綜述] DOIT.com.cn

  • 分享:
[導(dǎo)讀]讓大數(shù)據(jù)更好用?阿里巴巴是如何實(shí)現(xiàn)這種轉(zhuǎn)變?從六個(gè)地方入手:確保數(shù)據(jù)安全、保證數(shù)據(jù)的質(zhì)量實(shí)現(xiàn)各個(gè)部門數(shù)據(jù)標(biāo)準(zhǔn)的統(tǒng)一讓原始數(shù)據(jù)變得更精細(xì)化、獲得外部數(shù)據(jù)、建立數(shù)據(jù)委員會(huì)。

從淘寶創(chuàng)立之時(shí),阿里巴巴就開始搜集平臺(tái)上的數(shù)據(jù),直至支付寶、聚劃算、一淘等平臺(tái),隨著業(yè)務(wù)的爆發(fā)式增長(zhǎng),阿里諸平臺(tái)上的數(shù)據(jù)成倍增加,匯集成海。這些數(shù)據(jù)包括交易數(shù)據(jù)、用戶瀏覽和點(diǎn)擊網(wǎng)頁數(shù)據(jù)、購物數(shù)據(jù)等等。當(dāng)海量數(shù)據(jù)開始聚集時(shí),它們也變得良莠不齊,魚龍混雜,充斥著大量失真、標(biāo)準(zhǔn)混亂的數(shù)據(jù)。另一問題是,當(dāng)海量數(shù)據(jù)在一起,它們是無序的,不能直接使用,必需要提煉加工。再者,阿里縱有海量數(shù)據(jù),卻也只是大數(shù)據(jù)之海中的一個(gè)孤島,無法全部滿足平臺(tái)商家的數(shù)據(jù)需求,比如商家需要了解用戶在其它平臺(tái)上的購買情況,阿里巴巴迫切需求外部數(shù)據(jù)。

車品覺稱:“一開始,我們?cè)谟煤脭?shù)據(jù),但是隨著數(shù)據(jù)戰(zhàn)略與平臺(tái)戰(zhàn)略緊密結(jié)合,我們開始刻意地去管理數(shù)據(jù)(保證數(shù)據(jù)安全、質(zhì)量和對(duì)于商家的可用性),養(yǎng)數(shù)據(jù)(有意識(shí)地收集外部數(shù)據(jù)),沉淀數(shù)據(jù)。”

讓大數(shù)據(jù)更好用?阿里巴巴是如何實(shí)現(xiàn)這種轉(zhuǎn)變?從六個(gè)地方入手:確保數(shù)據(jù)安全(保護(hù)商家和個(gè)人的隱私)、保證數(shù)據(jù)的質(zhì)量(去除虛假數(shù)據(jù))、實(shí)現(xiàn)各個(gè)部門數(shù)據(jù)標(biāo)準(zhǔn)的統(tǒng)一(如轉(zhuǎn)化率)、讓原始數(shù)據(jù)變得更精細(xì)化(更符合商家的應(yīng)用情景)、獲得外部數(shù)據(jù)(如并購新浪微博,和其它平臺(tái)合作、購買數(shù)據(jù)信息等)、建立數(shù)據(jù)委員會(huì)。

具體做法

1 去除源頭污染,凈化數(shù)據(jù)質(zhì)量

自阿里巴巴數(shù)據(jù)委員會(huì)建立以來,數(shù)據(jù)質(zhì)量就成了部門的核心工作,車品覺認(rèn)為數(shù)據(jù)質(zhì)量是大數(shù)據(jù)的命門,如果將大數(shù)據(jù)比作水流,“來自任何支流的數(shù)據(jù),如果質(zhì)量有問題,都會(huì)帶來整個(gè)水源的污染。”由于淘寶等平臺(tái)上的數(shù)據(jù)往往良莠不齊,不少數(shù)據(jù)虛假,帶來很大的噪音干擾。“有時(shí),在淘寶平臺(tái)上,對(duì)于一個(gè)人,我們會(huì)看到兩個(gè)手機(jī),一個(gè)iPad,三張信用卡,五個(gè)淘寶帳號(hào),收集數(shù)據(jù)時(shí),以為是多個(gè)人,但實(shí)際上就是一個(gè)人。但如果依照這個(gè)數(shù)據(jù),商家可能就將紅包給了一個(gè)不活躍的賬戶。”為此,阿里巴巴試圖剔除虛假的數(shù)據(jù),讓收集的數(shù)據(jù)能反映真實(shí)的消費(fèi)情景。比如上面的案例,就要鑒定所有這些賬戶、信用卡等是否為同一個(gè)人所有。再如,阿里巴巴經(jīng)常要做產(chǎn)品界面測(cè)試,有時(shí)臨時(shí)修改界面,會(huì)一下子多出一個(gè)按鈕,這就會(huì)帶來大量誤點(diǎn)擊操作,數(shù)據(jù)收集時(shí),就會(huì)得到很多失真的用戶行為數(shù)據(jù)。阿里巴巴的數(shù)據(jù)人員目前的工作就是要將這些失真的數(shù)據(jù)剔除,或者將數(shù)據(jù)還原到真實(shí)的場(chǎng)景。

2 打破分割,統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)

統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),就是讓凈化后的數(shù)據(jù)流得以匯集。阿里巴巴下屬各個(gè)部門業(yè)務(wù)重點(diǎn)不同,對(duì)數(shù)據(jù)的理解不同,因此數(shù)據(jù)標(biāo)準(zhǔn)往往各不相同,比如轉(zhuǎn)化率。要將這些數(shù)據(jù)匯集成大數(shù)據(jù)之海,就必須統(tǒng)一標(biāo)準(zhǔn),這也是阿里巴巴數(shù)據(jù)委員會(huì)目前重點(diǎn)推行的項(xiàng)目。

3 精選+加工——讓數(shù)據(jù)精細(xì)化

“目前,我們需要的用戶數(shù)據(jù),平臺(tái)還給不了。”阿里平臺(tái)上的一個(gè)企業(yè)如是說。很多企業(yè)希望阿里巴巴能將用戶屬性的標(biāo)簽分得更細(xì)(不僅僅按男、女用戶,還進(jìn)一步按不同消費(fèi)特點(diǎn)、收入細(xì)分)。小也化妝品創(chuàng)始人肖尚略認(rèn)為,“平臺(tái)數(shù)據(jù)的細(xì)分是基礎(chǔ),細(xì)分好,企業(yè)才能用好。”數(shù)據(jù)就像炒菜的食材,不同細(xì)致程度的食材炒出的菜,口味不一樣,車品覺這么看。

如何讓數(shù)據(jù)精細(xì)化?阿里巴巴根據(jù)各個(gè)商家的應(yīng)用場(chǎng)景,將原始數(shù)據(jù)打上更細(xì)致、對(duì)商家更有參考價(jià)值的標(biāo)簽。以淘寶平臺(tái)為例,一方面收集用戶信息時(shí),專注對(duì)商家更實(shí)用的內(nèi)容,比如對(duì)于大學(xué)生用戶,除了搜集他們的地址信息外,還通過其它渠道搜集其房租的租金,從而了解對(duì)方的消費(fèi)水平,將這些數(shù)據(jù)提供給相應(yīng)的商家。另一方面根據(jù)商家的應(yīng)用情景,對(duì)數(shù)據(jù)材料做初加工。“比如,如果我們篩出一個(gè)人是否戴眼鏡,戴多少度的數(shù)據(jù),就對(duì)賣眼鏡的商家起到了很大作用。”再如,如果一個(gè)人去母嬰超市里面買東西,不一定能證明他有孩子,但如果這個(gè)人是女性、年紀(jì)又合適,這個(gè)人有孩子的可能性就很大。不斷加入的其它證明信息,讓這個(gè)消費(fèi)者的數(shù)據(jù)變得越來越精細(xì)化。

在數(shù)據(jù)精細(xì)化思路下,2011年底,阿里巴巴的支付寶平臺(tái)開發(fā)黃金策產(chǎn)品,車品覺帶領(lǐng)團(tuán)隊(duì)處理了1億多活躍的消費(fèi)者數(shù)據(jù)后,拿出500個(gè)變量,試圖用它們來描述消費(fèi)者,最終讓企業(yè)能夠隨時(shí)調(diào)用變量,獲得用戶信息,比如某一類包含使用信用卡數(shù)量和手機(jī)型號(hào)等具體信息的客戶數(shù)目。

2013年,天貓開始研發(fā)適用于天貓商家的CRM系統(tǒng),通過對(duì)會(huì)員標(biāo)簽化,讓商戶了解店鋪會(huì)員在天貓平臺(tái)的所有購物行為特點(diǎn)。

4 海納百川,納入更多外部數(shù)據(jù)

在阿里巴巴平臺(tái)上,大多時(shí)候收集的是顧客的顯性需求數(shù)據(jù),如購買的商品和瀏覽等數(shù)據(jù),但顧客在購買之前,就可能通過微博、論壇、導(dǎo)購網(wǎng)站等流露出隱性需求。僅僅做好自己的大數(shù)據(jù)是不夠的,還要納入更多外部數(shù)據(jù)。

2011年以前,阿里曾嘗試通過收購掌握中國互聯(lián)網(wǎng)的底層數(shù)據(jù)。2013年4月,阿里巴巴收購新浪微博18%的股權(quán),獲得了新浪微博幾億用戶的數(shù)據(jù)足跡。5月,阿里巴巴收購高德軟件28%股份,分享高德的地理位置、交通信息數(shù)據(jù)以及用戶數(shù)據(jù)。而其它并購,包括對(duì)墨跡天氣、友盟、美團(tuán)、蝦米、快的、UC瀏覽器,都招招不離數(shù)據(jù)。通過這些并購,阿里在試圖拼出一份囊括互聯(lián)網(wǎng)與移動(dòng)互聯(lián)網(wǎng),涵蓋用戶生活方方面面的全景數(shù)據(jù)圖。

5 加強(qiáng)數(shù)據(jù)安全的管理

很多淘寶賣家希望阿里巴巴能加大數(shù)據(jù)開放的步伐,對(duì)于阿里平臺(tái)來說,這并不是一件容易的事情,因?yàn)檫@關(guān)乎商家和消費(fèi)者的隱私。商家不希望競(jìng)爭(zhēng)對(duì)手獲得自己的機(jī)密信息,消費(fèi)者也不希望被更多干擾。

阿里內(nèi)部專門成立了一個(gè)小組,來判斷數(shù)據(jù)的公開與否,把握“誰應(yīng)該看什么,誰不應(yīng)該看什么,誰看什么的時(shí)候只能看什么。”

6 組織體系支持——建立數(shù)據(jù)委員會(huì)

阿里巴巴的數(shù)據(jù)來自各個(gè)部門,無論是數(shù)據(jù)材料的質(zhì)量、精細(xì)化的保證,還是數(shù)據(jù)安全,都不是單個(gè)部門能完成的,需要全局性安排,迫切需要一個(gè)上層組織結(jié)構(gòu)。但是成立什么樣的組織機(jī)構(gòu)合適?在阿里巴巴看來,數(shù)據(jù)的工作實(shí)際上主要還是由各個(gè)部門的責(zé)任,畢竟它們把控著源頭,另成立一個(gè)凌駕于各部門之上的中央數(shù)據(jù)管理機(jī)構(gòu),容易讓各個(gè)部門把責(zé)任直接推卸給新機(jī)構(gòu)。

2013年,阿里巴巴成立了虛擬組織——數(shù)據(jù)委員會(huì),委員會(huì)包括底層數(shù)據(jù)負(fù)責(zé)人、支付寶商業(yè)智能負(fù)責(zé)人、無線商業(yè)智能負(fù)責(zé)人和一名數(shù)據(jù)科學(xué)家,數(shù)據(jù)委員會(huì)更多地以協(xié)調(diào)會(huì)的形式,來指導(dǎo)、協(xié)調(diào)各個(gè)部門形成合力,實(shí)現(xiàn)從大數(shù)據(jù)運(yùn)營,到運(yùn)營大數(shù)據(jù)的轉(zhuǎn)變。

[責(zé)任編輯:李曉菲]
去IOE是今年最火的概念之一,對(duì)于被直指的當(dāng)時(shí)方——甲骨文,又是如何看待的呢?
官方微信
weixin
精彩專題更多
存儲(chǔ)風(fēng)云榜”是由DOIT傳媒主辦的年度大型活動(dòng);仡2014年,存儲(chǔ)作為IT系統(tǒng)架構(gòu)中最基礎(chǔ)的元素,已經(jīng)成為了推動(dòng)信息產(chǎn)業(yè)發(fā)展的核心動(dòng)力,存儲(chǔ)產(chǎn)業(yè)的發(fā)展邁向成熟,數(shù)據(jù)經(jīng)濟(jì)的概念順勢(shì)而為的提出。
華為OceanStor V3系列存儲(chǔ)系統(tǒng)是面向企業(yè)級(jí)應(yīng)用的新一代統(tǒng)一存儲(chǔ)產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達(dá)到業(yè)界領(lǐng)先水平,很好的滿足了大型數(shù)據(jù)庫OLTP/OLAP、文件共享、云計(jì)算等各種應(yīng)用下的數(shù)據(jù)存儲(chǔ)需求。
聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會(huì)
 

公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.