周建丁 發(fā)表于:14年06月19日 16:51 [原創(chuàng)] DOIT.com.cn
“我不相信有些公司說他們是大數據公司,大數據對我來說只是一個工具,我認為所有的公司都將是大數據公司,你如果不發(fā)掘大數據的威力的話,你的公司太弱爆了。”曾經創(chuàng)辦Chinaren和空中網、現在投身于天使投資領域的楊寧如是說。
并不是所有的人都能完全贊同這段話,但楊寧的前提觀點——“一個公司最核心、最有價值的東西不是產品,而是數據”,一定不會有什么爭議。事實上,阿里巴巴、百度、騰訊、京東等公司,正在基于數據挖掘不斷拓展它們的商業(yè)版圖。
當然,數據挖掘或者數據分析未必就是原本意義上的大數據分析,但這已經不重要,畢竟摩根士丹利和Gartner都曾經預測過,大數據很快就會變成普通數據(any data)。所以,我們不妨現在就對大數據的范圍寬容一些,多關心數據的業(yè)務價值。
我們看到,大數據正在或將在體育、市政管理、教育、餐飲等領域發(fā)揮價值。譬如激戰(zhàn)正酣的巴西世界杯,IBM、SAP、Intel、雅虎、百度等IT巨頭紛紛發(fā)出大數據改變體育行業(yè)的聲音,或用于支持教練的戰(zhàn)術部署、改善球隊表現,或用于改善球迷體驗,或用于預測比賽結果。
當然還有一個“數據分析中國隊世界杯戰(zhàn)績最牛x”的段子:
在84年十九屆世界杯史上,1、僅有三支球隊(巴西、土耳其、哥斯達黎加)戰(zhàn)勝過中國國家隊;2、從來沒有一支球隊能夠擊敗過中國隊兩次,即使強如巴西,也僅戰(zhàn)勝過中國隊一次;3、世界杯史上共產生八支冠軍球隊,只有巴西隊曾經戰(zhàn)勝過中國隊;4、德西荷法英意葡等歐洲諸強均從未勝過中國隊;5、中國隊丟球數量遠少于足球之國巴西和以防守見長的意大利,84年只丟9球;6、中國隊從未在世界杯點球大戰(zhàn)中失利過。從這六項數據來看,中國隊戰(zhàn)績輝煌。
段子避重就輕的意味很明顯,實際情況,一張老圖即可說明。正如只說西班牙隊對陣荷蘭隊和智利隊的控球率分別達到58%和62%,而不談衛(wèi)冕冠軍以1:5和0:2的比分在小組賽提前出局一樣參考價值不大。相比之下,意大利隊對陣英格蘭創(chuàng)下93.2%的傳接球成功率與英格蘭3名壯年球員抽筋這兩項數據的結合,就顯得更加靠譜。要知道,意大利中場核心皮爾洛已經35歲,但高達97.2%的傳球成功率讓他不會因為體能而無法控制比賽的節(jié)奏。
皮爾洛傳球成功率達到97.2%,108次傳球103次成功
對于企業(yè)業(yè)績來說,對中國隊那樣的分析就好像是我們見到“銷售額增長300%”這樣的數據就驚嘆不已,完全忘了毛利率或者增長的基數到底如何。但這是中國當前“用大數據分析xxx”最有可能給我們的假象——盡管數據是真實的。
對此,《21世紀商業(yè)評論》的文章《大數據黑幕》有更尖銳的評論:“大數據在中國,尤其在最火爆的領域,比如手機、電商、娛樂等等諸多領域都變了味道。大數據變成了一種大造假,其基本邏輯是,通過制造一個令人吃驚的數據,達到欺騙或者吆喝的目的,從而榨取整個社會殘余的一點點信任。”
該文甚至認為,“中國大數據已經變成了互聯網思維騙術的最核心部分”。
確實,對互聯網思維的解讀有大數據思維這么一項。所以,在互聯網思維當道的今天,企業(yè)和消費者若想不迷失在這樣的大數據假象之中,在應用數據分析輔助決策的時候,首先就需要在分析模型中確立能夠支持決策的核心指標,如此大數據才能形成真正的洞察力。對于不同的項目,這些核心指標一般是不同的,但業(yè)務人員都會熟悉。換言之,業(yè)務需求驅動的大數據項目,必須有業(yè)務人員的參與。
預測性分析恐怕是大數據應用最迷人的地方了。很多企業(yè)希望擁有這樣的能力,但能夠提供此能力的供應商以及令人信服的成功案例不是太多。
單從世界杯來說,決定比賽勝負的,除了球員實力和狀態(tài)、主教練的部署風格、天氣和環(huán)境狀況,球員的意志和虛無縹緲的運氣同樣重要,譬如法國隊齊達內的一頂,葡萄牙隊佩佩的“武術”,喀麥隆隊亞歷山大·宋的劈砍,這些對比賽結果影響重大的因素,恐怕還不是任何大數據可以預測的,哪怕數據再充足,至少目前是如此。譬如百度根據過去5年987支球隊3.7萬場比賽數據(涉及29610名球員,112,285,543條相關數據)構建的預測模型,官方披露的準確率也只是75%。
否則,只要把模型建立好,輸入球員信息即可直接決定大力神杯的歸屬了。(這樣的局面也太無趣了。)
所以,哪怕博彩公司會進行再復雜的概率分析,賭球的成敗也仍然是難以預測的。相反,用大數據分析過去,幫助未來規(guī)避失誤,讓戰(zhàn)術部署更有效,在現階段這是可能的。這正是SAP和德國隊所做的事情。類似皮爾洛那樣的運動軌跡,確實需要一款強力的工具來輔助分析。當然,目前尚未知曉在德國隊4:0大勝世界足球先生C羅領銜的葡萄牙隊的背后,大數據的功勞占了幾成。也就是說,別那么著急指望大數據成為比賽的決定性因素。對于企業(yè)的運作,也是如此。如奧巴馬競選連任,Netflix創(chuàng)作紙牌屋,京東商城預先配貨,大數據的作用更像是輔助工具。
另一則大數據的趣聞就是餐飲大鱷湘鄂情了,它在日前宣布將剝離經營慘淡的餐飲業(yè)務,轉而聯合中科院等機構進軍大數據領域,變身一家大數據公司了。
IBM剝離虧損的x86,我們理解,是IBM的軟件實力足夠牛x。但對于湘鄂情,自身最核心最有經驗的餐飲都剝離了,它都不相信大數據能讓自己起死回生,誰敢相信它的大數據實力呢?
據自媒體“南冥一鯊”的分析,從湘鄂情近年的投資經歷來看,借助熱門投資炒作的可能性遠大于對中國大數據產業(yè)的支持。所以,楊寧所說的不相信有些公司是大數據公司是有道理的。作為企業(yè),如果有志大數據,工具是要有的,但首先要認清工具是否靠譜,要遠離“中國式大數據”。
世界杯各國戰(zhàn)術的老圖