范喆 發(fā)表于:14年07月14日 15:55 [原創(chuàng)] DOIT.com.cn
大數據這個詞在世界杯狂潮來臨后進入了一個新的高潮,德國隊運用大數據分析提升球員能力、調整戰(zhàn)略部署最終奪冠消息一傳開,業(yè)內更是歡欣鼓舞,仿佛以后的“預測業(yè)”將大展宏圖。
然而,在百度、谷歌等等科技企業(yè)大肆鼓吹大數據分析準確科學的同時,筆者仿佛看到了當年保險業(yè)務員向自己推銷保險的場景。他們總是羅列出當前業(yè)務的種種好處,各種高收益回報讓人怦然心動。但是當筆者要求看看合同的時候,他們卻又說只有簽合同的時候才能看。后來旁敲側擊才終于套出保險員的一點點實話,比如他們?yōu)槟愠兄Z的高收益有時間要求,很多都是要十幾年甚至二十幾年后才能取出的,如果你中途要取出,那么收益可能跟銀行定期差不多。而他所承諾的各種意外后保障,其實都有普通人沒注意到的限制和語言的游戲。模棱兩可之間,其實是把那些權益都收了回去。想得便宜的投資者一旦糊里糊涂簽了,其實最終的回報可能也就比銀行定期多一點,根本未達到投資的目的。
這就好比是告訴你風險投資的種種好處,卻不告訴你一旦遇到問題你會輸得一塌糊涂。避重就輕的伎倆,是現在國內很多不規(guī)范的保險、基金、金融投資的慣用手法。
現在,這種手法似乎也用到了大數據分析當中。就像是巴西與德國的那場比賽,谷歌計算出巴西69%的勝率。在比賽未進行時,大家都以為巴西贏定了。然而結果,卻狠狠破了一盆冷水。沒錯,大數據預測者們在事件結果未出之前,總會強調自己過去準確預測的那些成績,然后鼓吹自己此次計算結果也是準確無誤的。
其實,筆者并不能證明這個69%的勝率到底是對是錯。但是一個很淺顯的道理:10支簽里7支紅,也未必就一定能抽中紅色。
所以谷歌自信滿滿的時候,卻得到了當頭一棒。
當然,某一些做大數據預測的科技公司出發(fā)點并不是去欺騙使用者,他們計算出的也是趨勢和概率,只是他們自己也陷入了那些冰冷數據取得的成就之中,忘記了31%的失敗幾率。
事實上,正是因為這些科技巨頭被擊碎的自負讓筆者擔心:會不會有一些小的數據公司,他們并不具備大數據分析的能力,或者他們只具備初級的數據分析能力,由于看到了“大數據”的熱潮,于是跟著標榜自己是“大數據分析”,以此來撈上一把?甚至很可能出現根本不懂大數據分析的人,打著大數據的旗號,吹噓自己的分析“科學”、“準確”,誤導和欺騙普通使用者!
事實上不僅在中國,即使在大數據分析較為成熟的歐美國家,也有人會陷入大數據帶來的輝煌中無法自拔。仿佛有了大數據,一切都迎刃而解。拍電影不是問題、競技比賽不是問題,甚至連未來也不是問題。最終一部部電影像是同一個模子卡出來的,比賽失去了激情只剩對分析數據的機械實現,而未來……誰又知道呢?
我絕不會否定大數據優(yōu)秀的指導作用,因為日耳曼戰(zhàn)車橫掃南美成為四星德國,證明了正確運用大數據分析,團隊將收獲豐碩的果實。從德意志身上我懂得了:大數據怎么用,才是我們最需要正視的問題。
大數據預測本身并沒有錯,但是若是變成大數據“算命”,那就本末倒置了。
依稀還記得電腦興起階段,在游樂園里見過一臺“算命機器”,標榜自己是“科學算命”。當時就感到很好笑?墒乾F在大數據分析,是不是就要變成那臺“算命機器”了呢……