国产精品一区二区av交换,中文字幕人成无码免费视频,永久免费av无码网站性色av,欧美一道本一区二区三区,樱桃熟了a级毛片

大數(shù)據(jù)時(shí)代的記憶與遺忘

SocioCyber 發(fā)表于:13年06月04日 13:00 [轉(zhuǎn)載] DOIT.com.cn

  • 分享:
[導(dǎo)讀]斯塔西·施耐德(Stacy Snyder)曾經(jīng)的夢(mèng)想是成為一名教師。2006年夏天,她完成了獲取教師資格證書所需的課程并通過了所有考試;然而她的夢(mèng)想?yún)s在即將實(shí)現(xiàn)之時(shí)突然破滅她所在學(xué)校的一位負(fù)責(zé)人告訴她,她無法取得教師資格證書。

斯塔西·施耐德(Stacy Snyder)曾經(jīng)的夢(mèng)想是成為一名教師。2006年夏天,她完成了獲取教師資格證書所需的課程并通過了所有考試;然而她的夢(mèng)想?yún)s在即將實(shí)現(xiàn)之時(shí)突然破滅她所在學(xué)校的一位負(fù)責(zé)人告訴她,她無法取得教師資格證書。

學(xué)校負(fù)責(zé)人展示了一張她上傳到自己的MySpace頁面上的照片,照片上的她戴著一頂海盜帽,正端著一只塑料杯飲酒。這張照片是她向自己朋友展示的,甚至可能只是搞怪,但學(xué)校認(rèn)為這樣的行為與教師的標(biāo)準(zhǔn)不符。斯塔西向?qū)W校承諾將這張圖片從網(wǎng)上刪除,然而為時(shí)已晚照片早已被搜索引擎索引,并被網(wǎng)絡(luò)爬蟲所記錄。她希望她的照片被遺忘,然而互聯(lián)網(wǎng)并不允許。

這是牛津大學(xué)互聯(lián)網(wǎng)學(xué)院的教授維克托·邁爾-舍恩伯格(Viktor Mayer-Sch?nberger)在2009年出版的《刪除:數(shù)字時(shí)代遺忘的價(jià)值》(中譯版為《刪除:大數(shù)據(jù)時(shí)代的取舍之道》,以下簡(jiǎn)稱《刪除》)一書中引用的一個(gè)案例。他告訴讀者,遺忘本是人類的天性,但隨著信息技術(shù)的發(fā)展,記憶變得越來越容易,遺忘卻越來越困難;無法遺忘不僅會(huì)給個(gè)人帶來不必要的困擾,也給企業(yè)制造了麻煩他們存儲(chǔ)的數(shù)據(jù)日益增加,但其中很多隨著時(shí)間的推移而失去了價(jià)值。因此,他呼吁引入一種遺忘的機(jī)制,例如為數(shù)據(jù)設(shè)定一個(gè)保存期限,“讓我們記得去遺忘”。

盡管沒能提出切實(shí)可行的“遺忘”方法,但《刪除》獨(dú)特的視角仍受到了學(xué)術(shù)界和互聯(lián)網(wǎng)業(yè)界的廣泛關(guān)注;這本書不僅獲得了多項(xiàng)圖書獎(jiǎng),還被翻譯為德語、意大利 語、韓語等不同語言。

當(dāng)“大數(shù)據(jù)”成為業(yè)界新的熱點(diǎn)之時(shí),在這一領(lǐng)域有著深入研究的維克托于近日出版了其新作《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》(以下簡(jiǎn)稱《大數(shù)據(jù)時(shí)代》),通過一個(gè)個(gè)生動(dòng)的案例向讀者介紹大數(shù)據(jù)的價(jià)值及其將會(huì)帶來的改變。

12月11日,維克托攜兩本書的中譯本來到北京,在不同場(chǎng)合與讀者及業(yè)內(nèi)人士交流大數(shù)據(jù)相關(guān)的話題。

三大轉(zhuǎn)變定義大數(shù)據(jù)

大數(shù)據(jù)是今年IT界最熱門的概念之一,然而對(duì)于“大數(shù)據(jù)是什么”,連許多經(jīng)常談?wù)撨@一概念的從業(yè)者也無法給出準(zhǔn)確的答案。正因?yàn)槿绱,大?shù)據(jù)也被質(zhì)疑為一個(gè)炒作出來的偽命題。

維克托也并未直接給出大數(shù)據(jù)的定義在《大數(shù)據(jù)時(shí)代》的引言部分,他就明確指出“大數(shù)據(jù)并非一個(gè)確切的概念”。不過,他用三大轉(zhuǎn)變描述了大數(shù)據(jù)的特性。并詳細(xì)闡釋了這三個(gè)轉(zhuǎn)變:

“首先,在大數(shù)據(jù)時(shí)代,我們可以獲得和某個(gè)現(xiàn)象相關(guān)的所有數(shù)據(jù),而不只是少量的樣本。例如一項(xiàng)針對(duì)相撲比賽中非法操縱比賽結(jié)果的研究對(duì)64000場(chǎng)比賽進(jìn)行了分析,這算不上一個(gè)很大的數(shù)字,但由于這是過去十年所有的比賽,所以它是大數(shù)據(jù)。大數(shù)據(jù)是相對(duì)的而非絕對(duì)的。”

“第二,由于有了更多的數(shù)據(jù),我們可以接受更多的混雜、更多數(shù)據(jù)上的不精確。如果我們對(duì)于一個(gè)事物只有50個(gè)數(shù)據(jù)點(diǎn),那么每一個(gè)數(shù)據(jù)點(diǎn)都必須非常精確,因?yàn)槊總(gè)數(shù)據(jù)點(diǎn)都是有用的;但是如果我們有5000萬個(gè),去掉10個(gè),甚至去掉1000個(gè)都沒有太大的問題。”

“第三,我們分析大數(shù)據(jù)主要為了預(yù)測(cè)未來"是什么",而不是"為什么"。我們關(guān)注的是揭示哪些事情將會(huì)發(fā)生的相關(guān)關(guān)系,而非揭示為什么這些事情會(huì)發(fā)生的因果關(guān)系。因?yàn)楹芏鄷r(shí)候我們以為我們找到了事情背后的原因,實(shí)際上卻沒有找到。更多時(shí)候知道了"是什么"就足夠了。例如知道流感將會(huì)擴(kuò)散到哪里就足夠了,我不需要知道為什么;知道什么時(shí)候在網(wǎng)上購(gòu)買機(jī)票能夠獲得最優(yōu)惠的價(jià)格就足夠了,我不需要知道為什么此時(shí)價(jià)格最低。”

大數(shù)據(jù)不應(yīng)被過分炒作

表面上看,此次出版的兩本書相互矛盾:《大數(shù)據(jù)時(shí)代》強(qiáng)調(diào)了數(shù)據(jù)的價(jià)值,而《刪除》卻提出數(shù)據(jù)應(yīng)該能夠被“忘記”。對(duì)此,維克托表示,兩本書相互補(bǔ)充,而以上的兩個(gè)觀點(diǎn)可以完美地相互作用。

“大數(shù)據(jù)只有在沒有噪音、沒有無用的數(shù)據(jù)的情況下才能很好地發(fā)揮作用。在《刪除》中,我認(rèn)為我們需要有擺脫那些過時(shí)的、和我們現(xiàn)在不相關(guān)的數(shù)據(jù)的可能性。如果亞馬遜忘記了和你當(dāng)前的興趣與偏好不相關(guān)的購(gòu)書記錄,它推薦書的效果將會(huì)更好。只有好的數(shù)據(jù)才能帶來好的預(yù)測(cè)。”

對(duì)于大數(shù)據(jù)被過分炒作,維克托也表示擔(dān)憂:“它被夸大了,好像一切都突然成為了大數(shù)據(jù),大數(shù)據(jù)能解決所有問題,事實(shí)上人們并不了解它究竟是什么;一旦人們發(fā)現(xiàn)它不是萬能的,就會(huì)感到泄氣,然后大數(shù)據(jù)就被拋棄了。”在他看來,盡管大數(shù)據(jù)非常強(qiáng)大,但“人們需要明白它不是什么,我們不能將它過分夸大”。

對(duì)話維克托:數(shù)據(jù)保留與否應(yīng)由用戶決定

亞馬遜、Google這些大公司已經(jīng)積累了很多數(shù)據(jù),但小公司、創(chuàng)業(yè)公司卻沒有多少數(shù)據(jù),在大數(shù)據(jù)時(shí)代他們應(yīng)該怎么做?

的確,這很有趣。很長(zhǎng)時(shí)間以來,這些大公司的強(qiáng)大之處在于他們的服務(wù)器集群等基礎(chǔ)設(shè)施。如今有了云計(jì)算,創(chuàng)業(yè)公司可以根據(jù)需要購(gòu)買計(jì)算和存儲(chǔ)能力,以解決基礎(chǔ)設(shè)施方面的不足,但他們沒有數(shù)據(jù)。數(shù)據(jù)是一些大公司獨(dú)家擁有的。當(dāng)然如果小公司選擇了正確的領(lǐng)域切入,也能夠獲得數(shù)據(jù)。例如Inrix公司,他們開發(fā)導(dǎo)航軟件,還能提供實(shí)時(shí)路況,告訴你哪里堵車。他們是怎么獲得這些信息的呢?他們的基礎(chǔ)導(dǎo)航服務(wù)是免費(fèi)的,但如果你同意下載這個(gè)應(yīng)用,它就會(huì)就會(huì)將你的行駛速度等信息傳回后端,于是你就成為了這個(gè)平臺(tái)的傳感器。每天有數(shù)百萬人使用Inrix,因此Inrix擁有數(shù)百萬傳感器,并獲取了大量的數(shù)據(jù)。他們能記錄在特定天氣下人們的駕駛速度,并將這些信息告訴保險(xiǎn)公司,或者告訴政府作為加強(qiáng)道路安全的參考。

通常企業(yè)只能通過自己搜集的數(shù)據(jù)進(jìn)行預(yù)測(cè),但他們的數(shù)據(jù)是有局限的。比如我在亞馬遜上搜索了一本書,但最終通過其他渠道購(gòu)買了,亞馬遜并不知道,它仍會(huì)推薦相關(guān)的書,我卻不再需要,如何解決這樣的問題?

事實(shí)上目前已經(jīng)有一些公司在分享自己的數(shù)據(jù)了,例如在網(wǎng)絡(luò)廣告領(lǐng)域。不過問題的關(guān)鍵在于你自己是否愿意你的數(shù)據(jù)被企業(yè)共享,如果你愿意讓他們共享數(shù)據(jù),你就能獲得更好的推薦。如今在硅谷有一些創(chuàng)業(yè)公司正試圖打造由個(gè)人、由消費(fèi)者控制的信息共享平臺(tái)。

相對(duì)來說用戶可能會(huì)對(duì)大公司更加信任,更愿意把信息分享給他們,那么小公司如何讓用戶分享更多數(shù)據(jù)?

這不一定?梢該Q個(gè)角度來看,很多人不愿意把數(shù)據(jù)分享給Google或者Facebook,他們認(rèn)為這些公司過于強(qiáng)大了;他們反倒更愿意把數(shù)據(jù)分享給小公司、創(chuàng)業(yè)公司。有意思的是,大數(shù)據(jù)能幫助大企業(yè),也能幫助小企業(yè),但對(duì)中型企業(yè)幫助不大。比如200-500人規(guī)模的企業(yè),它們不夠小,不像初創(chuàng)企業(yè)那么靈活,也不像Google那么強(qiáng)大,因而被擠壓在中間,沒有自己的優(yōu)勢(shì)。

未來企業(yè)針對(duì)大數(shù)據(jù)的分析是更多依靠云計(jì)算還是更多依靠企業(yè)內(nèi)部的計(jì)算能力?

這完全取決于公司的規(guī)模、能力和他們所處的發(fā)展階段,沒有一個(gè)統(tǒng)一的答案。如今計(jì)算和存儲(chǔ)能力都可以從外部獲得,所以一家公司應(yīng)該看看是使用內(nèi)部的處理能力還是使用云計(jì)算更劃算。

你認(rèn)為在大數(shù)據(jù)時(shí)代,與隱私保護(hù)相關(guān)的法律應(yīng)該有所調(diào)整嗎?

是的。隱私權(quán)可以讓個(gè)人對(duì)互聯(lián)網(wǎng)、電子商務(wù)更信任;如果沒有隱私權(quán),我會(huì)對(duì)我在網(wǎng)上所做的事情很謹(jǐn)慎,因?yàn)橐坏┪覍⒛臣赂嬖V別人,我就可能把它收回來了,我無法控制它。所以我們需要隱私法,但隱私法也需要?jiǎng)?chuàng)新。如今歐洲的隱私法規(guī)定,企業(yè)最多只能將數(shù)據(jù)保存到首要目的完成的時(shí)候?yàn)橹。這是在小數(shù)據(jù)時(shí)代制定的法律,在大數(shù)據(jù)時(shí)代已不再適用,因?yàn)閿?shù)據(jù)的價(jià)值往往并非體現(xiàn)在其首要用途上,而是在其次要乃至第三位的用途上,可能是你收集數(shù)據(jù)時(shí)并不知道的用途。所以我們要做的是,讓數(shù)據(jù)不再只能被保存到它的首要用途完成時(shí)為止,而是將決定權(quán)交給和數(shù)據(jù)相關(guān)的個(gè)人,讓他們來決定是否刪除數(shù)據(jù)。

在《刪除》中你說應(yīng)該對(duì)企業(yè)保存數(shù)據(jù)的時(shí)間有所限制,這是否會(huì)影響企業(yè)對(duì)于大數(shù)據(jù)的使用?

我的意思是,數(shù)據(jù)能保存多久應(yīng)該由和數(shù)據(jù)相關(guān)的個(gè)人來決定。例如我如果希望我的數(shù)據(jù)在亞馬遜上保持很長(zhǎng)時(shí)間,我需要有這個(gè)權(quán)利和意愿;但我必須同時(shí)擁有刪除這些數(shù)據(jù)的權(quán)利。亞馬遜也會(huì)因此獲益,因?yàn)槿绻腋嬖V他們“刪除我8年前的購(gòu)書記錄,因?yàn)檫@和我如今的興趣無關(guān)”,這樣能將一些噪音排除,他們的推薦會(huì)更精確,我可能會(huì)買更多的書。

如果大數(shù)據(jù)能夠準(zhǔn)確預(yù)測(cè)未來,我們就可以在面臨選擇時(shí)做出最合理的選擇,但很多時(shí)候我們的個(gè)性、我們生活中的快樂正是源自于一些非理性的選擇,大數(shù)據(jù)是否會(huì)讓我們失去這些?

只有當(dāng)我們知道了真相是什么、當(dāng)我們理性的時(shí)候,我們才能非理性。我們可以理性地去面對(duì)不合理的情況,這是我們主動(dòng)選擇不理性的,符合人類的習(xí)慣。例如數(shù)據(jù)告訴我抽煙不好,但我依然可以抽煙,這是非理性的,但這個(gè)非理性的決定是基于一個(gè)理性的選擇,因?yàn)槲抑懒苏嫦,所以我在做選擇時(shí)是理性的。如果沒有數(shù)據(jù),我就不知道我什么時(shí)候是理性的,什么時(shí)候是非理性的;很多時(shí)候我認(rèn)為我做了一個(gè)正確的決定,實(shí)際上卻是一個(gè)錯(cuò)誤的決定。所以在有了數(shù)據(jù)之后我們的生活依然可以很有趣。

你說遺忘是人類的天性,但事實(shí)上如今的人類也喪失了一些我們祖先所擁有的能力,那么人類在數(shù)字時(shí)代喪失遺忘的能力是否可以被看作是一種進(jìn)化?

可以這么說,但進(jìn)化應(yīng)該是個(gè)緩慢的過程,尤其是要重組大腦。在很偶然的情況下,進(jìn)化可能會(huì)使人類喪失某項(xiàng)能力,但這需要很多年才能完成。

[責(zé)任編輯:王雪楊]
《云服務(wù)商生存法則》第二期節(jié)目我們邀請(qǐng)到了曙光云計(jì)算技術(shù)有限公司首席架構(gòu)師李磊博士,聽他給我們講講曙光云計(jì)算在國(guó)內(nèi)市場(chǎng)的生存之道。
官方微信
weixin
精彩專題更多
存儲(chǔ)風(fēng)云榜”是由DOIT傳媒主辦的年度大型活動(dòng);仡2014年,存儲(chǔ)作為IT系統(tǒng)架構(gòu)中最基礎(chǔ)的元素,已經(jīng)成為了推動(dòng)信息產(chǎn)業(yè)發(fā)展的核心動(dòng)力,存儲(chǔ)產(chǎn)業(yè)的發(fā)展邁向成熟,數(shù)據(jù)經(jīng)濟(jì)的概念順勢(shì)而為的提出。
華為OceanStor V3系列存儲(chǔ)系統(tǒng)是面向企業(yè)級(jí)應(yīng)用的新一代統(tǒng)一存儲(chǔ)產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達(dá)到業(yè)界領(lǐng)先水平,很好的滿足了大型數(shù)據(jù)庫OLTP/OLAP、文件共享、云計(jì)算等各種應(yīng)用下的數(shù)據(jù)存儲(chǔ)需求。
聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會(huì)
 

公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.