1 引言

全球性的數(shù)據(jù)爆炸才剛剛開始。由于寬帶互聯(lián)網(wǎng)接入的快速增長、數(shù)據(jù)設備的增加以及需要通過復制來保護重要數(shù)據(jù)的做法,日常生活中的數(shù)字內(nèi)容呈指數(shù)增長。隨著數(shù)據(jù)量的增長,數(shù)據(jù)存儲和管理的復雜性也相應增加。

在本論文中,我們將研究管理數(shù)據(jù)的難題和負擔,提出有關(guān)數(shù)據(jù)存儲解決方案將如何為解決這些難題而發(fā)展的模型,并討論數(shù)據(jù)存儲和管理的未來。

我們首先討論擁有數(shù)據(jù)所產(chǎn)生的負擔。數(shù)據(jù)增長,全球?qū)?shù)據(jù)訪問的需求增大,法律要求更復雜,數(shù)據(jù)中斷的后果越來越嚴重,數(shù)據(jù)壽命更長,所有這一切都使 IT 架構(gòu)師承擔的責任越來越大。因此,CIO 和 IT 架構(gòu)師越來越依賴存儲供應商并要求他們幫助解決這些問題。

接下來,我們研究一個表示存儲解決方案發(fā)展的模型。通過研究數(shù)據(jù)存儲和管理技術(shù)的過去、現(xiàn)狀和未來,可以發(fā)現(xiàn)能夠最有效地減輕 IT 壓力的技術(shù)進步。

然后我們使用存儲發(fā)展模型來說明 Network Appliance 認為對增強存儲系統(tǒng)功能和提高 IT 管理員效率最有效的三個革新領(lǐng)域。

最后,我們討論隨著存儲標準的發(fā)展和虛擬化技術(shù)的日益完善,存儲和數(shù)據(jù)管理的新范例成為現(xiàn)實的可能性。雖然虛擬化將實現(xiàn)的自動化程度在目前看來仍像是科學幻想,但是從當前的法規(guī)遵從和備份系統(tǒng)來看,這樣的未來并不像人們所想像的那樣遙遠。

2 擁有數(shù)據(jù)所產(chǎn)生的負擔

我們正處在全球數(shù)據(jù)爆炸的開始階段,相比之下未來 50 年人口急劇增長顯得微不足道。到 2050 年,世界人口預計從 65 億增加到 91 億。更驚人的預測是,自動監(jiān)視和數(shù)據(jù)收集設備(50 年前聞所未聞)的數(shù)量可能不久就超過人類。更多人口 + 更多設備 + 更多時間 = 更多數(shù)據(jù)。據(jù)IDC Worldwide Disk Storage Systems Forecast 2006-2010 ,我們可以預計全球數(shù)據(jù)在這十年中的復合年平均增長率為 50.6%。這個增長率意味著每 5.5 年左右,需要管理的數(shù)據(jù)將增加 10 倍。

數(shù)據(jù)呈指數(shù)增長

現(xiàn)在創(chuàng)建和訪問數(shù)據(jù)比以前更容易。單單互聯(lián)網(wǎng)數(shù)據(jù),全球超過十億用戶不停地在創(chuàng)建,并且這個數(shù)字每天都在增加?;ヂ?lián)網(wǎng)已經(jīng)成為靜止圖像、視頻和音頻的巨大存儲庫。手機、便攜式計算機和 PDA 不斷增多,這些設備通過專用網(wǎng)絡、無線網(wǎng)絡和互聯(lián)網(wǎng)等多種訪問點連接數(shù)據(jù),所有這一切都加快了數(shù)據(jù)的增長。用于組織連續(xù)性和安全的環(huán)境傳感器、視頻監(jiān)視系統(tǒng)和通信記錄系統(tǒng)在公共和私營部門中創(chuàng)建大量基本數(shù)據(jù)。

非結(jié)構(gòu)化數(shù)據(jù)(未存儲在數(shù)據(jù)庫中的大量文件和電子郵件)是這種增長的最主要因素,占組織在線存儲數(shù)據(jù)量的 70% 到 80% 。此類數(shù)據(jù)的增多是大量書面存檔的日常轉(zhuǎn)換。

數(shù)據(jù)文件的有意副本也加劇了數(shù)據(jù)量的增長。重要數(shù)據(jù)例行復制到多個位置以防止所有類型的災難。例如,在數(shù)據(jù)挖掘領(lǐng)域,通常為了運行商務智能查詢而復制巨大的數(shù)據(jù)庫。應用程序開發(fā)和測試過程中也會有意地創(chuàng)建大型數(shù)據(jù)庫的大量臨時副本。在全球,重要數(shù)據(jù)例行復制到多個位置以防止所有類型的損失。

個人在共享文件時無意中創(chuàng)建數(shù)不盡的數(shù)據(jù)文件副本,使問題更加復雜。請看某個人將一個文件發(fā)送給 15 位同事時產(chǎn)生的副本數(shù):收件人將文件保存到個人系統(tǒng)之后,可能還復制一次文件作為備份,按規(guī)定第二次復制,第三次復制用于災難恢復。這樣,將單個文件發(fā)送給 15 個人可能產(chǎn)生 60 個文件副本:15 個有意副本和另外 45 個無意副本。

數(shù)據(jù)管理成本急劇增長

隨著數(shù)據(jù)量的增長,復雜性相應增加,因此數(shù)據(jù)管理成本也相應增加。具體地說,數(shù)據(jù)管理復雜性隨不斷增長的數(shù)據(jù)量呈對數(shù)增長。

存儲數(shù)據(jù)的成本是一種消耗。存儲密度不斷提高,使保存數(shù)據(jù)比決定什么值得保存的成本更低。數(shù)據(jù)對未來應用有價值的可能性使人們對不加區(qū)別的選擇感到悲觀。在沒有經(jīng)濟原因而需要對所有現(xiàn)有數(shù)據(jù)進行整理的情況下,沒有人執(zhí)行清理工作。這種低效率對 IT 預算造成空前的消耗。由于存儲器成本的不斷下降,一種使所有這些數(shù)據(jù)保持可用的觀念使得 CIO 和 IT 管理員愿意付出更多。

訪問要求更嚴格。數(shù)據(jù)訪問需求也越來越具有挑戰(zhàn)性。全球化有效地終止了計劃停機時間。雖然紐約正值休息時間,但是上海卻正值工作時間,數(shù)據(jù)必須全天候可用。如今的網(wǎng)上世界要求 100% 的數(shù)據(jù)可用性。

易管理性困境

不保留:不再需要時由用戶刪除的臨時數(shù)據(jù)。

保留到某個時間:法規(guī)要求保留規(guī)定的一個時期才能刪除的數(shù)據(jù)。

由于不知道而無限期保留:永遠不會被刪除的數(shù)據(jù)。

法律要求更復雜。越來越多的商務運作采用數(shù)字方式進行記錄和存儲,關(guān)于商務和數(shù)據(jù)的法律法規(guī)越來越多,并且未能遵從這些法規(guī)所導致的后果會越來越嚴重。在美國,未能保持客戶個人信息安全可導致入獄和最高罰款 50 萬美元。Sarbanes-Oxley 規(guī)定,未能遵從數(shù)據(jù)保留政策可導致最長 20 年監(jiān)禁和最高 500 萬美元罰款。Gartner 預測,到 2006 年末,沒有將數(shù)據(jù)庫中存儲的信用卡號加密將被視為美國未授權(quán)公開民法案例中的法律疏忽。歐盟要求電信部門保留三年之內(nèi)的客戶電話記錄。無論在什么國家或地區(qū),這些法律法規(guī)的負擔總是落在 IT 部門。

商務風險后果更嚴重。全球網(wǎng)上經(jīng)濟要求空前的數(shù)據(jù)可用性和安全性。從短期觀點來看,數(shù)據(jù)中斷會對公司的盈利產(chǎn)生有害影響。從長遠觀點來看,數(shù)據(jù)中斷會損害公司的聲譽并產(chǎn)生嚴重的財務影響。

除了無法訪問數(shù)據(jù)之外,喪失數(shù)據(jù)安全性的后果也很嚴重。Gartner 在 2005 年 9 月對侵犯隱私的成本進行的一項量化研究中,Gartner 估計 100,000 記錄侵犯隱私的成本是平均每個客戶帳戶 90 美元,包括通知、信用報告和法律成本,但不包括罰款和品牌損害。

許多因素都會增大安全風險;其中一個是數(shù)字數(shù)據(jù)高度便攜。目前,一卷備份磁帶可以保存 2000 萬磅重的書面文件。從前只能放在巨大倉庫中的數(shù)據(jù)現(xiàn)在可以放在口袋中隨身攜帶。此類數(shù)據(jù)整合產(chǎn)生大量安全漏洞。

人類管理的數(shù)據(jù)已經(jīng)太多。歸根結(jié)底,只有三種類別的數(shù)據(jù):不保留的數(shù)據(jù)、保留到某個時間的數(shù)據(jù)以及由于不知道而無限保留的數(shù)據(jù)。其中,無限期保留的數(shù)據(jù)占絕大多數(shù)。

并非所有無限期保留的數(shù)據(jù)將來都要使用。但是考慮到一卷備份磁帶等于 2000 萬磅書面文件,顯然設法判明哪些數(shù)據(jù)值得無限期保留是一項耗費巨大的任務。靠人工挑選此類數(shù)據(jù)也顯然永遠不會發(fā)生。如今,保存所有數(shù)據(jù)比決定要丟棄哪些數(shù)據(jù)更容易且更劃算。

要規(guī)劃一個存儲環(huán)境,使它能夠有效地滿足訪問、安全、法規(guī)遵從、成本控制和更改等方面的要求,IT 架構(gòu)師必須擔當多種角色。他們需要是律師、保安、財務總監(jiān)、外交官、技術(shù)專家和預言家。期望 IT 架構(gòu)師成為所有這些方面的專家并不現(xiàn)實,因此CIO 現(xiàn)在轉(zhuǎn)向存儲供應商尋求幫助。


NETAPP 遠景系列:探索數(shù)據(jù)管理的未來(2)


存儲在線版權(quán)所有,如需轉(zhuǎn)載,請與我們聯(lián)系。

分享到

多易

相關(guān)推薦