最近,我寫(xiě)了很多關(guān)于信息技術(shù)和技術(shù)管理的博客文章,但是我還沒(méi)有說(shuō)過(guò)我對(duì)核心存儲(chǔ)技術(shù)的未來(lái)發(fā)展的最根本的看法。


      首先,我預(yù)計(jì)這篇文章一定會(huì)引起業(yè)界代表不同意見(jiàn)的各方之間的激烈爭(zhēng)論。我想,值得一提的是,EMC作為一家以客戶(hù)為中心的公司不管是現(xiàn)在還是將來(lái),都將根據(jù)市場(chǎng)的需求為客戶(hù)提供技術(shù)和解決方案。 不要因?yàn)槲以谶@里發(fā)表一些預(yù)測(cè)性的話就想讓我們停止生產(chǎn)產(chǎn)品。我們的生產(chǎn)是建立在需求的基礎(chǔ)上,而不是預(yù)測(cè)的基礎(chǔ)上。


      但是,在我能夠討論存儲(chǔ)需求之前,我首先要讓大家明白我對(duì)數(shù)據(jù)與信息不斷增長(zhǎng)的需求的看法。數(shù)據(jù)就是存儲(chǔ)設(shè)備的客戶(hù),因此要想弄明白存儲(chǔ)設(shè)備要到哪里去,大家應(yīng)該從數(shù)據(jù)入手。


      我相信數(shù)據(jù)世界將仍分裂成兩個(gè)不同的類(lèi)型,之前通常被稱(chēng)為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。但是由于各組織必須將越來(lái)越多的結(jié)構(gòu)添加到它們的非結(jié)構(gòu)化數(shù)據(jù)中以讓那些數(shù)據(jù)有用,因此事情將變得不再簡(jiǎn)單。 因此,實(shí)際上所有的數(shù)據(jù)和信息都將變得更結(jié)構(gòu)化一些。 這些詞已經(jīng)不能很好地說(shuō)明數(shù)據(jù)類(lèi)型了。


      相反,我認(rèn)為數(shù)據(jù)的區(qū)分將越來(lái)越以我所說(shuō)的“單事件等待時(shí)間(single transaction latency)”為基礎(chǔ)。 如今,OLTP系統(tǒng)都有這方面的要求,處理事件的性能仍是聯(lián)合存儲(chǔ)系統(tǒng)中最重要的因素。由于大部分OLTP系統(tǒng)都是采用的單一關(guān)系數(shù)據(jù)庫(kù)(為了保證一致性),因此單事件等待時(shí)間這個(gè)因素就非常重要。 總帶寬和輸入輸出能力是排在等待時(shí)間之后的第二重要的因素。你可以將這個(gè)系統(tǒng)看作是一個(gè)只設(shè)了一個(gè)收費(fèi)站的高速公路網(wǎng)絡(luò),收費(fèi)站的性能(即車(chē)輛進(jìn)出收費(fèi)站的等待時(shí)間)將極大地影響到整個(gè)系統(tǒng)的性能。


      相反,大多數(shù)的剩余信息(估計(jì)目前占70%以上,而到2010年時(shí)將增長(zhǎng)到95%左右)將被歸為“其他種類(lèi)”,我將把這類(lèi)數(shù)據(jù)稱(chēng)為“網(wǎng)絡(luò)”數(shù)據(jù)。正如我所說(shuō)的,這類(lèi)數(shù)據(jù)與上面的數(shù)據(jù)相比的決定性不同在于,單事件等待時(shí)間不是最重要的因素。 例如,讓我們以在網(wǎng)絡(luò)上進(jìn)行搜索為例。你進(jìn)行的任何搜索可能都要花0.5秒的時(shí)間。 如果它所花的時(shí)間變成0.45秒或者0.55秒,影響是否會(huì)很大呢? 我看影響不大。 因?yàn)樵S多人都可以同時(shí)進(jìn)行搜索,這里需要注意的問(wèn)題是累計(jì)性能。在高速公路上,你可以設(shè)置速度比較慢的收費(fèi)站,但是在你最終忍受不了之前,它們并不會(huì)構(gòu)成高速公路系統(tǒng)上的瓶頸。


      我相信我們將看到非結(jié)構(gòu)化數(shù)據(jù)也需要變得更加結(jié)構(gòu)化一些。 顯然,使用傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)是不行的。在數(shù)據(jù)庫(kù)應(yīng)用程序中將網(wǎng)絡(luò)數(shù)據(jù)隔離開(kāi)來(lái)也不是很好。 那些“結(jié)構(gòu)”將來(lái)自于標(biāo)記、索引、元數(shù)據(jù)和帶有定義化本體的對(duì)象結(jié)構(gòu)。


      我們最近收購(gòu)了一家名為XHive的公司,該公司開(kāi)發(fā)的許多技術(shù)對(duì)我們很有幫助。XHive公司實(shí)際上開(kāi)發(fā)的是XML數(shù)據(jù)庫(kù)技術(shù)。 這樣就可以用一種更相關(guān)的方法將數(shù)據(jù)結(jié)構(gòu)化,同時(shí)避免限制到使用帶所有權(quán)保護(hù)的數(shù)據(jù)庫(kù)結(jié)構(gòu)。由于數(shù)據(jù)和元數(shù)據(jù)都是XML格式的,沒(méi)有被鎖定到任何應(yīng)用程序上。


      在這些數(shù)據(jù)類(lèi)型之中,還有很多很多影響著存儲(chǔ)設(shè)備和信息生命周期管理需求的其他性能、可靠性和信息要求。那么我為什么要根據(jù)這一個(gè)因素來(lái)定義數(shù)據(jù)類(lèi)型呢? 原因就是簡(jiǎn)單,對(duì)于OLTP應(yīng)用程序來(lái)說(shuō),處理事件的等待時(shí)間方面的需求會(huì)推動(dòng)整個(gè)存儲(chǔ)結(jié)構(gòu)的優(yōu)化。對(duì)于網(wǎng)絡(luò)數(shù)據(jù),結(jié)構(gòu)將更多的受到累計(jì)系統(tǒng)要求的影響。


      雖然數(shù)據(jù)類(lèi)型和要求的數(shù)量顯然達(dá)到了不可窮盡的地步,但是首要的前提是存儲(chǔ)結(jié)構(gòu)必須在不遠(yuǎn)的將來(lái)解決數(shù)據(jù)的這兩個(gè)基本要求(過(guò)去,數(shù)據(jù)是以結(jié)構(gòu)化和非結(jié)構(gòu)化來(lái)區(qū)分的),我現(xiàn)在認(rèn)為它們更適合被稱(chēng)為OLTP數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)。


      在下一篇博客文章中,我將討論核心存儲(chǔ)技術(shù)的使用和信息利用率的未來(lái)發(fā)展情況。

分享到

多易

相關(guān)推薦