無縫容量擴(kuò)充

HDFS 將文件的數(shù)據(jù)塊分配信息存放在NameNode 服務(wù)器之上,文件數(shù)據(jù)塊的信息分布地存放在 DataNode 服務(wù)器上。當(dāng)整個系統(tǒng)容量需要擴(kuò)充時,只需要增加DataNode 的數(shù)量,系統(tǒng)會自動地實(shí)時將新的服務(wù)器匹配進(jìn)整體陣列之中。之后,文件的分布算法會將數(shù)據(jù)塊搬遷到新的DataNode 之中,不需任何系統(tǒng)宕機(jī)維護(hù)或人工干預(yù)。通過以上實(shí)現(xiàn),HDFS 可以做到在不停止服務(wù)的情況下實(shí)時地加入新的服務(wù)器作為分布式文件系統(tǒng)的容量升級,不需要人工干預(yù)文件的重新分布。

高度容錯

HDFS 文件系統(tǒng)假設(shè)系統(tǒng)故障(服務(wù)器、網(wǎng)絡(luò)、存儲故障等)是常態(tài),而不是異常。因此通過多方面保證數(shù)據(jù)的可靠性。數(shù)據(jù)在寫入時被復(fù)制多份,并且可以通過用戶自定義的復(fù)制策略分布到物理位置不同的服務(wù)器上;數(shù)據(jù)在讀寫時將自動進(jìn)行數(shù)據(jù)的校驗(yàn),一旦發(fā)現(xiàn)數(shù)據(jù)校驗(yàn)錯誤將重新進(jìn)行復(fù)制;HDFS 系統(tǒng)在后臺自動連續(xù)的檢測數(shù)據(jù)的一致性,并維持?jǐn)?shù)據(jù)的副本數(shù)量在指定的復(fù)制水平上。

分享到

wangguang

相關(guān)推薦