愛數一體化容災技術——重復數據刪除
愛數 發(fā)表于:12年06月20日 10:30 [來稿] DOIT.com.cn
基于數據類型優(yōu)化的重刪技術
早在2008年,愛數就在重復數據刪除技術領域取得相關專利,與其他重復數據刪除技術不同之處在于,愛數一體化容災技術平臺所采用的重復數據刪除有三個主要核心優(yōu)勢:
1. 基于數據類型的指紋識別:通常的做法是基于全局的指紋庫識別進行重復數據塊的識別,但是我們發(fā)現(xiàn),不同類型的數據,本身的重復率就不高,比如辦公文檔類型 和視頻圖片類型,測試數據表明,混合類型的數據重刪率與這種基于數據類型的指紋識別相比,重刪率基本相當,但是性能卻有不及后者。正是通過這種小改進,獲 得了極大的性能和效率的提升。當然,類型識別的基礎是OFS對象文件系統(tǒng)提供的全局對象管理算法。
2. 可動態(tài)適應的數據分塊技術:通過上述基于數據類型的全局指紋識別,愛數重刪技術采用了動態(tài)分塊技術,也就是可以根據類型、源端對象大小進行動態(tài)調整,這種 情況比較適合于數據對象大小不一的情況下,重刪效果的提升,比如,在大量小數據的場合下,和少量大數據的場合下,二者采用同樣分塊大小,對于性能和效果表 現(xiàn)都不是很理想,而采用動態(tài)分塊技術,可以針對不同范圍內的數據對象進行適應性分塊,使得匹配概率和效率更高。
3. 面向一體化容災的重刪:愛數一體化容災技術體系下的重刪技術,可以適用于定時備份、CDP實時備份和應用容災,對于定時備份,顯而易見,而對于CDP實時 備份和應用容災,由于實時數據堆積,存儲容量、初始化的性能,都是極大的調整,通過重刪,提升的正是在實時和容災數據初始化的性能和空間的有效利用率。
這種基于數據類型優(yōu)化的源端重復數據刪除,對于用戶而言,可以根據實際情況進行數據類型和數據塊分塊范圍進行優(yōu)化,對于高端用戶而言,其靈活性和可配置性有了更優(yōu)的效果。