周末閑來無事,我也在虛擬環(huán)境里體驗(yàn)了一把重復(fù)數(shù)據(jù)刪除技術(shù)的魅力。
1)重復(fù)數(shù)據(jù)刪除技術(shù)的優(yōu)點(diǎn)
- 容量優(yōu)化:“重復(fù)數(shù)據(jù)刪除”使得 Windows Server 2012 能夠在更少的物理空間中存儲更多的數(shù)據(jù),并獲得比以前版本的 Windows 操作系統(tǒng)明顯更高的存儲效率。以前版本的 Windows 操作系統(tǒng)使用單實(shí)例存儲 (SIS) 或 NTFS 文件系統(tǒng)壓縮。“重復(fù)數(shù)據(jù)刪除”使用可變分塊大小和壓縮,常規(guī)文件服務(wù)器的優(yōu)化率為 2:1,而虛擬數(shù)據(jù)的優(yōu)化率最高可達(dá) 20:1。
- 伸縮性和性能: Windows Server 2012 中的“重復(fù)數(shù)據(jù)刪除”具有高度的可伸縮性,能夠有效利用資源,并且不會產(chǎn)生干擾。它可以同時(shí)對多個大容量主數(shù)據(jù)運(yùn)行,而不會影響服務(wù)器上的其他工作負(fù)載。通過控制 CPU 和內(nèi)存資源的消耗,保持對服務(wù)器工作負(fù)載的較低影響。此外,用戶可以靈活設(shè)置何時(shí)應(yīng)該運(yùn)行“重復(fù)數(shù)據(jù)刪除”、指定用于消除重復(fù)的資源并為“重復(fù)數(shù)據(jù)刪除”創(chuàng)建有關(guān)文件選擇的策略。
- 可靠性和數(shù)據(jù)完整性:在對數(shù)據(jù)應(yīng)用“重復(fù)數(shù)據(jù)刪除”時(shí),保持?jǐn)?shù)據(jù)的完整性。Windows Server 2012 利用校驗(yàn)和值、一致性和身份驗(yàn)證來確保數(shù)據(jù)的完整性。此外,Windows Server 2012 中的“重復(fù)數(shù)據(jù)刪除”會為所有元數(shù)據(jù)和最常引用的數(shù)據(jù)保持冗余,以確保這些數(shù)據(jù)可以在發(fā)生損壞時(shí)進(jìn)行恢復(fù)。
- 與 BranchCache 相結(jié)合提高帶寬效率:通過與 BranchCache 進(jìn)行集成,同樣的優(yōu)化技術(shù)還可應(yīng)用于通過 WAN 傳輸?shù)椒种C(jī)構(gòu)的數(shù)據(jù)。這會縮短文件下載時(shí)間和降低帶寬占用。、
2)重復(fù)數(shù)據(jù)刪除技術(shù)的工作原理概述
“重復(fù)數(shù)據(jù)刪除”的目標(biāo)是通過將文件分割成小的 (32-128 KB) 且可變大小的區(qū)塊、確定重復(fù)的區(qū)塊,然后保持每個區(qū)塊一個副本,在更小的空間中存儲更多的數(shù)據(jù)。區(qū)塊的冗余副本由對單個副本的引用所取代。此外,還會對區(qū)塊進(jìn)行壓縮以便進(jìn)一步優(yōu)化空間。
其結(jié)果是對每個文件執(zhí)行磁盤內(nèi)轉(zhuǎn)換,如圖 1 所示。文件不再作為獨(dú)立的數(shù)據(jù)流進(jìn)行存儲,而是替換為指向存儲在通用存儲位置的數(shù)據(jù)塊的存根。
1)重復(fù)數(shù)據(jù)刪除的理想工作負(fù)載包括
- 常規(guī)文件共享:組內(nèi)容發(fā)布/共享、用戶主頁文件夾和配置文件重定向(脫機(jī)文件)
- 軟件部署共享:軟件二進(jìn)制文件、映像和更新
- VHD 庫:用來對虛擬機(jī)監(jiān)控程序進(jìn)行配置的 VHD 文件存儲
2)作為重復(fù)數(shù)據(jù)刪除候選的卷必須符合下列要求
- 不能是系統(tǒng)卷或引導(dǎo)卷。重復(fù)數(shù)據(jù)刪除在操作系統(tǒng)卷上不受支持。
- 卷可為分區(qū)的 MBR 或 GPT,并且必須使用 NTFS 文件系統(tǒng)格式化。
- 卷可以駐留在共享存儲(如光纖通道或 SAS 陣列)上,或者完全支持 iSCSI SAN 和 Microsoft 故障轉(zhuǎn)移群集。
- 群集共享卷 (CSV) 不受支持。
- Microsoft 的新靈活文件系統(tǒng) (ReFS) 不受支持。
- 卷必須向 Windows 公開為不可移除的驅(qū)動器。遠(yuǎn)程映射驅(qū)動器不受支持。
下面就來通過一個例子來體驗(yàn)一把重復(fù)數(shù)據(jù)刪除技術(shù)的部署。
首先我打開服務(wù)器管理器的工具下拉菜單,找到“計(jì)算機(jī)管理”,對添加到服務(wù)器的存儲磁盤進(jìn)行初始化的設(shè)置。如圖。
對存儲磁盤1進(jìn)行初始化、聯(lián)機(jī)、格式化的操作。如圖。
然后我們回到服務(wù)器管理器—卷—磁盤,看看能否為剛剛添加的磁盤啟用重復(fù)數(shù)據(jù)刪除技術(shù),我們發(fā)現(xiàn)“啟用重復(fù)數(shù)據(jù)刪除技術(shù)”的選項(xiàng)是灰色的,如圖。
原因很簡單,重復(fù)數(shù)據(jù)刪除技術(shù)是一項(xiàng)單獨(dú)的組件,需要通過添加角色和功能向?qū)нM(jìn)行安裝之后才能正常使用,下面我就先來安裝一下。
在“添加角色和功能向?qū)?rdquo;—“選擇服務(wù)器角色”界面,將文件和ISCSI服務(wù)下面的“數(shù)據(jù)刪除重復(fù)”勾選,如圖。
安裝成功,如圖。
下面我們再次回到卷管理界面,刷新一下之后,再右擊存儲磁盤查看一下,發(fā)現(xiàn)“配置數(shù)據(jù)刪除重復(fù)”的選項(xiàng)已經(jīng)可用了,如圖。
接下來,我通過一些簡單的步驟來進(jìn)一步測試該功能。
首先在“配置數(shù)據(jù)刪除重復(fù)”界面,我勾選“啟用數(shù)據(jù)刪除重復(fù)”,為新加卷E啟用該技術(shù)。如圖。
然后我們選擇上圖中的“設(shè)置刪除重復(fù)計(jì)劃”,對重復(fù)數(shù)據(jù)刪除的相關(guān)選項(xiàng)進(jìn)行配置。
如下圖。
勾選“啟用后臺優(yōu)化”。該功能確保在系統(tǒng)繁忙的時(shí)候,以最大程度低降低對系統(tǒng)性能的影響。
勾選“啟用吞吐量優(yōu)化”。該功能確保在指定的時(shí)間立刻運(yùn)行重復(fù)刪除作業(yè)。
啟用之后,可以從下圖中看出重復(fù)刪除的相關(guān)指標(biāo)已經(jīng)出來了。
下面我往E盤拷貝一些重復(fù)的文件來測試一下重復(fù)數(shù)據(jù)刪除技術(shù)的效果如何。
在沒有運(yùn)行去重作業(yè)之前的磁盤占用為2.11GB,如圖。
下面我修改一下重復(fù)刪除計(jì)劃,將重復(fù)刪除的開始時(shí)間設(shè)置為22:28,我當(dāng)前的系統(tǒng)時(shí)間為22:27,也就是說一分鐘以后開始運(yùn)行重復(fù)刪除計(jì)劃。如圖。
計(jì)劃運(yùn)行完成后,可以看到,E盤的重復(fù)數(shù)據(jù)刪除率為40%,刪除重復(fù)保存為931MB,如圖。
再次查看一下E盤的磁盤空間使用情況,由之前的2.11GB變成了1.32GB,可見磁盤空間已經(jīng)大大節(jié)省了。如圖。
最后,需要注意的是,不能夠?qū)ο到y(tǒng)盤啟用重復(fù)數(shù)據(jù)刪除技術(shù),如圖。