什么是重复数据删除?
重复数据删除(通常简称为删除重复)是一项功能,可以帮助减少冗余数据对存储成本的影响。 启用后,重复数据删除会检查卷上的数据(检查是否存在重复分区),优化卷上的可用空间。 卷数据集的重复分区只存储一次,并可以压缩,节省更多空间。 重复数据删除可优化冗余,而不会损坏数据保真度或完整性。 有关重复数据删除工作原理的详细信息,请参阅“重复数据删除的工作原理?” 位于了解重复数据删除页面。
重要
KB4025334 包含针对数据重复删除的重要修补程序汇总,包括关键的可靠性修补程序。我们强烈建议在 Windows Server 2016 和 Windows Server 2019 上使用数据重复删除时安装此更新。
重复数据删除为什么有用?
重复数据删除可帮助存储管理员降低重复数据的相关成本。 大型数据集通常具有大量重复数据,这会增加存储数据的成本。 例如:
- 用户文件共享可能会有相同或类似文件的多个副本。
- 不同 VM 的虚拟化来宾可能几乎完全相同。
- 每天的备份快照差别可能非常小。
通过重复数据删除可以节省的空间取决于卷上的数据集或工作负荷。 重复率很高的数据集的优化率最高可达 95%,存储使用率最高降低 20 倍。 下表主要显示了各种内容类型的典型的重复数据删除节省情况:
方案 | 内容 | 典型的空间节省率 |
---|---|---|
用户文档 | Office 文档、照片、音乐、视频等 | 30-50% |
部署共享 | 软件二进制文件、cab 文件、符号等 | 70-80% |
虚拟化库 | ISO、虚拟硬盘文件等 | 80-95% |
通用文件共享 | 以上都是 | 50-60% |
注意
如果你只是想释放卷的空间,请考虑使用启用了云分层的 Azure 文件同步。 这样,你便可以在本地缓存最常访问的文件,并将不经常访问的文件分层到云中,从而节省本地存储空间,同时保持性能。 有关详细信息,请参阅 规划 Azure 文件同步部署。
何时可以使用重复数据删除?
场景示意图 | 说明 |
---|---|
![]() |
常规用途文件服务器:常规用途文件服务器是一般使用文件服务器,这些服务器可能包含以下任一类型的共享:
|
![]() |
虚拟桌面基础结构(VDI)部署:VDI 服务器(如 远程桌面服务)为组织提供一个轻型选项,以便为用户预配桌面。 对于一个组织而言,有很多原因要依赖于此类技术:
|
![]() |
备份目标(如虚拟化备份应用程序:备份应用程序(如 Microsoft Data Protection Manager (DPM))是重复数据删除的优秀候选项,因为备份快照之间存在重大重复。 |
![]() |
其他工作负荷: 其他工作负荷也可能是重复数据删除的优秀候选项。 |