使用 Windows 功能来优化和管理文件系统 - Amazon FSx for Windows File Server
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Windows 功能来优化和管理文件系统

使用重复数据删除

FSx 支持使用 Microsoft 重复数据删除来识别和消除冗余数据。以下是使用重复数据删除的一些最佳实践:

  • 将重复数据删除作业安排在文件系统空闲时运行:默认计划包括每周六 2:45 UTC 进行 GarbageCollection 作业。如果您的文件系统中有大量数据流失,则可能需要几个小时才能完成。如果此时间不适合您的工作负载,请将此作业安排在您预计文件系统流量较低的时候运行。

  • 为完成重复数据删除配置足够的吞吐能力:更高的吞吐能力可提供更高级别的内存。Microsoft 建议每 1 TB 逻辑数据有 1 GB 的内存来运行重复数据删除。使用 Amazon FSx 性能表来确定与文件系统的吞吐能力关联的内存,并确保内存资源足以容纳您的数据大小。

  • 自定义重复数据删除设置以满足您的特定存储需求并降低性能要求:您可以将优化限制在特定的文件类型或文件夹上运行,或者设置最小文件大小和期限以进行优化。要了解更多信息,请参阅重复数据删除

使用影子副本

您可以为文件系统启用影子副本,以允许最终用户在 Windows 文件资源管理器中查看和恢复早期快照中的单个文件或文件夹。Amazon FSx 使用 Microsoft Windows Server 提供的影子副本功能。使用以下最佳实践创建影子副本:

  • 确保您的文件系统有足够的性能资源:根据设计,Microsoft Windows 使用一种 copy-on-write 方法来记录自上次卷影复制点以来的更改,并且此 copy-on-write 活动可能导致每个文件写入操作最多三次 I/O 操作。

  • 使用 SSD 存储并提高吞吐能力:由于 Windows 需要高水平 I/O 性能来维护影子副本,因此我们建议使用 SSD 存储并将吞吐能力提高至预期工作负载的三倍。这有助于确保您的文件系统有足够的资源来避免影子副本被意外删除等问题。

  • 仅维护所需数量的影子副本:如果您有大量影子副本(例如,超过 64 个最新影子副本)或者影子副本在单个文件系统上占用大量存储空间(TB 级),则失效转移和失效自动恢复等进程可能需要一些额外时间。这是因为 FSx for Windows 需要对影子副本存储进行一致性检查。由于 Windows 版 FSx 需要在维护卷影副本的同时执行 copy-on-write 活动,因此您可能还会遇到更长的 I/O 操作延迟。要最大限度地减少影子副本对可用性和性能的影响,请手动删除未使用的影子副本,或者配置脚本以自动删除文件系统上的旧影子副本。有关更多信息,请参阅 影子副本