本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用以下方法将现有文件迁移到 FSx for Windows File ServerAmazon DataSync
建议您使用Amazon DataSync在 FSx for Windows File Server 文件系统之间传输数据。 DataSync 是一种数据传输服务,它可简化、自动化和加快在本地存储系统和其他Amazon存储服务之间通过互联网移动和复制数据的过程Amazon Direct Connect。 DataSync 可以传输您的文件系统数据和元数据,例如所有权、时间戳和访问权限。
DataSync 支持复制 NTFS 访问控制列表 (ACL),还支持复制文件审核控制信息,也称为 NTFS 系统访问控制列表(SACL),管理员将使用这些信息控制用户尝试访问文件的审核日志。
您可以使用 DataSync 在两个 FSx for Windows File Server 文件系统之间传输文件,也可以使用不同的Amazon Web Services 区域Amazon帐户将数据移动到文件系统。您可以 DataSync 与 FSx for Windows File Server 文件系统结合使用,执行其他任务。例如,您可以执行一次性数据迁移,定期为分布式工作负载摄取数据,为数据保护和恢复安排复制。
在中Amazon DataSync,FSx for Windows File Server 的位置是FSx for Windows File Server 的端点。您可以在 Windows 文件服务器的 FSx 位置与其他文件系统的位置之间传输文件。有关信息,请参阅《Amazon DataSync用户指南》中的使用地点。
DataSync 使用服务器消息块 (SMB) 协议访问 FSx for Windows File Server。它使用您在Amazon DataSync控制台或中配置的用户名和密码进行身份验证Amazon CLI。
先决条件
要将数据迁移到适用于 Windows 的 Amazon FSx 文件服务器设置中,您需要符合 DataSync 要求的服务器和网络。要了解更多信息,请参阅《Amazon DataSync用户指南》 DataSync中的要求。
如果您要进行大型数据迁移,或者迁移涉及许多小文件,我们建议使用具有 SSD 存储类型的 Amazon FSx 文件系统。提出此建议的原因是, DataSync 任务涉及文件元数据的扫描,这可能会耗尽 HDD 文件系统的磁盘 IOPS 限制,从而导致长时间迁移和文件系统性能影响。有关更多信息,请参阅:将现有文件存储迁移到 FSx for Windows File Server 的最佳实践。
您可以使用 FSx 性能指标监控文件系统的磁盘 I/O 利用率。
使用迁移文件的基本步骤 DataSync
要使用将文件从源位置传输到目标位置 DataSync,请执行以下基本步骤:
-
在您的环境中下载并部署代理,然后激活。
-
创建并配置源和目标位置。
-
创建并配置任务。
-
运行任务,将文件从源传输到目标。
要了解如何将文件从现有的本地文件系统传输到FSx for Windows File Server,请参阅在自管理存储和之间传输数据Amazon、为中小型企业创建位置和为适用于 Windows File Server 的 Amazon FsX 创建位置Amazon DataSync用户指南。
要了解如何将文件从现有的云端文件系统传输到您的 FSx for Windows File Server,请参阅Amazon DataSync用户指南中的将您的代理作为 Amazon EC2 实例进行部署。
在两个 Amazon FSx 文件系统之间迁移
您可以使用 DataSync 在两个 Amazon FSx 文件系统之间迁移数据。如果您需要将工作负载从现有文件系统转移到具有不同配置的新文件系统,例如从单可用区配置转移到多可用区配置,这可能会很有用。您也可以使用 DataSync 在两个文件系统之间分配工作负载。
以下是迁移过程的示例概述:
-
为源文件系统和目标文件系统创建 DataSync 位置。请注意,源和目标必须属于同一 Active Directory (AD) 域,或者它们的域之间具有 AD 信任关系。
-
创建和配置将数据从源位置传输到目标位置的 DataSync 任务。您可以将任务作为一次性实例运行,也可以将任务设置为按您配置的计划自动运行。
-
任务成功完成后,目标文件系统中的数据就是源文件系统的精确副本。请注意,您需要暂时暂停源文件系统上的任何写入活动或文件更新才能完成任务。然后,您可以切换到目标文件系统并删除源文件系统。
从生产文件系统迁移之前,可以在从最近的备份中恢复的文件系统上测试迁移过程。这使您可以估计数据传输过程需要多长时间,并提前排除 DataSync 错误。
为了最大限度地缩短转换时间,您可以提前运行 DataSync 任务,将大部分数据从源文件系统移动到目标文件系统。停止源文件系统的流量后,您可以运行最后一次任务传输,同步自停止流量以来新更新的任何数据,然后切换到目标文件系统。
您可以将 DataSync 任务配置为仅在某些目录中运行,或者包含或排除某些路径。如果您要parallel 运行多个任务,或者想要迁移一部分数据,这可能很有用。
您可以在目标文件系统上创建 DNS 别名,该别名与源文件系统的 DNS 名称相同。这使您的最终用户和应用程序能够继续使用源文件系统的 DNS 名称访问文件数据。有关如何设置 DNS 别名的更多信息,请参阅:演练 5:使用 DNS 别名访问您的文件系统。
在执行此类迁移时,我们提出以下建议:
-
安排迁移,以避免任何文件系统备份、每周维护窗口和
Data Deduplication
作业。具体而言,如果Data Deduplication GarbageCollection
任务与您计划的迁移相吻合,我们建议将其禁用。 -
对源文件系统和目标文件系统都使用 SSD 存储类型。通过从备份中恢复,可以在 HDD 和 SSD 存储类型之间切换。有关更多信息,请参阅:将现有文件存储迁移到 FSx for Windows File Server。
-
为源和目标文件系统配置足够的吞吐容量,以满足需要传输的数据量。在 DataSync 任务过程中,监控源文件系统和目标文件系统的性能利用率。有关更多信息,请参阅:使用亚马逊监控指标CloudWatch。
-
设置DataSync 监控以帮助您了解正在进行的任务的进度。如果您遇到任何错误,也可以向 Amazon L CloudWatch ogs 组发送 DataSync 日志,以帮助您调试任务。