本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
为数据传输选择任务模式
您的 Amazon DataSync 任务可以在以下模式之一下运行:
-
增强模式-传输几乎无限数量的文件或对象,其性能高于基本模式。增强模式任务通过并行列示、准备、传输和验证数据来优化数据传输过程。增强模式目前可用于在 Amazon S3 位置之间进行传输,在没有代理的情况下在 Amazon S3 之间Azure Blob进行传输,在没有代理的情况下在其他云和 Amazon S3 之间传输,以及使用增强模式代理在 NFS 或 SMB 文件服务器与 Amazon S3 之间传输。
-
基本模式-在 Amazon 存储和所有其他支持的 DataSync 位置之间传输文件或对象。基本模式任务在数据集中文件、对象和目录数量方面存在配额限制。基本模式按顺序准备、传输和验证数据,因此对于大多数工作负载来说,基本模式的处理速度慢于增强模式。
了解任务模式的差异
以下信息有助于您确定使用哪种任务模式。
| 能力 | 增强模式行为 | 基本模式行为 |
|---|---|---|
| 性能 | DataSync 并行列出、准备、传输和验证您的数据。对于大多数工作负载(例如传输大型对象),可提供比基本模式更高的性能 | DataSync 按顺序准备、传输和验证您的数据。对于大多数工作负载,性能比增强模式更慢 |
| 数据集中每次执行任务时 DataSync 可以处理的项目数 |
对象数量几乎不受限制 |
适用配额 |
|
与 “基本” 模式相比,计数器和指标更多,例如在源位置 DataSync找到的对象数量、每次任务执行期间准备的对象数量,以及类似于文件和对象计数器的文件夹计数器 |
计数器和指标低于增强模式 |
|
| 结构化日志(JSON 格式) | 非结构化日志 | |
| 目前用于在 Amazon S3 位置之间进行传输,在没有代理的情况下在 Amazon S3 Azure Blob 和 Amazon S3 之间传输,在没有代理的情况下在其他云和 Amazon S3 之间传输,以及使用增强模式代理在 NFS 或 SMB 文件服务器与 Amazon S3 之间传输。 |
适用于所有 DataSync 支持的地点之间的传输 |
|
| DataSync 仅验证传输的数据 | DataSync 默认情况下会验证所有数据 | |
| 带宽限制 | 不适用 | 支持 |
| 成本 | 如需了解更多信息,请参阅定DataSync 价 |
如需了解更多信息,请参阅定DataSync 价 |
| 处理不支持的对象标签时失败 | 云存储传入或传出不支持对象标记的位置时,如果 ObjectTags 选项未指定或设置为 PRESERVE,任务执行会立即失败。 |
云存储传入或传出不支持对象标记的位置时,任务执行会正常运行,但如果 ObjectTags 选项未指定或设置为 PRESERVE,则会逐对象报告已标记对象的故障。 |
选择任务模式
您只能为 Amazon S3 位置之间的传输、在没有代理的情况下在 Amazon S3 之间进行传输、在没有代理的情况下在其他云Azure Blob和 Amazon S3 之间传输,以及使用增强模式代理在 NFS 或 SMB 文件服务器与 Amazon S3 之间的传输,以及使用增强模式代理在 NFS 或 SMB 文件服务器与 Amazon S3 之间的传输。否则,必须使用基本模式。例如,从本地 HDFS 位置传输到 S3 位置需要基本模式。
根据所选择的任务模式,任务选项和性能可能有所不同。一旦创建任务后,就无法更改任务模式。
- 所需的权限
-
要创建增强模式任务,与之 DataSync 配合使用的 IAM 角色必须具有
iam:CreateServiceLinkedRole权限。要获得 DataSync 用户权限,请考虑使用AWSDataSyncFullAccess。这是一项 Amazon 托管策略,可为用户提供对其依赖项的完全访问权限 DataSync 和最少访问权限。
打开 Amazon DataSync 控制台,网址为https://console.aws.amazon.com/datasync/
。 在左侧导航窗格中,展开数据传输,然后选择任务,然后选择创建任务。
-
配置您任务的源位置和目标位置。
有关更多信息,请参阅 我可以在哪里通过 Amazon DataSync传输数据?。
-
对于任务模式,请选择下列选项之一:
-
增强型
-
基本
有关更多信息,请参阅 了解任务模式的差异。
-
-
同样在配置设置页面,选择其他任务选项,或使用默认设置。
您可能对以下一些选项感兴趣:
完成此操作后,选择下一步。
-
检查任务配置,然后选择创建任务。
-
在你的 Amazon CLI 设置中,确保你使用的是你计划传输数据的 Amazon Web Services 区域 其中一个位置。
-
复制以下
create-task命令:aws datasync create-task \ --source-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \ --destination-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \ --task-mode "ENHANCED-or-BASIC" -
对于
--source-location-arn,指定源位置的 Amazon 资源名称(ARN)。 -
对于
--destination-location-arn,指定目标位置的 ARN。如果您要跨 Amazon Web Services 区域 账户转账,请确保 ARN 包含其他地区或账户 ID。
-
对于
--task-mode,指定ENHANCED或BASIC。有关更多信息,请参阅 了解任务模式的差异。
-
根据需要指定其他任务选项。您可能对以下一些选项感兴趣:
有关更多选项,请参阅 create-task
。以下是指定了增强模式和其他多个选项的 create-task命令示例:aws datasync create-task \ --source-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \ --destination-location-arn "arn:aws:datasync:us-east-1:account-id:location/location-id" \ --name "task-name" \ --task-mode "ENHANCED" \ --options TransferMode=CHANGED,VerifyMode=ONLY_FILES_TRANSFERRED,ObjectTags=PRESERVE,LogLevel=TRANSFER -
运行
create-task命令。如果命令成功,您将收到一条响应,显示所创建任务的 ARN。例如:
{ "TaskArn": "arn:aws:datasync:us-east-1:111222333444:task/task-08de6e6697796f026" }
您可以通过在CreateTask操作中配置TaskMode参数来指定 DataSync 任务模式。