AWS::Glue::MLTransform - AWS CloudFormation
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

AWS::Glue::MLTransform

AWS::Glue::MLTransform 是一种用于管理机器学习转换的 AWS Glue 资源类型。

语法

要在 AWS CloudFormation 模板中声明此实体,请使用以下语法:

JSON

{ "Type" : "AWS::Glue::MLTransform", "Properties" : { "Description" : String, "GlueVersion" : String, "InputRecordTables" : InputRecordTables, "MaxCapacity" : Double, "MaxRetries" : Integer, "Name" : String, "NumberOfWorkers" : Integer, "Role" : String, "Tags" : Json, "Timeout" : Integer, "TransformParameters" : TransformParameters, "WorkerType" : String } }

YAML

Type: AWS::Glue::MLTransform Properties: Description: String GlueVersion: String InputRecordTables: InputRecordTables MaxCapacity: Double MaxRetries: Integer Name: String NumberOfWorkers: Integer Role: String Tags: Json Timeout: Integer TransformParameters: TransformParameters WorkerType: String

属性

Description

机器学习转换的用户定义的长格式描述文本。

必需:否

类型:字符串

Update requires: No interruption

GlueVersion

此值确定该机器学习转换与哪个版本的 AWS Glue 兼容。建议大多数用户使用 Glue 1.0。如果未设置此值,则 Glue 兼容性默认为 Glue 0.9。有关更多信息,请参阅《开发人员指南》中的 AWS Glue 版本

必需:否

类型:字符串

Update requires: No interruption

InputRecordTables

转换使用的 AWS Glue 表定义的列表。

必需:是

类型InputRecordTables

Update requires: Replacement

MaxCapacity

分配给此转换的任务运行的 AWS Glue 数据处理单元 (DPU) 的数量。您可以分配 2 到 100 个 DPU;默认值为 10。DPU 是对处理能力的相对度量,它由 4 个 vCPU 的计算容量和 16GB 内存组成。有关更多信息,请参阅 AWS Glue 定价页

MaxCapacity 是具有 NumberOfWorkersWorkerType 的互斥选项。

  • 如果已设置 NumberOfWorkersWorkerType,则不能设置 MaxCapacity

  • 如果已设置 MaxCapacity,则不能设置 NumberOfWorkersWorkerType

  • 如果已设置 WorkerType,则 NumberOfWorkers 为必填项(反之亦然)。

  • MaxCapacityNumberOfWorkers 都必须至少为 1。

在将 WorkerType 字段设置为 Standard 之外的值时,MaxCapacity 字段将自动设置并变为只读。

必需:否

类型:双精度

Update requires: No interruption

MaxRetries

在机器学习转换的 MLTaskRun 失败后重试的最大次数。

必需:否

类型:整数

Update requires: No interruption

Name

机器学习转换的用户定义的名称。名称必须是唯一的。Name 是可选的:

  • 如果提供 Name,则不能反复创建堆栈。

  • 如果未提供 Name,则改为使用随机生成的名称。

必需:否

类型:字符串

Update requires: No interruption

NumberOfWorkers

在转换的任务运行时分配的已定义 workerType 的工作线程数。

如果已设置 WorkerType,则 NumberOfWorkers 为必填项(反之亦然)。

必需:否

类型:整数

Update requires: No interruption

Role

具有所需权限的 IAM 角色的名称或 Amazon 资源名称 (ARN)。所需权限包括 AWS Glue 资源的 AWS Glue 服务角色权限和转换所需的 Amazon S3 权限。

  • 此角色需要 AWS Glue 服务角色权限才能访问 AWS Glue 中的资源。请参阅将策略附加到访问 AWS Glue 的 IAM 用户

  • 此角色需要对您的 Amazon Simple Storage Service (Amazon S3) 源、目标、临时目录、脚本以及此转换的任务运行所使用的任何库的权限。

必需:是

类型:字符串

Update requires: No interruption

Tags

用于此机器学习转换的标签。您可以使用标签来限制对机器学习转换的访问权限。有关 AWS Glue 中的标签的更多信息,请参阅开发人员指南中的 AWS Glue 中的 AWS 标签

必需:否

类型:Json

Update requires: No interruption

Timeout

机器学习转换的超时(以分钟为单位)。

必需:否

类型:整数

Update requires: No interruption

TransformParameters

与机器学习转换关联的特定于算法的参数。

必需:是

类型TransformParameters

Update requires: No interruption

WorkerType

在此转换的任务运行时分配的预定义工作线程的类型。接受的值为 Standard、G.1X 或 G.2X。

  • 对于 Standard 工作线程类型,每个工作线程提供 4 个 vCPU、16 GB 内存和 50GB 磁盘,并且每个工作线程提供 2 个执行器。

  • 对于 G.1X 工作线程类型,每个工作线程提供 4 个 vCPU、16 GB 内存和 64GB 磁盘,并且每个工作线程提供 1 个执行器。

  • 对于 G.2X 工作线程类型,每个工作线程提供 84 个 vCPU、32 GB 内存和 128GB 磁盘,并且每个工作线程提供 1 个执行器。

MaxCapacity 是具有 NumberOfWorkersWorkerType 的互斥选项。

  • 如果已设置 NumberOfWorkersWorkerType,则不能设置 MaxCapacity

  • 如果已设置 MaxCapacity,则不能设置 NumberOfWorkersWorkerType

  • 如果已设置 WorkerType,则 NumberOfWorkers 为必填项(反之亦然)。

  • MaxCapacityNumberOfWorkers 都必须至少为 1。

必需:否

类型:字符串

Update requires: No interruption

返回值

Ref

在将此资源的逻辑 ID 传递给内部 Ref 函数时,Ref 返回 转换 ID。

For more information about using the Ref function, see Ref.