编译模型(Amazon SageMaker 控制台) - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

编译模型(Amazon SageMaker 控制台)

您可在 Amazon SageMaker 控制台中创建 Amazon SageMaker Neo 编译作业。

  1. Amazon SageMaker控制台中,选择编译作业,然后选择创建编译作业

    
                        创建编译作业。
  2. 在存储库的创建编译作业页面,在作业名称中,输入一个名称。然后选择 IAM role (IAM 角色)

    
                        IAM role (IAM 角色)。
  3. 如果您没有 IAM 角色,请选择 Create a new role (创建新角色)

    
                        IAM role (IAM 角色)。
  4. Create an IAM role (创建 IAM 角色) 页面上,选择 Any S3 bucket (任意 S3 存储桶),然后选择 Create role (创建角色)

    
                        创建 IAM 角色。
  5. Non PyTorch Frameworks

    输入配置输入部分中,输入 Amazon S3 存储桶 URI 的完整路径,该路径包含您的模型工件模型伪影的位置输入字段。您的模型伪影必须采用压缩的 tarball 文件格式 (.tar.gz)。

    对于数据输入配置字段中,输入指定输入数据形状的 JSON 字符串。适用于机器学习框架中,选择您选择的框架。

    
                                    输入配置。

    要查找取决于框架的输入数据形状的 JSON 字符串示例,请参阅Neo 需要什么输入数据形状

    PyTorch Framework

    类似的说明适用于编译 PyTorch 模型。但是,如果您使用 PyTorch 进行了训练,并试图编译ml_*(除外)ml_inf)目标,您可以选择指定您使用的 PyTorch 版本。

    要查找取决于框架的输入数据形状的 JSON 字符串示例,请参阅Neo 需要什么输入数据形状

    注意

    在编译ml_*实例,请使用 PyTorch 框架编译器选项中的字段输出配置输出来提供正确的数据类型(dtype)的模型输入。默认值设置为"float32"

    警告

    如果您指定的 Amazon S3 存储桶 URI 路径导致.pth文件,您将在开始编译之后收到以下错误:ClientError: InputConfiguration: Unable to untar input model.Please confirm the model is a tar.gz file

  6. 转至输出配置输出部分。选择要在其中部署模型的位置。您可以将模型部署到目标设备Target 平台。目标设备包括云设备和边缘设备。目标平台是指希望模型运行的特定操作系统、体系结构和加速器。

    适用于S3 输出位置中,输入存储模型的 S3 存储桶的路径。您可以选择添加 JSON 格式的编译器选项,在编译器选项部分。

    
                        创建作业。
  7. 在启动时检查编译作业的状态。此作业状态可在编译 Job页面,如以下屏幕截图所示。您也可以在状态column.

    
                        编译作业状态。
  8. 在完成时检查编译作业的状态。您可以在状态列,如以下屏幕截图所示。

    
                        编译作业状态。