开始使用 Amazon SageMaker Canvas - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

开始使用 Amazon SageMaker Canvas

本指南将告诉您如何开始使用 SageMaker Canvas。如果您是 IT 管理员,请参阅 设置和管理 Amazon SageMaker Canvas(面向 IT 管理员),为用户设置 SageMaker Canvas。

如果您是业务用户或分析师,请阅读以下章节。

设置 Amazon SageMaker Canvas 的先决条件

要设置 Amazon SageMaker Canvas,您可以联系管理员或执行以下操作:

  • 设置 Amazon SageMaker 域

  • 配置用于存储 Canvas 数据的 Amazon S3 位置

  • 授予自己使用 Canvas 中特定功能的权限

    • 可选:授予自己上传本地文件的权限

    • 可选:授予自己构建自定义图像和文本预测模型的权限

    • 可选:授予自己使用即用型模型和根基模型的权限

    • 可选:授予自己进行时间序列预测的权限

    • 可选:授予自己向 Amazon QuickSight 发送批量预测的权限

    • 可选:授予自己将模型部署到端点的权限

    • 可选:授予自己将模型注册到模型注册表的权限

    • 可选:授予自己与 Amazon SageMaker Studio 协作的权限

    • 可选:授予自己导入 Amazon Redshift 数据的权限

以下各节介绍如何设置 Amazon SageMaker 域并向自己授予 SageMaker Canvas 权限。

重要

要设置 Amazon SageMaker Canvas,您的 Amazon SageMaker Studio 版本必须是 3.19.0 或更高版本。有关更新 Amazon SageMaker Studio 的信息,请参阅 关闭并更新 SageMaker Studio

使用 IAM Identity Center 加入域

要加入域,请按照以下步骤操作:

  1. 打开 SageMaker 控制台

  2. 在左侧导航窗格中,选择管理员配置

  3. 管理员配置下,选择

  4. 页面上,选择创建域

  5. 选择标准设置

  6. 选择配置

按照以下步骤配置域的常规设置:

  1. 权限下,对于 IAM 角色,从角色选择器中选择一个选项。

    如果您选择输入自定义 IAM 角色 ARN,则该角色必须至少有一个附加的信任策略,以授予 SageMaker 代入该角色的权限。有关更多信息,请参阅 SageMaker 角色

    如果您选择创建新角色,则将打开创建 IAM 角色对话框:

    1. 选择创建角色。SageMaker 会创建一个新的 IAM AmazonSageMaker-ExecutionPolicy 角色,并附加 AmazonSageMakerFullAccess 策略。

  2. 网络和存储下,指定以下内容:

    • VPC 信息 – 有关更多信息,请参阅 选择 Amazon VPC在无法访问互联网的 VPC 中配置 Amazon SageMaker Canvas

    • (可选)加密密钥 – SageMaker 使用 Amazon KMS key 来加密 Amazon Elastic File System (Amazon EFS) 和 Amazon Elastic Block Store (Amazon EBS) 文件系统。默认情况下,它使用 Amazon 托管式密钥。要使用客户管理的密钥,请输入其密钥 ID 或 Amazon 资源名称 (ARN)。有关更多信息,请参阅 使用加密保护静态数据

      注意

      传输中加密仅适用于 Amazon SageMaker Studio。

  3. 选择下一步

按照以下步骤配置域的 SageMaker Canvas 设置:

  1. 对于 Canvas 基本权限配置,请保持启用 Canvas 基本权限选项处于打开状态(默认情况下该选项处于打开状态)。这会将 AmazonSageMakerCanvasFullAccess 策略附加到用户的执行角色,并确定使用 SageMaker Canvas 应用程序所需的最低权限。

  2. 对于 Canvas 存储配置,请指定您希望 Canvas 存储应用程序数据(例如模型构件、数据集和日志)的位置。有关更多信息,请参阅 配置 Amazon S3 存储。请在本节中执行以下操作:

    1. 如果要将位置设置为 SageMaker 按照模式 s3://sagemaker-{Region}-{your-account-id} 创建的默认存储桶,请选择系统托管

    2. 选择自定义 S3,将您自己的 Amazon S3 存储桶指定为存储位置。然后,输入 Amazon S3 URI。

    3. (可选)对于加密密钥,指定用于加密存储在指定位置的 Canvas 构件的 KMS 密钥。

  3. (可选)对于 Canvas 即用型模型配置,请执行以下操作:

    1. 打开启用 Canvas 即用型模型选项,让用户有权限使用 Canvas 中的即用型模型生成预测(默认情况下处于启用状态)。此选项还允许您与生成式人工智能支持的模型聊天。有关更多信息,请参阅 在根基模型中使用生成式人工智能

    2. 打开启用使用 Amazon Kendra 查询文档选项,让用户有权限使用根基模型查询存储在 Amazon Kendra 索引中的文档。然后输入要授予对其访问权限的现有索引。有关更多信息,请参阅 在根基模型中使用生成式人工智能

  4. (可选)对于 ML Ops 权限配置部分,执行以下操作:

    1. 打开启用 Canvas 模型的直接部署选项,让用户有权限将模型从 Canvas 部署到 SageMaker 端点。有关 Canvas 中模型部署的更多信息,请参阅 将模型部署到端点

    2. 打开为所有用户启用模型注册表注册权限选项,让用户有权限在 SageMaker 模型注册表中注册其模型版本(默认情况下处于启用状态)。有关更多信息,请参阅 在 SageMaker 模型注册表中注册模型版本

  5. (可选)对于时间序列预测配置,请保持启用时间序列预测选项处于打开状态,让用户有权在 SageMaker Canvas 中进行时间序列预测(默认情况下该选项处于打开状态)。

    1. 如果您打开了启用时间序列预测,请选择创建并使用新的执行角色;如果您已经拥有一个附加了所需的 Amazon Forecast 权限的 IAM 角色,则选择使用现有执行角色(有关更多信息,请参阅 IAM 角色设置方法)。

  6. (可选)如果您打开了启用时间序列预测,请选择创建并使用新的执行角色;如果您已经拥有一个附加了所需的 Amazon Forecast 权限的 IAM 角色,则选择使用现有执行角色(有关更多信息,请参阅 IAM 角色设置方法)。

  7. (可选)添加标签以便在 Amazon Billing and Cost Management 中跟踪您的成本和使用趋势。SageMaker 会将您在域中指定的标签添加到您在域中创建的所有 SageMaker Canvas 应用程序中。有关计费和标签的更多信息,请参阅 在 SageMaker Canvas 中管理账单和成本

  8. 完成对域设置的任何其他更改,然后选择提交

注意

如果您在通过控制台授予权限(例如对即用型模型的权限)时遇到任何问题,请参阅主题 排除通过 SageMaker 控制台授予权限的问题

设置域时,SageMaker Canvas 会在您在 Canvas 存储配置中指定的 Amazon S3 存储桶中创建一个 Canvas/ 文件夹。您的 Canvas 应用程序数据(例如导入的数据集和批量预测)存储在此文件夹中。

授予自己使用 Canvas 中特定功能的权限

以下信息概述了您可以向 Canvas 用户授予的权限,以允许他们使用 Canvas 中的各种特性和功能:

  • 本地文件上传。在设置域时,默认情况下在 Canvas 基本权限中打开本地文件上传权限。如果您无法将本地文件从计算机上传到 SageMaker Canvas,则可以将 CORS 策略附加到您在 Canvas 存储配置中指定的 Amazon S3 存储桶。如果允许 SageMaker 使用默认存储桶,则存储桶的命名模式为 s3://sagemaker-{Region}-{your-account-id}。有关更多信息,请参阅向用户授予上传本地文件的权限

  • 自定义图像和文本预测模型。在设置域时,默认情况下在 Canvas 基本权限中打开构建自定义图像和文本预测模型的权限。但是,如果您有自定义 IAM 配置并且不想将 AmazonSageMakerCanvasFullAccess 策略附加到用户的 IAM 执行角色,则必须明确向用户授予必要的权限。有关更多信息,请参阅 授予用户构建自定义图像和文本预测模型的权限

  • 即用型模型和根基模型。您可能希望能够使用 Canvas 即用型模型对数据进行预测。即用型模型权限还包括能够与生成式人工智能支持的模型聊天。在设置域时,默认情况下会打开这些权限,您也可以编辑已创建的域的权限。Canvas 即用型模型权限选项会将 AmazonSageMakerCanvasAIServicesAccess 策略添加到执行角色中。有关更多信息,请参阅即用型模型文档的 开始使用 部分。

    有关开始使用生成式人工智能根基模型的更多信息,请参阅 在根基模型中使用生成式人工智能

  • 时间序列预测。如果您希望能够对时间序列数据进行预测,可以在设置域时添加时间序列预测权限,也可以在创建域后编辑域或用户配置文件的权限。所需的权限是 AmazonSageMakerCanvasForecastAccess 托管策略,以及您在设置用户配置文件时选择的 Amazon IAM 角色与 Amazon Forecast 之间的信任关系。有关如何将这些权限添加到 IAM 角色的说明,请参阅向用户授予执行时序预测的权限

  • 向 Amazon QuickSight 发送批量预测。您可能希望能够向 Amazon QuickSight 发送批量预测或根据自定义模型生成的预测数据集以进行分析。在 QuickSight 中,您可以构建和发布包含预测结果的预测控制面板。有关如何将这些权限添加到 Canvas 用户的 IAM 角色的说明,请参阅向用户授予向 Amazon QuickSight 发送预测的权限

  • 将 Canvas 模型部署到 SageMaker 端点。SageMaker Hosting 提供端点,您可以使用这些端点来部署在生产环境中使用的模型。您可以将 Canvas 中构建的模型部署到 SageMaker 端点,然后在生产环境中以编程方式进行预测。有关更多信息,请参阅 将模型部署到端点

  • 将模型版本注册到模型注册表。您可能想在 SageMaker 模型注册表中注册模型版本,该注册表是一个用于跟踪模型更新版本状态的存储库。处理 SageMaker 模型注册表的数据科学家或 MLOps 团队可以查看您构建的模型版本,并批准或拒绝这些版本。然后,他们可以将您的模型版本部署到生产环境或启动自动化工作流。默认情况下,您的域的模型注册权限处于开启状态。您可以在用户配置文件级别管理权限,并授予或删除特定用户的权限。有关更多信息,请参阅 在 SageMaker 模型注册表中注册模型版本

  • 与数据科学家协作。如果您要与 Studio 用户协作并共享模型,则必须为设置用户配置文件时选择的 Amazon IAM 角色添加额外权限。有关如何向角色添加策略的说明,请参阅向用户授予与 Studio 协作的权限

  • 从 Amazon Redshift 导入数据。如果您想从 Amazon Redshift 导入数据,则必须授予自己额外的权限。您必须将 AmazonRedshiftFullAccess 托管策略添加到您在设置用户配置文件时选择的 Amazon IAM 角色。有关如何向角色添加策略的说明,请参阅向用户授予导入 Amazon Redshift 数据的权限

注意

通过其他数据来源(如 Amazon Athena 和 SaaS 平台)导入的必要权限包含在 AmazonSageMakerFullAccessAmazonSageMakerCanvasFullAccess 策略中。如果您按照标准设置说明进行操作,则这些策略应该已经附加到执行角色。有关这些数据来源及其权限的更多信息,请参阅 连接到数据来源

步骤 1:以企业用户身份登录 Amazon SageMaker Canvas

请联系您的管理员,管理员会指导您完成 Amazon SageMaker Canvas 的设置过程。

初始设置完成后,您可以通过执行以下操作来访问 SageMaker Canvas。

  1. 导航到 SageMaker 控制台

  2. 在导航窗格中,选择 Canvas

  3. 开始使用框中,从下拉列表中选择您的用户配置文件。

  4. 选择打开 Canvas 以打开该应用程序。

首次登录 SageMaker Canvas 时,系统会显示一条欢迎信息,其中包含快速入门教程,您可以根据这些教程来了解 SageMaker Canvas 应用程序。


    SageMaker Canvas 应用程序中包含入门教程的欢迎消息屏幕截图。

您可以按照 Canvas 入门教程来深入了解 SageMaker Canvas 应用程序。还有更简短的教程,可指导您完成使用 SageMaker Canvas 的各个步骤。这些教程向您展示如何导入数据集、构建模型、分析已建模型的结果以及如何使用模型生成预测。您可以通过选择帮助按钮,然后选择其中一个教程,随时重温这些教程。


    SageMaker Canvas 应用程序中帮助面板的屏幕截图,您可以在其中访问入门教程。

步骤 2:使用 SageMaker Canvas 获得预测

登录 Canvas 后,您就可以开始构建模型并生成数据预测。

您可以使用 Canvas 即用型模型进行预测而无需构建模型,也可以针对具体业务问题构建自定义模型。查看以下信息,以决定是即用型模型还是自定义模型最适合您的使用案例。

  • 即用型模型。借助即用型模型,您可以使用预先构建的模型从数据中提取见解。即用型模型涵盖了各种使用案例,例如语言检测和文档分析。要开始使用即用型模型进行预测,请参阅 使用即用型模型

  • 自定义模型。使用自定义模型,您可以构建各种模型类型,这些模型类型经过自定义,可以对数据进行预测。如果您想构建基于业务特定数据训练的模型,并且想要使用诸如与数据科学家合作评估模型性能之类的功能,请使用自定义模型。要开始构建自定义模型,请参阅 使用自定义模型

您还可以在 SageMaker 的其他功能中自带模型 (BYOM)。Amazon SageMaker Studio 用户可与 Canvas 用户共享其模型,Canvas 用户可使用该模型生成预测结果。要了解更多信息,请参阅在 SageMaker Canvas 中自带模型