开始使用 Amazon C SageMaker anvas - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

开始使用 Amazon C SageMaker anvas

本指南告诉你如何开始使用 SageMaker Canvas。如果您是 IT 管理员并想了解更多详细信息,请参阅设置和管理 Amazon SageMaker Canvas(面向 IT 管理员)为用户设置 SageMaker Canvas。

设置 Amazon C SageMaker anvas 的先决条件

要设置 SageMaker Canvas 应用程序,您必须先登录亚马逊 SageMaker 域,该域支持各种机器学习 (ML) 环境,例如 Canvas 和 SageMaker Studio

以下部分介绍如何设置亚马逊 SageMaker 域名并向自己授予 Canvas 权限。

重要

要设置亚马逊 SageMaker Canvas,您的亚马逊 SageMaker Studio 版本必须为 3.19.0 或更高版本。有关更新 Amazon SageMaker Studio 的信息,请参阅关闭并更新 SageMaker Studio 经典版

加入域名

要设置您的域名,请先参阅Amazon SageMaker 域名概述以了解有关域名的更多信息。

然后,当您准备好设置域名时,请选择以下设置方法之一:

  1. (快速)快速设置到 Amazon SageMaker— 如果您想快速设置域名,请选择此选项。这会为您的用户授予所有默认 Canvas 权限和基本功能。管理员可以稍后启用任何其他功能,例如文档查询。如果您想配置更精细的权限,我们建议您选择选项 2 或 3。

  2. (高级)Amazon 的自定义设置 SageMaker— 如果您想完成更高级的域名设置,请选择此选项。

如果您正在进行快速设置(前面列表中的选项 1),则可以跳过本节的其余部分,继续前进第 1 步:登录 SageMaker 画布

如果您正在进行高级设置(选项 2 或 3),则可以指定要向用户授予访问权限的 Canvas 功能。在完成高级域设置时,请使用本节的其余部分来帮助您配置特定于 Canvas 的权限。

Amazon 的自定义设置 SageMaker设置说明中,对于步骤 2:用户和机器学习活动,您必须选择要授予的 Canvas 权限。在机器学习活动部分,您可以选择以下权限策略来授予对 Canvas 功能的访问权限。设置域名时,您最多只能选择 8 个 ML 活动。使用Canvas需要以下列表中的前两个权限,其余权限用于其他功能。

  • 运行 Studio 应用程序 — 这些权限是启动 Canvas 应用程序所必需的。

  • Canvas Core Access — 这些权限允许您访问 Canvas 应用程序和 Canvas 的基本功能,例如创建数据集、使用基本数据转换以及构建和分析模型。

  • (可选)Canvas 数据准备(由 Data Wrangler 提供支持)— 这些权限授予您创建数据流和使用高级转换在 Canvas 中准备数据的权限。这些权限也是创建数据处理任务和数据准备作业计划所必需的。

  • (可选)Canvas AI 服务 — 这些权限允许您访问 Canvas 中的 R eady-to-use 模型、基础模型和 “与数据聊天” 功能。

  • (可选)Kendra 访问权限 — 此权限允许您访问文档查询功能,在该功能中,您可以使用 Canvas 中的基础模型查询存储在 Amazon Kendra 索引中的文档。

    如果您选择此选项,则在 Canvas Kendra Access 部分,输入您要授予访问权限的亚马逊 Kendra 索引的 ID。

  • (可选)Canvas MLOP — 此权限允许您访问 Canvas 中的模型部署功能,您可以在其中部署模型以用于生产。

在域设置的 “步骤 3:应用程序” 部分,选择 “配置画布”,然后执行以下操作:

  1. 对于 Canvas 存储配置,请指定您希望 Canvas 存储应用程序数据的位置,例如模型构件、批量预测、数据集和日志。 SageMaker 在此存储桶内创建一个用于存储数据的Canvas/文件夹。有关更多信息,请参阅 配置 Amazon S3 存储。请在本节中执行以下操作:

    1. 如果您要将位置设置为遵循该模式s3://sagemaker-{Region}-{your-account-id}的默认 SageMaker创建存储桶,请选择系统托管

    2. 选择自定义 S3,将您自己的 Amazon S3 存储桶指定为存储位置。然后,输入 Amazon S3 URI。

    3. (可选)对于加密密钥,指定用于加密存储在指定位置的 Canvas 构件的 KMS 密钥。

  2. (可选)对于 Canvas R eady-to-use 模型配置,请执行以下操作:

    1. 让 “启用 Canvas R eady-to-use 模型” 选项保持开启状态,让您的用户能够在 Canvas 中使用 R eady-to-use 模型生成预测(默认情况下处于开启状态)。此选项还允许您与生成式人工智能支持的模型聊天。有关更多信息,请参阅 在根基模型中使用生成式人工智能

    2. 打开启用使用 Amazon Kendra 查询文档选项,让用户有权限使用根基模型查询存储在 Amazon Kendra 索引中的文档。然后,从下拉菜单中选择要授予访问权限的现有索引。有关更多信息,请参阅 在根基模型中使用生成式人工智能

    3. 对于 Amazon Bedrock 角色,选择创建并使用新的执行角色来创建与 Amazon Bedrock 有信任关系的新 IAM 执行角色。这个 IAM 角色由 Amazon Bedrock 担任,负责在 Canvas 中微调大型语言模型 (LLM)。如果您已经有一个具有信任关系的执行角色,请选择 “使用现有的执行角色”,然后从下拉列表中选择您的角色。有关为自己的执行角色手动配置权限的更多信息,请参阅向用户授予微调基础模型的权限

  3. (可选)对于 ML Ops 权限配置部分,执行以下操作:

    1. 让 “启用直接部署画布模型” 选项保持开启状态,您的用户可以将其模型从 Canvas 部署到 SageMaker 端点。有关 Canvas 中模型部署的更多信息,请参阅 将模型部署到端点

    2. 保持 “为所有用户启用模型注册权限” 选项处于开启状态,以授予您的用户将其模型版本注册到 SageMaker 模型注册表的权限(默认情况下处于开启状态)。有关更多信息,请参阅 在模型注册表中注册 SageMaker 模型版本

    3. 如果您将 “为所有用户启用模型注册权限” 选项保持开启状态,请选择 “仅注册到模型注册表” 或 “在模型注册表中注册并批准模型”。

  4. (可选)在 “本地文件上传配置” 部分,打开 “启用本地文件上传” 选项,授予用户从本地计算机将文件上传到 Canvas 的权限。启用此选项会将跨源资源共享 (CORS) 策略附加到 C anvas 存储配置中指定的 Amazon S3 存储桶(并覆盖任何现有的 CORS 策略)。要了解有关本地文件上传权限的更多信息,请参阅授予用户上传本地文件的权限

  5. (可选)对于 OAuth 设置部分,请执行以下操作:

    1. 选择添加 OAuth 配置。

    2. 数据源中,选择您的数据源。

    3. 在 S ecret 设置中,选择 “创建新密钥”,然后输入您从身份提供商那里获得的信息。如果您尚未对数据源进行初始 OAuth 设置,请参阅。使用 OAuth 设置与数据来源的连接

  6. (可选)对于时间序列预测配置,请将启用时间序列预测选项保持开启状态,以便您的用户有权在 SageMaker Canvas 中进行时间序列预测(默认情况下处于开启状态)。

    1. 如果您将 “启用时间序列预测” 设置为开启状态,请选择 “创建并使用新的执行角色”,或者如果您已经拥有一个附加了所需的 Amazon Forecast 权限的 IAM 角色,则选择 “使用现有执行角色”(有关更多信息,请参阅 IAM 角色设置方法)。

  7. Amazon 的自定义设置 SageMaker按照步骤完成其余域设置的配置。

注意

如果您在通过控制台授予权限(例如 R eady-to-use 模型的权限)时遇到任何问题,请参阅主题解决通过 SageMaker 控制台授予权限的问题

现在,您应该已经设置了 SageMaker 域并配置了所有 Canvas 权限。

在初始域名设置完成后,您可以编辑域名或特定用户的 Canvas 权限。个人用户设置会覆盖域设置。要了解如何在域名设置中查看或编辑您的 Canvas 权限,请参阅查看和编辑域名

授予自己使用 Canvas 中特定功能的权限

以下信息概述了您可以向 Canvas 用户授予的各种权限,以允许他们使用 Canvas 中的各种特性和功能。其中一些权限可以在域设置期间授予,但有些则需要额外的权限或配置。请参阅您要启用的每项功能的特定权限信息:

  • 本地文件上传。设置域名时,默认情况下,Canvas 基本权限中的本地文件上传权限处于开启状态。如果您无法将本地文件从计算机上传到 C SageMaker anvas,则可以将 CORS 策略附加到您在 Canvas 存储配置中指定的 Amazon S3 存储桶。如果您 SageMaker 允许使用默认存储桶,则存储桶将遵循命名模式s3://sagemaker-{Region}-{your-account-id}。有关更多信息,请参阅向用户授予上传本地文件的权限

  • 自定义图像和文本预测模型。在设置网域时,Canvas 基本权限中默认开启了构建自定义图像和文本预测模型的权限。但是,如果您有自定义 IAM 配置并且不想将AmazonSageMakerCanvasFullAccess策略附加到用户的 IAM 执行角色,则必须明确向您的用户授予必要的权限。有关更多信息,请参阅 授予用户构建自定义图像和文本预测模型的权限

  • R eady-to-use 模型和基础模型。您可能需要使用 Canvas R eady-to-use 模型来预测您的数据。使用 R eady-to-use 模型权限,您还可以与生成式 AI 驱动的模型聊天。设置域名时,权限默认处于开启状态,或者您可以编辑已创建的域的权限。Canvas R eady-to-use 模型权限选项将 AmazonSageMakerCanvasAI ServicesAccess 策略添加到您的执行角色中。有关更多信息,请参阅 R eady-to-use 模型文档的开始使用部分。

    有关开始使用生成式人工智能根基模型的更多信息,请参阅 在根基模型中使用生成式人工智能

  • 微调基础模型。如果你想在 Canvas 中微调基础模型,可以在设置域名时添加权限,也可以在创建域名后编辑域名或用户个人资料的权限。您必须将 A AmazonSageMakerCanvasI ServicesAccess 策略添加到您在设置用户个人资料时选择的 Amazon IAM 角色中,还必须向该角色添加与 Amazon Bedrock 的信任关系。有关如何将这些权限添加到您的 IAM 角色的说明,请参阅向用户授予微调基础模型的权限

  • 时间序列预测。如果您想对时间序列数据进行预测,可以在设置域名时添加时间序列预测权限,也可以在创建域名后编辑域名或用户个人资料的权限。所需的权限是AmazonSageMakerCanvasForecastAccess托管策略以及您在设置用户资料时选择的 Amazon IAM 角色与 Amazon Forecast 的信任关系。有关如何将这些权限添加到 IAM 角色的说明,请参阅向用户授予执行时序预测的权限

  • 向 Amazon 发送批量预测 QuickSight。您可能需要将批量预测或根据自定义模型生成的预测数据集发送到 Amazon QuickSight 进行分析。在中 QuickSight,您可以构建和发布包含预测结果的预测仪表板。有关如何将这些权限添加到您的 Canvas 用户的 IAM 角色的说明,请参阅向您的用户授予向 Amazon 发送预测的权限 QuickSight

  • 将 Canvas 模型部署到 SageMaker 端点。 SageMaker托管提供了终端节点,您可以使用这些端点来部署模型以用于生产。您可以将在 Canvas 中构建的模型部署到 SageMaker 端点,然后在生产环境中以编程方式进行预测。有关更多信息,请参阅 将模型部署到端点

  • 将模型版本注册到模型注册表。您可能需要将模型的版本注册到SageMaker 模型注册表,该注册表是一个用于跟踪模型更新版本状态的存储库。在 SageMaker 模型注册表中工作的数据科学家或 MLOPs 团队可以查看您构建的模型版本,并批准或拒绝这些版本。然后,他们可以将您的模型版本部署到生产环境或启动自动化工作流。默认情况下,您的域名的模型注册权限处于开启状态。您可以在用户配置文件级别管理权限,并授予或删除特定用户的权限。有关更多信息,请参阅 在模型注册表中注册 SageMaker 模型版本

  • 与数据科学家协作。如果您想与 Studio Classic 用户协作并共享模型,则必须为在设置用户个人资料时选择的 Amazon IAM 角色添加其他权限。有关如何向角色添加策略的说明,请参阅向用户授予与 Studio Classic 合作的权限

  • 从 Amazon Redshift 导入数据。如果您想从 Amazon Redshift 导入数据,则必须授予自己额外的权限。您必须将AmazonRedshiftFullAccess托管策略添加到您在设置用户配置文件时选择的 Amazon IAM 角色中。有关如何向角色添加策略的说明,请参阅向用户授予导入 Amazon Redshift 数据的权限

注意

访问权限和政策中包含AmazonSageMakerFull通过其他数据源(例如 Amazon Athena 和 SaaS 平台)进行导入所需的权限。AmazonSageMakerCanvasFullAccess如果您按照标准设置说明进行操作,则这些策略应该已经附加到执行角色。有关这些数据来源及其权限的更多信息,请参阅 连接到数据来源

第 1 步:登录 SageMaker 画布

初始设置完成后,您可以使用以下任何一种方法访问 SageMaker Canvas,具体取决于您的用例:

  • SageMaker 控制台中,选择左侧导航窗格中的画布。然后,在 Canvas 页面上,从下拉列表中选择您的用户并启动 Canvas 应用程序。

  • 打开 SageMaker Studio,然后在 Studio 界面中,转到画布页面并启动 Canvas 应用程序。

  • 使用贵组织基于 SAML 2.0 的 SSO 方法,例如 Okta 或 IAM 身份中心。

当你首次登录 SageMaker Canvas 时, SageMaker 会为你创建应用程序和 SageMaker 空间。Canvas 应用程序的数据存储在空间中。要了解有关空间的更多信息,请参阅使用共享空间进行协作。该空间由用户配置文件的应用程序和用于存放所有应用程序数据的共享目录组成。如果您不想使用由创建的默认空间 SageMaker ,而是希望创建自己的空间来存储应用程序数据,请参阅页面将 SageMaker Canvas 应用程序数据存储在您自己的 SageMaker空间中

第 2 步:使用 SageMaker Canvas 获取预测

登录 Canvas 后,您就可以开始构建模型并生成数据预测。

您可以使用 Canvas R eady-to-use 模型在不构建模型的情况下进行预测,也可以针对您的特定业务问题构建自定义模型。查看以下信息,确定 R eady-to-use 模型还是自定义模型最适合您的用例。

  • R eady-to-use 模型。借助 R eady-to-use 模型,您可以使用预先构建的模型从数据中提取见解。R eady-to-use 模型涵盖了各种用例,例如语言检测和文档分析。要开始使用 R eady-to-use 模型进行预测,请参阅使用 R eady-to-use 模型

  • 自定义模型。使用自定义模型,您可以构建各种模型类型,这些模型类型经过自定义,可以对数据进行预测。如果您想构建基于业务特定数据训练的模型,并且想要使用诸如与数据科学家合作评估模型性能之类的功能,请使用自定义模型。要开始构建自定义模型,请参阅 使用自定义模型

您也可以从其他功能中带上自己的模型 (BYOM)。 SageMakerAmazon SageMaker Studio 用户可以与 Canvas 用户共享他们的模型,Canvas 用户可以使用模型生成预测。要了解更多信息,请参阅将自己的模型带到 SageMaker Canvas