开始使用 Amazon C SageMaker anvas - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

开始使用 Amazon C SageMaker anvas

本指南告诉你如何开始使用 SageMaker Canvas。如果您是 IT 管理员并想了解更多详细信息,请参阅设置和管理 Amazon SageMaker Canvas(面向 IT 管理员)为用户设置 SageMaker Canvas。

设置 Amazon C SageMaker anvas 的先决条件

要设置 SageMaker Canvas 应用程序,您必须先登录亚马逊 SageMaker 域,该域支持各种机器学习 (ML) 环境,例如 Canvas 和 SageMaker Studio

以下部分介绍如何设置亚马逊 SageMaker 域名并向自己授予 Canvas 权限。

重要

要设置亚马逊 SageMaker Canvas,您的亚马逊 SageMaker Studio 版本必须为 3.19.0 或更高版本。有关更新 Amazon SageMaker Studio 的信息,请参阅关闭并更新 SageMaker Studio 经典版

加入域名

要设置您的域名,请先参阅Amazon SageMaker 域名概述以了解有关域名的更多信息。

然后,当您准备好设置域名时,请选择以下设置方法之一:

  1. (快速)快速设置到 Amazon SageMaker— 如果您想快速设置域名,请选择此选项。这会为您的用户授予所有默认 Canvas 权限和基本功能。管理员可以稍后启用任何其他功能,例如文档查询。如果您想配置更精细的权限,我们建议您选择选项 2 或 3。

  2. (高级)Amazon 的自定义设置 SageMaker— 如果您想完成更高级的域名设置,请选择此选项。

如果您正在进行快速设置(前面列表中的选项 1),则可以跳过本节的其余部分,继续前进第 1 步:登录 SageMaker 画布

如果您正在进行高级设置(选项 2 或 3),则可以指定要向用户授予访问权限的 Canvas 功能。在完成高级域设置时,请使用本节的其余部分来帮助您配置特定于 Canvas 的权限。

Amazon 的自定义设置 SageMaker设置说明中,对于步骤 2:用户和机器学习活动,您必须选择要授予的 Canvas 权限。在机器学习活动部分,您可以选择以下权限策略来授予对 Canvas 功能的访问权限。设置域名时,您最多只能选择 8 个 ML 活动。使用Canvas需要以下列表中的前两个权限,其余权限用于其他功能。

  • 运行 Studio 应用程序 — 这些权限是启动 Canvas 应用程序所必需的。

  • Canvas Core Access — 这些权限允许您访问 Canvas 应用程序和 Canvas 的基本功能,例如创建数据集、使用基本数据转换以及构建和分析模型。

  • (可选)Canvas 数据准备(由 Data Wrangler 提供支持)— 这些权限授予您创建数据流和使用高级转换在 Canvas 中准备数据的权限。这些权限也是创建数据处理任务和数据准备作业计划所必需的。

  • (可选)Canvas AI 服务 — 这些权限允许您访问 Canvas 中的 R eady-to-use 模型、基础模型和 “与数据聊天” 功能。

  • (可选)Kendra 访问权限 — 此权限允许您访问文档查询功能,在该功能中,您可以使用 Canvas 中的基础模型查询存储在 Amazon Kendra 索引中的文档。

    如果您选择此选项,则在 Canvas Kendra Access 部分,输入您要授予访问权限的亚马逊 Kendra 索引的 ID。

  • (可选)Canvas MLOP — 此权限允许您访问 Canvas 中的模型部署功能,您可以在其中部署模型以用于生产。

在域设置的 “步骤 3:应用程序” 部分,选择 “配置画布”,然后执行以下操作:

  1. 对于 Canvas 存储配置,请指定您希望 Canvas 存储应用程序数据的位置,例如模型构件、批量预测、数据集和日志。 SageMaker 在此存储桶内创建一个用于存储数据的Canvas/文件夹。有关更多信息,请参阅 配置 Amazon S3 存储。请在本节中执行以下操作:

    1. 如果您要将位置设置为遵循该模式s3://sagemaker-{Region}-{your-account-id}的默认 SageMaker创建存储桶,请选择系统托管

    2. 选择自定义 S3,将您自己的 Amazon S3 存储桶指定为存储位置。然后,输入 Amazon S3 URI。

    3. (可选)对于加密密钥,指定用于加密存储在指定位置的 Canvas 构件的 KMS 密钥。

  2. (可选)对于 Canvas R eady-to-use 模型配置,请执行以下操作:

    1. 让 “启用 Canvas R eady-to-use 模型” 选项保持开启状态,让您的用户能够在 Canvas 中使用 R eady-to-use 模型生成预测(默认情况下处于开启状态)。此选项还允许您与生成式人工智能支持的模型聊天。有关更多信息,请参阅 在根基模型中使用生成式人工智能

    2. 打开启用使用 Amazon Kendra 查询文档选项,让用户有权限使用根基模型查询存储在 Amazon Kendra 索引中的文档。然后,从下拉菜单中选择要授予访问权限的现有索引。有关更多信息,请参阅 在根基模型中使用生成式人工智能

    3. 对于 Amazon Bedrock 角色,选择创建并使用新的执行角色来创建与 Amazon Bedrock 有信任关系的新 IAM 执行角色。这个 IAM 角色由 Amazon Bedrock 担任,负责在 Canvas 中微调大型语言模型 (LLM)。如果您已经有一个具有信任关系的执行角色,请选择 “使用现有的执行角色”,然后从下拉列表中选择您的角色。有关为自己的执行角色手动配置权限的更多信息,请参阅向用户授予微调基础模型的权限

  3. (可选)对于 ML Ops 权限配置部分,执行以下操作:

    1. 让 “启用直接部署画布模型” 选项保持开启状态,您的用户可以将其模型从 Canvas 部署到 SageMaker 端点。有关 Canvas 中模型部署的更多信息,请参阅 将模型部署到端点

    2. 保持 “为所有用户启用模型注册权限” 选项处于开启状态,以授予您的用户将其模型版本注册到 SageMaker 模型注册表的权限(默认情况下处于开启状态)。有关更多信息,请参阅 在模型注册表中注册 SageMaker 模型版本

    3. 如果您将 “为所有用户启用模型注册权限” 选项保持开启状态,请选择 “仅注册到模型注册表” 或 “在模型注册表中注册并批准模型”。

  4. (可选)在 “本地文件上传配置” 部分,打开 “启用本地文件上传” 选项,授予用户从本地计算机将文件上传到 Canvas 的权限。启用此选项会将跨源资源共享 (CORS) 策略附加到 C anvas 存储配置中指定的 Amazon S3 存储桶(并覆盖任何现有的 CORS 策略)。要了解有关本地文件上传权限的更多信息,请参阅授予用户上传本地文件的权限

  5. (可选)对于 OAuth 设置部分,请执行以下操作:

    1. 选择添加 OAuth 配置。

    2. 数据源中,选择您的数据源。

    3. 在 S ecret 设置中,选择创建新密钥并输入您从身份提供商那里获得的信息。如果您尚未对数据源进行初始 OAuth 设置,请参阅。使用 OAuth 设置与数据来源的连接

  6. (可选)对于时间序列预测配置,请将启用时间序列预测选项保持开启状态,以便您的用户有权在 SageMaker Canvas 中进行时间序列预测(默认情况下处于开启状态)。

    1. 如果您将 “启用时间序列预测” 设置为开启状态,请选择 “创建并使用新的执行角色”,或者如果您已经拥有一个附加了所需的 Amazon Forecast 权限的 IAM 角色,则选择 “使用现有执行角色”(有关更多信息,请参阅 IAM 角色设置方法)。

  7. Amazon 的自定义设置 SageMaker按照步骤完成其余域设置的配置。

注意

如果您在通过控制台授予权限(例如 R eady-to-use 模型的权限)时遇到任何问题,请参阅主题解决通过 SageMaker 控制台授予权限的问题

现在,您应该已经设置了 SageMaker 域并配置了所有 Canvas 权限。

在初始域名设置完成后,您可以编辑域名或特定用户的 Canvas 权限。个人用户设置会覆盖域设置。要了解如何在域名设置中查看或编辑您的 Canvas 权限,请参阅查看和编辑域名

授予自己使用 Canvas 中特定功能的权限

以下信息概述了您可以向 Canvas 用户授予的各种权限,以允许他们使用 Canvas 中的各种特性和功能。其中一些权限可以在域设置期间授予,但有些则需要额外的权限或配置。请参阅您要启用的每项功能的特定权限信息:

  • 本地文件上传。设置域名时,默认情况下,Canvas 基本权限中的本地文件上传权限处于开启状态。如果您无法将本地文件从计算机上传到 C SageMaker anvas,则可以将 CORS 策略附加到您在 Canvas 存储配置中指定的 Amazon S3 存储桶。如果您 SageMaker 允许使用默认存储桶,则存储桶将遵循命名模式s3://sagemaker-{Region}-{your-account-id}。有关更多信息,请参阅向用户授予上传本地文件的权限

  • 自定义图像和文本预测模型。在设置域名时,Canvas 基本权限中默认开启了构建自定义图像和文本预测模型的权限。但是,如果您有自定义 IAM 配置并且不想将AmazonSageMakerCanvasFullAccess策略附加到用户的 IAM 执行角色,则必须明确向您的用户授予必要的权限。有关更多信息,请参阅 授予用户构建自定义图像和文本预测模型的权限

  • R eady-to-use 模型和基础模型。您可能需要使用 Canvas R eady-to-use 模型来预测您的数据。使用 R eady-to-use 模型权限,您还可以与生成式 AI 驱动的模型聊天。设置域名时,权限默认处于开启状态,或者您可以编辑已创建的域的权限。Canvas R eady-to-use 模型权限选项将 AmazonSageMakerCanvasAI ServicesAccess 策略添加到您的执行角色中。有关更多信息,请参阅 R eady-to-use 模型文档的开始使用部分。

    有关开始使用生成式人工智能根基模型的更多信息,请参阅 在根基模型中使用生成式人工智能

  • 微调基础模型。如果你想在 Canvas 中微调基础模型,可以在设置域名时添加权限,也可以在创建域名后编辑域名或用户个人资料的权限。您必须将 A AmazonSageMakerCanvasI ServicesAccess 策略添加到您在设置用户个人资料时选择的 Amazon IAM 角色中,还必须向该角色添加与 Amazon Bedrock 的信任关系。有关如何将这些权限添加到您的 IAM 角色的说明,请参阅向用户授予微调基础模型的权限

  • 时间序列预测。如果您想对时间序列数据进行预测,可以在设置域名时添加时间序列预测权限,也可以在创建域名后编辑域名或用户个人资料的权限。所需的权限是AmazonSageMakerCanvasForecastAccess托管策略以及您在设置用户资料时选择的 Amazon IAM 角色与 Amazon Forecast 的信任关系。有关如何将这些权限添加到 IAM 角色的说明,请参阅向用户授予执行时序预测的权限

  • 向 Amazon 发送批量预测 QuickSight。您可能需要将批量预测或根据自定义模型生成的预测数据集发送到 Amazon QuickSight 进行分析。在中 QuickSight,您可以构建和发布包含预测结果的预测仪表板。有关如何将这些权限添加到您的 Canvas 用户的 IAM 角色的说明,请参阅向您的用户授予向 Amazon 发送预测的权限 QuickSight

  • 将 Canvas 模型部署到 SageMaker 端点。 SageMaker托管提供了终端节点,您可以使用这些端点来部署模型以用于生产。您可以将在 Canvas 中构建的模型部署到 SageMaker 端点,然后在生产环境中以编程方式进行预测。有关更多信息,请参阅 将模型部署到端点

  • 将模型版本注册到模型注册表。您可能需要将模型的版本注册到SageMaker 模型注册表,该注册表是一个用于跟踪模型更新版本状态的存储库。在 SageMaker 模型注册表中工作的数据科学家或 MLOPs 团队可以查看您构建的模型版本,并批准或拒绝这些版本。然后,他们可以将您的模型版本部署到生产环境或启动自动化工作流。默认情况下,您的域名的模型注册权限处于开启状态。您可以在用户配置文件级别管理权限,并授予或删除特定用户的权限。有关更多信息,请参阅 在模型注册表中注册 SageMaker 模型版本

  • 与数据科学家协作。如果您想与 Studio Classic 用户协作并共享模型,则必须为在设置用户个人资料时选择的 Amazon IAM 角色添加其他权限。有关如何向角色添加策略的说明,请参阅向用户授予与 Studio Classic 合作的权限

  • 从 Amazon Redshift 导入数据。如果您想从 Amazon Redshift 导入数据,则必须授予自己额外的权限。您必须将AmazonRedshiftFullAccess托管策略添加到您在设置用户配置文件时选择的 Amazon IAM 角色中。有关如何向角色添加策略的说明,请参阅向用户授予导入 Amazon Redshift 数据的权限

注意

和政策中包含AmazonSageMakerFullAccess通过其他数据源(例如 Amazon Athena 和 SaaS 平台)进行导入所需的权限。AmazonSageMakerCanvasFullAccess如果您按照标准设置说明进行操作,则这些策略应该已经附加到执行角色。有关这些数据来源及其权限的更多信息,请参阅 连接到数据来源

第 1 步:登录 SageMaker 画布

初始设置完成后,您可以使用以下任何一种方法访问 SageMaker Canvas,具体取决于您的用例:

  • SageMaker 控制台中,选择左侧导航窗格中的画布。然后,在 Canvas 页面上,从下拉列表中选择您的用户并启动 Canvas 应用程序。

  • 打开 SageMaker Studio,然后在 Studio 界面中,转到画布页面并启动 Canvas 应用程序。

  • 使用贵组织基于 SAML 2.0 的 SSO 方法,例如 Okta 或 IAM 身份中心。

首次登录 SageMaker Canvas 时,会有一条欢迎消息,其中包含快速链接,可帮助您开始使用 Canvas 的主要功能。

C SageMaker anvas 应用程序中包含入门链接的欢迎消息的屏幕截图。

如果您关闭此消息,则可以随时通过选择应用程序左侧导航窗格中的 “帮助” 按钮来重新访问该消息。

第 2 步:使用 SageMaker Canvas 获取预测

登录 Canvas 后,您就可以开始构建模型并生成数据预测。

您可以使用 Canvas R eady-to-use 模型在不构建模型的情况下进行预测,也可以针对您的特定业务问题构建自定义模型。查看以下信息,确定 R eady-to-use 模型还是自定义模型最适合您的用例。

  • R eady-to-use 模型。借助 R eady-to-use 模型,您可以使用预先构建的模型从数据中提取见解。R eady-to-use 模型涵盖了各种用例,例如语言检测和文档分析。要开始使用 R eady-to-use 模型进行预测,请参阅使用 R eady-to-use 模型

  • 自定义模型。使用自定义模型,您可以构建各种模型类型,这些模型类型经过自定义,可以对数据进行预测。如果您想构建基于业务特定数据训练的模型,并且想要使用诸如与数据科学家合作评估模型性能之类的功能,请使用自定义模型。要开始构建自定义模型,请参阅 使用自定义模型

您也可以从其他功能中带上自己的模型 (BYOM)。 SageMakerAmazon SageMaker Studio 用户可以与 Canvas 用户共享他们的模型,Canvas 用户可以使用模型生成预测。要了解更多信息,请参阅将自己的模型带到 SageMaker Canvas