Amazon SageMaker 域
Amazon SageMaker 域支持 SageMaker 机器学习 (ML) 环境。SageMaker 域由以下实体组成。有关创建域的加入步骤,请参阅加入 Amazon SageMaker 域。
-
域:Amazon SageMaker 域由关联的 Amazon Elastic File System (Amazon EFS) 卷、授权用户列表以及各种安全、应用程序、策略和 Amazon Virtual Private Cloud (Amazon VPC) 配置组成。域中的用户可以彼此共享笔记本文件和其他构件。一个账户可以有多个域。有关多个域的更多信息,请参阅多个域概述。
-
UserProfile:一个用户配置文件代表域中的一个用户。这是引用用户以实现共享、报告和其他面向用户的特征的主要方式。此实体是在用户加入 Amazon SageMaker 域时创建。有关配置文件的更多信息,请参阅域用户配置文件。
-
共享空间:共享空间由共享的 JupyterServer 应用程序和共享目录组成。域中的所有用户都可以访问共享空间。域中的所有用户配置文件都可以访问该域中的所有共享空间。有关共享空间的更多信息,请参阅使用共享空间进行协作。
-
应用程序:应用程序表示支持用户笔记本电脑、终端和控制台的阅读和执行体验的应用程序。应用程序的类型可以是 JupyterServer、KernelGateway、RStudioServerPro 或 RSession。用户可能同时激活多个应用程序。
下列各表描述了 Domain
、UserProfile
、shared space
和 App
实体的状态值。在适用情况下,它们还提供了问题排查步骤。
域状态值 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
值 | 描述 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pending | 正在创建域。 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
InService | 成功创建域。 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Updating | 正在更新域。 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Deleting | 正在删除域。 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Failed | 域创建失败。调用 DescribeDomain API 以查看域创建失败的原因。修复 FailureReason 中提到的错误后,删除失败的域并重新创建该域。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Update_Failed | 域更新失败。调用 DescribeDomain API 以查看域更新失败的原因。修复 FailureReason 中提到的错误后,调用 UpdateDomain API。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Delete_Failed | 域删除失败。调用 DescribeDomain API 以查看域删除失败的原因。由于删除失败,可能有一些资源仍在运行,但您无法使用或更新域。修复 FailureReason 中提到的错误后,再次调用 DeleteDomain API。 |
UserProfile 状态值 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
值 | 描述 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pending | 正在创建 UserProfile 。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
InService | 成功创建 UserProfile 。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Updating | 正在进行更新 UserProfile 。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Deleting | 正在删除 UserProfile . |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Failed | UserProfile 创建失败。调用 DescribeUserProfile API 以查看 UserProfile 创建失败的原因。修复 FailureReason 中提到的错误后,删除失败的 UserProfile 并重新创建它。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Update_Failed | UserProfile 更新失败。调用 DescribeUserProfile API 以查看 UserProfile 更新失败的原因。修复 FailureReason 中提到的错误后,再次调用 UpdateUserProfile API。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Delete_Failed | UserProfile 删除失败。调用 DescribeUserProfile API 以查看 UserProfile 删除失败的原因。由于删除失败,可能有一些资源仍在运行,但您无法使用或更新 UserProfile 。修复 FailureReason 中提到的错误后,再次调用 DeleteUserProfile API。 |
共享空间状态值 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
值 | 描述 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pending | 正在创建共享空间。 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
InService | 成功创建共享空间。 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Deleting | 正在删除共享空间。 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Failed | 共享空间创建失败。调用 DescribeSpace API 以查看共享空间创建失败的原因。修复 FailureReason 中提到的错误后,删除失败的共享空间并重新创建它。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Update_Failed | 共享空间更新失败。调用 DescribeSpace API 以查看共享空间更新失败的原因。修复 FailureReason 中提到的错误后,再次调用 UpdateSpace API。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Delete_Failed | 共享空间删除失败。调用 DescribeSpace API 以查看共享空间删除失败的原因。由于删除失败,可能有一些资源仍在运行,但您无法使用或更新共享空间。修复 FailureReason 中提到的错误后,再次调用 DeleteSpace API。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Deleted | 成功删除共享空间。 |
App 状态值 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
值 | 描述 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pending | 正在创建 App 。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
InService | 成功创建 App 。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Deleting | 正在删除 App 。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Failed | App 创建失败。调用 DescribeApp API 以查看 App 创建失败的原因。修复 FailureReason 中提到的错误后,再次调用 CreateApp API。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Deleted | 成功删除 App 。 |
应用程序维护
SageMaker 至少每 90 天对 Amazon SageMaker Studio JupyterServer 和 KernelGateway、SageMaker Canvas 和 Amazon SageMaker Data Wrangler 应用程序的底层软件进行一次安全和性能更新。某些维护项目(如操作系统升级)要求 SageMaker 在维护时段内让您的应用程序短时间离线。由于此维护会使应用程序离线,因此在更新底层软件期间不能执行任何操作。当维护活动正在进行时,应用程序的状态将从 InService 变为 Pending。维护完成后,应用程序的状态将恢复为 InService。如果修补失败,则应用程序的状态将变为 Failed。如果应用程序处于 Failed 状态,我们建议创建相同类型的新应用程序。有关创建 Studio 应用程序的信息,请参阅关闭并更新 SageMaker Studio 和 Studio 应用程序。有关创建 SageMaker Canvas 应用程序的信息,请参阅管理应用程序。
有关更多信息,请联系 https://aws.amazon.com/premiumsupport/。