开始使用 Amazon SageMaker 融通式合作开发工作室查询 S3 表类数据存储服务
Amazon SageMaker 融通式合作开发工作室是一项综合分析服务,可让您使用 SQL、自然语言和交互式笔记本查询数据并从中得出见解。它使用统一的界面,支持跨 Amazon 数据存储库和第三方来源的团队协作和分析工作流。SageMaker 融通式合作开发工作室直接与 S3 表类数据存储服务集成,在 Amazon S3 控制台中实现了从数据存储到分析的无缝过渡。
您可以通过 Amazon S3 控制台或 SageMaker 融通式合作开发工作室控制台,将 S3 表类数据存储服务与 SageMaker 融通式合作开发工作室集成。
要通过 SageMaker 融通式合作开发工作室控制台进行设置,请参阅 SageMaker 融通式合作开发工作室文档。
使用 SageMaker 融通式合作开发工作室查询 S3 表类数据存储服务的要求
将 SageMaker 融通式合作开发工作室与 S3 表类数据存储服务结合使用时,需要满足以下条件:
-
您的表存储桶已与当前区域的 Amazon 分析服务集成。有关更多信息,请参阅 将 S3 表类数据存储服务与 Amazon 分析服务集成。
-
您使用的 IAM 角色有权在 SageMaker 融通式合作开发工作室中创建和查看资源。有关更多信息,请参阅在 SageMaker 融通式合作开发工作室中设置基于 IAM 的域。
-
您有一个 SageMaker 域和项目。有关更多信息,请参阅《SageMaker 融通式合作开发工作室管理员指南》中的域,以及《SageMaker 融通式合作开发工作室用户指南》中的项目。
如果您尚未执行这些操作或创建这些资源,S3 表类数据存储服务可以自动为您完成此设置,这样您就可以开始使用 SageMaker 融通式合作开发工作室进行查询。
开始使用 SageMaker 融通式合作开发工作室查询 S3 表类数据存储服务
-
打开 Amazon S3 控制台,网址为 https://console.amazonaws.cn/s3/
。 -
在左侧导航窗格中,选择表存储桶。
-
在表存储桶页面上,选择包含要查询的表的存储桶。
-
在存储桶详细信息页面上,选择要查询的表。
-
选择 Query (查询)。
-
然后,选择在 SageMaker 融通式合作开发工作室中查询表。
-
如果您已经为表配置了 SageMaker 融通式合作开发工作室,此时 SageMaker 融通式合作开发工作室控制台会打开查询编辑器,其中包含为您加载的示例
SELECT查询。根据您的用例需要修改此查询。 -
如果您还没有为 S3 表类数据存储服务配置 SageMaker 融通式合作开发工作室,则会显示一个设置页面,其中提供了一个步骤用来启用与 Amazon 分析服务的集成,这会将您的表与 SageMaker 融通式合作开发工作室等服务集成。此步骤自动执行,然后您将被重定向到 SageMaker 融通式合作开发工作室控制台中的页面,其中提供以下选项来配置您的账户以查询 S3 表类数据存储服务:
-
在将您设置为管理员中,选择了您当前的联合身份验证 IAM 角色。如果您当前的角色还没有所需的权限,则需要在 SageMaker 融通式合作开发工作室中设置基于 IAM 的域并为您的角色分配权限,这样您才能登录 SageMaker 融通式合作开发工作室。
-
在项目数据和管理控制中,选择自动创建具有所需权限的新角色以自动创建具有所需权限的角色,或者选择使用现有角色并选择角色。如果选择的角色还没有所需的权限,则需要在 SageMaker 融通式合作开发工作室中设置基于 IAM 的域并向管理员执行角色分配权限,这样您才能访问 SageMaker 融通式合作开发工作室中的数据。
-
在数据加密中,选择使用 Amazon 拥有的密钥可让 Amazon 为您负责和管理密钥,或者选择选择其他 Amazon Amazon KMS 密钥(高级)以使用现有密钥或创建新密钥。
-
选择设置 SageMaker 融通式合作开发工作室。
-
接下来,SageMaker 融通式合作开发工作室控制台会打开查询编辑器,其中包含为您加载的示例
SELECT查询。根据您的用例需要修改此查询。在查询编辑器中,目录字段中应填充
s3tablescatalog/,后跟表存储桶的名称,例如s3tablescatalog/amzn-s3-demo-table-bucket。数据库字段中应填充存储您的表的命名空间。
-
-