从 Studio 中 Connect 到 Amazon EMR 集群 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

从 Studio 中 Connect 到 Amazon EMR 集群

下一组说明将介绍如何从 Studio 连接到亚马逊 EMR 集群。

  1. 连接到 Studio 后,您可以打开现有 Studio 笔记本实例,也可以选择 “文件”,然后选择 “新建” 以创建新的笔记本实例。

  2. 打开 Studio 笔记本实例后,选择内核和实例。只有一部分内核支持连接到 Amazon EMR 集群。支持的图像包括:数据科学和闪光魔术。支持的内核包括来自闪光魔术图像的 PySpark 和数据科学图像的 Python3(IPython)。您将看到笔记本实例的右上角出现一个 Cluster 按钮。Select群集.

  3. AConnect 到群集UI 屏幕随即出现。选择一个群集,然后选择Connect (连接). 并非所有亚马逊 EMR 集群都可以连接到 Studio。有关详细信息,请参阅以下资源:工作室/亚马逊EMR 集成工作室亚马逊 EMR 集成博客文章.

    1. 连接到群集会将代码块添加到活动单元格以建立连接。

  4. 如果要连接的群集不使用 Kerberos 或 LDAP 连接,则系统将提示您选择凭据类型。您可以选择 HTTP 基本身份验证或无凭据。

  5. 活动单元格将填充连接到您之前选择的 Amazon EMR 集群所需的所有连接信息。

    1. 如果身份验证类型为 Kerberos 和 HTTP 基本身份验证,则将在活动单元格中创建一个小组件,您需要向集群提供凭据。输入您的用户名密码. 以下是一个屏幕截图,显示在输入这些凭据到集群后成功连接。

    2. 如果要连接到的群集不使用 Kerberos 或 LDAP,并且您选择了No credentials那么您将自动连接到 Amazon EMR 集群。以下是显示这一点的屏幕截图。

您可以更改 Studio 笔记本连接到的亚马逊 EMR 集群,方法是选择群集在笔记本的顶部。然后,只需浏览以查找要切换到的集群,然后单击连接到它。