Amazon EMR Studio - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

Amazon EMR Studio

Amazon EMR Studio 是一个基于 Web 的集成开发环境 (IDE),适用于依托 Amazon EMR 集群运行的完全托管式 Jupyter 笔记本。您可以为团队设置 Amazon EMR Studio,以开发、可视化和调试用 R、Python、Scala 和 PySpark 编写的应用程序。以 Amazon EMR Studio 集成 Amazon Identity and Access Management(IAM) 和 Amazon Web Services SSO,以便用户使用其公司凭证登录。

您可以免费创建 EMR Studio。当您使用 EMR Studio 时,需为 Amazon S3 存储和 Amazon EMR 集群支付相应的费用。有关产品详细信息和亮点,请参阅 Amazon EMR Studio 服务页面。

EMR Studio 主要功能

Amazon EMR Studio 提供以下功能:

  • 凭借 Amazon Identity and Access Management(IAM) 或 Amazon Web Services Single Sign On(Amazon Web Services SSO) 与贵企业的身份供应商进行用户的身份验证。

  • 按需访问并启动 Amazon EMR 集群以运行 Jupyter 笔记本任务。

  • 连接到 Amazon EMR on EKS 集群以在任务运行时提交工作。

  • 浏览并保存示例笔记本。有关示例笔记本的更多信息,请参阅 EMR Studio 笔记本示例 GitHub 存储库

  • 使用 Python、PySpark、Spark Scala、Spark R 或 SparkSQL 分析数据,并安装自定义内核和库。

  • 使用编排工具(例如 Apache Airflow 或 Amazon Managed Workflows for Apache Airflow)将参数化笔记本作为计划工作流的一部分运行。有关更多信息,请参阅Amazon大数据博客中的 Orchestrating analytics jobs on EMR Notebooks using MWAA

  • 使用 GitHub 和 BitBucket 等代码存储库与同行协作。

  • 使用 Spark 历史记录服务器、Tez UI 或 YARN 时间线服务器跟踪和调试任务。

EMR Studio 也符合 HIPAA 资格,并通过 HITRUST CSF 和 SOC 2 认证。有关 Amazon 服务 HIPAA 合规性的更多信息,请参阅http://www.amazonaws.cn/compliance/hipaa-compliance/。要了解有关 Amazon 服务 HITRUST CSF 合规性的更多信息,请参阅 http://www.amazonaws.cn/compliance/hitrust/。有关 Amazon 服务其他合规性计划的更多信息,请参阅 Amazon 合规性计划范围内的服务