什么是 Amazon EMR on EKS? - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

什么是 Amazon EMR on EKS?

Amazon EMR on EKS 为 Amazon EMR 提供了部署选项,可让您在 Amazon Elastic Kubernetes Service(Amazon EKS)上运行开源大数据框架。借助此部署选项,您可以专注于运行分析工作负载,同时 Amazon EMR on EKS 为开源应用程序构建、配置和管理容器。

如果您已经使用 Amazon EMR,您现在可以在同一 Amazon EKS 集群上使用其它类型的应用程序来运行基于 Amazon EMR 的应用程序。此部署选项还提高了资源利用率,并简化了跨多个可用区的基础设施管理。如果您已在 Amazon EKS 上运行大数据框架,您现在可以使用 Amazon EMR 自动调配和管理,并更快地运行 Apache Spark。

Amazon EMR on EKS 可让您的团队更加高效地协作,并以更轻松、经济实惠的方式来处理海量数据:

  • 您可以在公共资源池上运行应用程序,而无需预置基础设施。您可以使用 Amazon EMR Studio 和 Amazon SDK 或 Amazon CLI 来开发、提交及诊断在 EKS 集群上运行的分析应用程序。您可以使用自行托管式 Apache Airflow 或 Amazon Managed Workflows for Apache Airflow(MWAA),在 Amazon EMR on EKS 上运行计划任务。

  • 基础设施团队可以集中管理通用计算平台,将 Amazon EMR 工作负载与其它基于容器的应用程序整合起来。您可以使用常用 Amazon EKS 工具简化基础设施管理,并利用共享集群来处理需要不同版本开源框架的工作负载。您还可以通过自动化 Kubernetes 集群管理和操作系统修补来减少运营开销。使用 Amazon EC2 和 Amazon Fargate,您可以启用多个计算资源来满足性能、运营或财务方面的要求。

下图展示了 Amazon EMR 的两种不同的部署模型。


   Amazon EMR 部署选项