Amazon EMR
管理指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

针对 Amazon EMR 使用默认的 Amazon Linux AMI

除非您指定自定义 AMI,否则每个 Amazon EMR 版本都会针对 Amazon EMR 使用默认的 Amazon Linux AMI。默认 AMI 基于发行 Amazon EMR 时最新的可用 Amazon Linux AMI。AMI 已使用大数据应用程序和该版本中附带的 Amazon EMR 功能针对兼容性进行测试。

每个 Amazon EMR 版本均“锁定”为 Amazon Linux AMI 版本以保持兼容性。这意味着,即使有更新版本的 Amazon Linux AMI 可用,系统也会针对 Amazon EMR 版本使用相同的 Amazon Linux AMI 版本。因此,我们建议您使用最新的 Amazon EMR 版本(当前为 5.28.0),除非您需要使用早期版本以确保兼容性且无法迁移。

如果您必须使用早期版本的 Amazon EMR 来确保兼容性,我们建议您使用系列中的最新版本。例如,如果您必须使用 5.12 系列,请使用 5.12.2,而不是 5.12.0 或 5.12.1。如果系列中有新版本可用,请考虑将您的应用程序迁移到新版本。

如何管理软件更新

当基于 Amazon EMR 的默认 Amazon Linux 的集群中的 Amazon EC2 实例首次启动时,它会检查 Amazon Linux 的已启用的软件包存储库以及适用于 AMI 版本的软件更新的 Amazon EMR。与其他 Amazon EC2 实例一样,这些存储库中的关键和重要安全更新会自动安装。有关更多信息,请参阅 Amazon EC2 用户指南(适用于 Linux 实例)中的软件包存储库。其他软件包和内核更新将不会安装,因为这可能会导致兼容性错误。

当您使用 SSH 连接到集群实例时,屏幕输出的前几行会提供一个链接,该链接指向实例使用的 Amazon Linux AMI 的发行说明、最新 Amazon Linux AMI 版本的通知、可供已启用存储库中的更新使用的软件包数量的通知,以及可用于运行 sudo yum update 的指令。

重要

我们强烈建议您不要在使用 SSH 或使用引导操作连接的同时,在集群实例上运行 sudo yum update。这可能会导致不兼容,因为所有软件包都是不加区分地安装的。

管理软件更新的最佳实践

  • 如果您使用早期版本的 Amazon EMR,请考虑对迁移到最新版本进行测试,然后再更新软件包。

  • 如果您迁移到更新的发行版或升级软件包,请首先在非生产环境中测试实施。使用 Amazon EMR 管理控制台克隆集群的选项对此大有帮助。

  • 逐个为您的应用程序和 Amazon Linux AMI 版本评估软件更新。仅在生产环境中测试和安装程序包,该生产环境是您确定安全状况、应用程序功能或性能时绝对需要的。

  • 请访问 Amazon Linux 安全中心以获取更新。

  • 避免通过使用 SSH 连接到单个集群实例来安装软件包。相反,根据需要使用引导操作来安装和更新所有集群实例上的软件包。这要求您终止并重新启动集群。有关更多信息,请参阅创建引导操作以安装其他软件

本页内容: