集群问题排查 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

集群问题排查

Amazon EMR 托管集群的运行生态系统十分复杂,包括几种类型的开源软件、自定义应用程序代码和 Amazon Web Services。这些部分中任何地方出现问题,都会导致集群失败,延长预计的完成时间。以下主题将帮助您弄明白集群中发生了什么故障,并提供相关的修复建议。

在开发新的 Hadoop 应用程序时,我们建议您启用调试并处理一小部分但具有代表性的数据子集以测试应用程序。您可能还希望逐步运行应用程序以分别测试每个步骤。有关更多信息,请参阅配置集群日志记录和调试步骤 5:分步测试集群