选择一个Amazon区域
Amazon Web Services 在全球范围内的数据中心的服务器上运行。数据中心按地理区域进行管理。启动 Amazon EMR 集群时,必须指定区域。您可以选择一个区域,以便减少延迟、尽可能降低成本或满足法规要求。有关 Amazon EMR 支持的所有区域和端点的列表,请参阅《Amazon Web Services 一般参考》 中的 Regions and endpoints。
为了获得最佳性能,您应在与您的数据相同的区域启动集群。例如,如果存储您的输入数据的 Amazon S3 存储桶位于美国西部(俄勒冈州)区域,那么您应在美国西部(俄勒冈州)区域启动集群,以避免缴纳跨区域数据传输费。如果您使用 Amazon S3 存储桶接收集群输出,那么也应该在美国西部(俄勒冈州)区域创建该集群输出。
如果您打算将某个 Amazon EC2 密钥对与集群相关联(这是使用 SSH 登录主节点所必需的操作),那么必须在集群所在区域创建密钥对。与之类似,Amazon EMR 创建的用以管理集群的安全组也应在集群所在区域内创建。
如果您是在 2017 年 5 月 17 日或之后注册的 Amazon Web Services 账户,则您从 Amazon Web Services Management Console 访问资源的默认区域是美国东部(俄亥俄)(us-east-2);对于旧账户,默认区域是美国西部(俄勒冈)(us-west-2)或美国东部(弗吉尼亚北部)(us-east-1)。有关更多信息,请参阅 区域和端点。
某些 Amazon 功能仅在部分区域可用。例如,集群计算实例仅在美国东部(弗吉尼亚州北部)区域可用,而亚太地区(悉尼)区域仅支持 Hadoop 1.0.3 及更高版本。当您选择一个区域时,请核实该区域是否支持您想要使用的功能。
为了获得最佳性能,对于所有将用于集群的 Amazon 资源,请使用同一区域。下表列出了区域名称和服务的映射关系。有关 Amazon EMR 区域的列表,请参阅《Amazon Web Services 一般参考》 中的 Amazon Web Services 区域 and endpoints。
使用控制台选择区域
默认区域显示在导航栏上账户信息的左侧。要在新旧控制台中切换区域,请选择“区域”下拉菜单并选择一个新选项。
使用 Amazon CLI 指定区域
可在 Amazon CLI 中使用 aws
configure 命令或 AWS_DEFAULT_REGION
环境变量指定默认区域。有关更多信息,请参阅《Amazon Command Line Interface 用户指南》中的配置Amazon区域。
选择一个使用 SDK 或 API 的区域
要使用软件开发工具包选择区域,请将应用程序配置为使用该区域的端点。如果您正在使用 Amazon SDK 创建客户端应用程序,那么您可以通过调用 setEndpoint
来变更客户终端节点,如下例所示:
client.setEndpoint("elasticmapreduce.us-west-2.amazonaws.com");
在您的应用程序通过设置端点指定一个区域后,您可以为集群的 EC2 实例设置可用区。可用区是专用于隔离其他可用区内故障的区分位置,可向相同区域中的其他可用区提供低延迟的便宜网络连接。一个区域包含一个或多个可用区。为了优化性能和降低延迟,所有资源应与使用它们的集群位于同一可用区。