

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 为 Amazon EMR 集群输出配置位置
<a name="emr-plan-output"></a>

 Amazon EMR 集群最常见的输出格式是压缩或未压缩的文本文件。通常，把这些文件写入 Amazon S3 存储桶。启动该集群前，必须先创建此存储桶。启动集群时，指定 S3 存储桶作为输出位置。

有关更多信息，请参阅以下主题：

**Topics**
+ [创建和配置 Amazon S3 存储桶](#create-s3-bucket-output)
+ [Amazon EMR 可以返回什么格式？](emr-plan-output-formats.md)
+ [如何使用 Amazon EMR 将数据写入非您拥有的 Amazon S3 存储桶](emr-s3-acls.md)
+ [压缩 Amazon EMR 集群输出的方法](emr-plan-output-compression.md)

## 创建和配置 Amazon S3 存储桶
<a name="create-s3-bucket-output"></a>

Amazon EMR（Amazon EMR）使用 Amazon S3 存储输入数据、日志文件和输出数据。Amazon S3 将这些存储位置称为*存储桶*。存储桶具有某些限制以符合 Amazon S3 和 DNS 要求。有关更多信息，请转至《Amazon Simple Storage Service 开发人员指南》**中的[存储桶限制](https://docs.amazonaws.cn/AmazonS3/latest/userguide/BucketRestrictions.html)。

要创建 Amazon S3 存储桶，请按照《Amazon Simple Storage Service 开发人员指南》**中的[创建存储桶](https://docs.amazonaws.cn/AmazonS3/latest/userguide/create-bucket-overview.html)页面中的说明进行操作。

**注意**  
 如果在 **Create a Bucket (创建存储桶)** 向导中启用了日志记录，则只启用存储桶访问日志，不会启用集群日志。

**注意**  
有关指定特定区域存储桶的更多信息，请参阅 A *mazon 简单存储服务开发者指南中的存储*[桶和](https://docs.amazonaws.cn/AmazonS3/latest/dev/LocationSelection.html)区域以及[可用的区域](https://www.amazonaws.cn/articles/available-region-endpoints-for-the-aws-sdks/)终端节点。 Amazon SDKs 

 创建存储桶后，您可以为其设置适当的权限。一般情况下，您可以给自己（所有者）授予读取和写入权限。在配置存储桶时，强烈建议您关注[Amazon S3 的安全最佳实践](https://docs.amazonaws.cn/AmazonS3/latest/userguide/security-best-practices.html)。

 在创建集群之前，所需的 Amazon S3 存储桶必须存在。您必须将集群中引用的所有必要的脚本或数据上载至 Amazon S3。下表介绍了示例数据、脚本和日志文件位置。


| 信息 | Amazon S3 中的示例位置 | 
| --- | --- | 
| 脚本或程序 |  s3://amzn-s3-demo-bucket1/script/MapperScript.py  | 
| 日志文件 |  s3://amzn-s3-demo-bucket1/logs  | 
| 输入数据 |  s3://amzn-s3-demo-bucket1/input  | 
| 输出数据 |  s3://amzn-s3-demo-bucket1/output  | 