Amazon EMR
管理指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

Amazon EMR 可以返回什么格式?

集群的默认输出格式是将密钥和值对写入单独文本文件行的文本。这是最常用的输出格式。

如果默认输出数据需要采用默认文本文件以外的格式,则可以使用 Hadoop 接口 OutputFormat 指定其他输出类型。您甚至可以创建 FileOutputFormat 类型的子类,用于处理自定义数据类型。有关更多信息,请参阅 http://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/OutputFormat.html

如果您正在启动 Hive 集群,可以使用串行器/解串器 (SerDe) 将来自 HDFS 的数据以给定格式输出。有关更多信息,请参阅 https://cwiki.apache.org/confluence/display/Hive/SerDe