如何处理压缩文件
Hadoop 会检查文件扩展名以检测压缩文件。Hadoop 支持的压缩类型是:gzip、bzip2 和 LZO。不需要执行任何额外操作来解压缩使用这些压缩类型的文件;Hadoop 会为您执行这些操作。
要索引 LZO 文件,您可以使用 hadoop-lzo 库,可以从 https://github.com/kevinweil/hadoop-lzo
Hadoop 会检查文件扩展名以检测压缩文件。Hadoop 支持的压缩类型是:gzip、bzip2 和 LZO。不需要执行任何额外操作来解压缩使用这些压缩类型的文件;Hadoop 会为您执行这些操作。
要索引 LZO 文件,您可以使用 hadoop-lzo 库,可以从 https://github.com/kevinweil/hadoop-lzo