读取不可打印的 UTF-8 字符数据
要读取和写入不可打印的 UTF-8 字符数据,创建 Hive 表时可以使用 STORED
AS SEQUENCEFILE
子句。SequenceFile 是一种 Hadoop 二进制文件格式。需要使用 Hadoop 读取此文件。下面的示例显示如何将数据从 DynamoDB 导出到 Amazon S3。可以使用此功能处理不可打印的 UTF-8 编码字符。
CREATE EXTERNAL TABLE
s3_export
(a_col string, b_col bigint, c_col array<string>
) STORED AS SEQUENCEFILE LOCATION 's3://bucketname/path/subpath/
'; INSERT OVERWRITE TABLEs3_export
SELECT * FROMhiveTableName
;