

# 读取不可打印的 UTF-8 字符数据
<a name="EMRforDynamoDB.CopyingData.NonPrintableData"></a>

要读取和写入不可打印的 UTF-8 字符数据，创建 Hive 表时可以使用 `STORED AS SEQUENCEFILE` 子句。SequenceFile 是一种 Hadoop 二进制文件格式。需要使用 Hadoop 读取此文件。下面的示例显示如何将数据从 DynamoDB 导出到 Amazon S3。可以使用此功能处理不可打印的 UTF-8 编码字符。

```
1. CREATE EXTERNAL TABLE {{s3_export}}({{a_col string, b_col bigint, c_col array<string>}})
2. STORED AS SEQUENCEFILE
3. LOCATION '{{s3://bucketname/path/subpath/}}';
4. 
5. INSERT OVERWRITE TABLE {{s3_export}} SELECT *
6. FROM {{hiveTableName}};
```