Amazon DynamoDB
开发人员指南 (API Version 2012-08-10)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。点 击 Getting Started with Amazon AWS to see specific differences applicable to the China (Beijing) Region.

步骤 4:向 HDFS 中加载数据

在此步骤中,您将数据文件复制到 Hadoop 分布式文件系统 (HDFS) 中,然后创建一个映射到该数据文件的外部 Hive 表。

下载示例数据

  1. 下载示例数据存档 (features.zip):

    Copy
    wget http://docs.amazonaws.cn/amazondynamodb/latest/developerguide/samples/features.zip
  2. 从存档中提取 features.txt 文件:

    Copy
    unzip features.zip
  3. 查看 features.txt 文件的前几行:

    Copy
    head features.txt

    结果应与以下示例类似:

    Copy
    1535908|Big Run|Stream|WV|38.6370428|-80.8595469|794 875609|Constable Hook|Cape|NJ|40.657881|-74.0990309|7 1217998|Gooseberry Island|Island|RI|41.4534361|-71.3253284|10 26603|Boone Moore Spring|Spring|AZ|34.0895692|-111.410065|3681 1506738|Missouri Flat|Flat|WA|46.7634987|-117.0346113|2605 1181348|Minnow Run|Stream|PA|40.0820178|-79.3800349|1558 1288759|Hunting Creek|Stream|TN|36.343969|-83.8029682|1024 533060|Big Charles Bayou|Bay|LA|29.6046517|-91.9828654|0 829689|Greenwood Creek|Stream|NE|41.596086|-103.0499296|3671 541692|Button Willow Island|Island|LA|31.9579389|-93.0648847|98

    该数据文件包含美国地名委员会 (http://geonames.usgs.gov/domestic/download_data.htm) 提供的数据子集。

    features.txt 文件包含美国地名委员会 (http://geonames.usgs.gov/domestic/download_data.htm) 提供的数据子集。每行中的字段表示以下内容:

    • 特征 ID (唯一标识符)

    • 名称

    • 类 (湖;林;流等)

    • 纬度 (度数)

    • 经度 (度数)

    • 高度 (英尺)

  4. 在命令提示符下输入以下命令:

    Copy
    hive

    命令提示符更改为:hive>

  5. 输入以下 HiveQL 语句,以创建本机 Hive 表:

    Copy
    CREATE TABLE hive_features (feature_id BIGINT, feature_name STRING , feature_class STRING , state_alpha STRING, prim_lat_dec DOUBLE , prim_long_dec DOUBLE , elev_in_ft BIGINT) ROW FORMAT DELIMITED FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n';
  6. 输入以下 HiveQL 语句,以在表中加载数据:

    Copy
    LOAD DATA LOCAL INPATH './features.txt' OVERWRITE INTO TABLE hive_features;
  7. 现在您有一个本机 Hive 表,该表中填充了来自 features.txt 文件的数据。要进行验证,请输入以下 HiveQL 语句:

    Copy
    SELECT state_alpha, COUNT(*) FROM hive_features GROUP BY state_alpha;

    输出应显示州列表和各州的地理特征数量。

下一步

步骤 5:将数据复制到 DynamoDB