第 5 步:将数据复制到 DynamoDB
在此步骤中,将数据从 Hive 表 (hive_features
) 复制到 DynamoDB 的新表。
打开 DynamoDB 控制台:https://console.aws.amazon.com/dynamodb/
。 -
选择创建表。
-
在创建 DynamoDB 表页面,执行以下操作:
-
在表中键入
Features
。 -
对于主键,在分区键字段键入
Id
。将数据类型设置为 Number。清除使用默认设置。对于预置容量,键入:
-
读取容量单位—
10
-
写入容量单位—
10
-
选择创建。
-
-
在 Hive 提示符处,输入以下 HiveQL 语句:
CREATE EXTERNAL TABLE ddb_features (feature_id BIGINT, feature_name STRING, feature_class STRING, state_alpha STRING, prim_lat_dec DOUBLE, prim_long_dec DOUBLE, elev_in_ft BIGINT) STORED BY 'org.apache.hadoop.hive.dynamodb.DynamoDBStorageHandler' TBLPROPERTIES( "dynamodb.table.name" = "Features", "dynamodb.column.mapping"="feature_id:Id,feature_name:Name,feature_class:Class,state_alpha:State,prim_lat_dec:Latitude,prim_long_dec:Longitude,elev_in_ft:Elevation" );
现在,您已在 DynamoDB 中的 Hive 和 Features 表之间建立了映射。
-
输入下面的 HiveQL 语句,将数据导入到 DynamoDB:
INSERT OVERWRITE TABLE ddb_features SELECT feature_id, feature_name, feature_class, state_alpha, prim_lat_dec, prim_long_dec, elev_in_ft FROM hive_features;
Hive 将提交一个 MapReduce 任务,由 Amazon EMR 集群处理。完成任务需要几分钟的时间。
-
验证数据是否已加载到 DynamoDB 中:
-
在 DynamoDB 控制台导航窗格选择表。
-
选择 Features 表,然后选择项目选项卡查看数据。
-