使用控制台进行批量加载 - Amazon Timestream
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

要获得与亚马逊 Timestream 类似的功能 LiveAnalytics,可以考虑适用于 InfluxDB 的亚马逊 Timestream。适用于 InfluxDB 的 Amazon Timestream 提供简化的数据摄取和个位数毫秒级的查询响应时间,以实现实时分析。点击此处了解更多信息。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用控制台进行批量加载

以下是使用 Amazon Web Services 管理控制台进行批量加载的步骤。您可以通过示例 CSV 下载示例 CSV。

访问批量加载

按照以下步骤,使用 Amazon Web Services 管理控制台访问批量加载。

  1. 打开 Amazon Timestream 控制台

  2. 在导航窗格中,选择管理工具,然后选择批量加载任务

  3. 在此处,您可以查看批量加载任务列表,并深入研究特定任务以获取更多详细信息。您还可以创建和恢复任务。

创建批量加载任务

按照以下步骤,使用 Amazon Web Services 管理控制台创建批量加载任务。

  1. 打开 Amazon Timestream 控制台

  2. 在导航窗格中,选择管理工具,然后选择批量加载任务

  3. 选择创建批量加载任务

  4. 导入目标中,选择以下选项。

    • 目标数据库:选择在 创建数据库 中创建的数据库名称。

    • 目标表:选择在 创建表 中创建的表名称。

    如有必要,可使用创建新表按钮,从此面板添加表。

  5. 数据来源中的数据来源 S3 位置,选择存储源数据的 S3 存储桶。使用 “浏览 S3” 按钮查看活跃 Amazon 账户有权访问的 S3 资源,或者输入 S3 位置 URL。数据来源必须位于同一区域中。

  6. 文件格式设置(可展开部分)中,可使用默认设置解析输入数据。您也可以选择高级设置。从此处,您可以选择 CSV 格式参数,然后选择参数以解析输入数据。有关这些参数的信息,请参阅 CSV 格式参数

  7. 配置数据模型映射中,配置数据模型。有关其他数据模型指南,请参阅 批量加载的数据模型映射

    • 数据模型映射中,选择映射配置输入,然后选择以下选项之一。

      • 可视化生成器-要直观地映射数据,请选择TargetMultiMeasureNameMeasureNameColumn。然后从可视化生成器中,映射列。

        当选择单个 CSV 文件作为数据来源时,可视化生成器会自动检测并加载数据来源文件中的源列标题。选择要创建映射的属性及数据类型。

        有关使用可视化生成器的信息,请参阅 使用可视化生成器

      • JSON 编辑器:用于配置数据模型的自由格式 JSON 编辑器。如果您熟悉 Timestream, LiveAnalytics 并且想要构建高级数据模型映射,请选择此选项。

      • 来自 S3 的 JSON 文件:选择存储在 S3 中的 JSON 模型文件。如果您已配置数据模型并希望将其重复用于其他批量加载,请选择此选项。

  8. 错误日志报告错误日志 S3 位置中,选择用于报告错误的 S3 位置。有关如何使用此报告的信息,请参阅 使用批量加载错误报告

  9. 对于加密密钥类型,选择下列选项之一。

    • Amazon S3 托管密钥(SSE-S3):Amazon S3 创建、管理和使用的加密密钥。

    • Amazon KMS key (SSE-KMS)-受 Amazon Key Management Service (Amazon KMS) 保护的加密密钥。

  10. 选择下一步

  11. 审核和创建页面上,根据需要审核并编辑设置。

    注意

    批量加载任务创建后,无法更改批量加载任务设置。任务完成时间将根据导入的数据量而有所不同。

  12. 选择创建批量加载任务

恢复批量加载任务

当选择状态为“进度已停止”且仍可恢复的批量加载任务时,系统会提示您恢复该任务。查看这些任务的详细信息时,还会显示一个带有恢复任务按钮的横幅。可恢复任务设有“恢复截止日期”。该日期到期后,任务将无法恢复。

使用可视化生成器

您可以使用可视化生成器将存储在 S3 存储桶中的一个或多个 CSV 文件源数据列映射到 LiveAnalytics 表的 Timestream 中的目标列。

注意

您的角色需要文件的 SelectObjectContent 权限。否则,您将需要手动添加或删除列。

自动加载源列模式

如果您只指定一个存储桶,Timestream for LiveAnalytics 可以自动扫描源 CSV 文件中的列名。如果没有现有的映射,则可以选择导入源列

  1. 映射配置输入设置中选择可视化生成器选项,设置时间戳时间输入。Milliseconds 为默认设置。

  2. 点击加载源列按钮,以导入源数据文件中的列标题。该表将使用数据来源文件中的源列标题名称进行填充。

  3. 为每个源列选择目标表列名Timestream 属性类型数据类型

    有关这些列和可能值的详细信息,请参阅 映射字段

  4. 使用该 drag-to-fill功能一次性设置多列的值。

手动添加源列

如果您使用的是存储桶或 CSV 前缀,而非单个 CSV,则可以使用添加列映射删除列映射按钮,通过可视化编辑器添加和删除列映射。还有一个用于重置映射的按钮。

映射字段

  • 源列名称:源文件中表示要导入的度量的列名称。当您使用入源列时,Timestream LiveAnalytics 可以自动填充此值。

  • 目标表列名:可选输入,用于指示目标表中度量的列名。

  • Timestream 属性类型:指定源列中数据的属性类型,例如 DIMENSION

    • TIMESTAMP:指定何时收集度量。

    • MULTI:表示多个度量。

    • DIMENSION:时间序列元数据。

    • MEASURE_NAME:对于单度量记录,这是度量名称。

  • 数据类型:Timestream 列的类型,例如 BOOLEAN

    • BIGINT:64 位整数。

    • BOOLEAN:逻辑的两个真值:true 和 false。

    • DOUBLE:64 位可变精度数值。

    • TIMESTAMP:使用 UTC 纳秒级精度的时点实例,用于跟踪自 Unix epoch 以来的时间。