准备批量加载数据文件 - Amazon Timestream
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

准备批量加载数据文件

源数据文件具有分隔符分隔的值。更具体的术语通常使用逗号分隔值 (CSV)。有效的列分隔符包括逗号和竖线。记录用新行分隔。文件必须存储在 Amazon S3 中。创建新的批量加载任务时,源数据的位置由文件的 ARN 指定。文件包含标题。一列代表时间戳。至少还有一列代表一个度量。

用于批量加载的 S3 存储桶必须与用于批量加载的 LiveAnalytics 表的时间流位于同一个区域中。提交批量加载任务后,请勿在批量加载中使用的 S3 存储桶中添加或删除文件。有关使用 S3 存储桶的信息,请参阅 Amazon S3 入门

注意

由某些应用程序(例如 Excel)生成的 CSV 文件可能包含与预期编码冲突的字节顺序标记 (BOM)。引用带有 BOM 的 CSV 文件的 LiveAnalytics 批量加载任务的时间流在以编程方式处理时会引发错误。为避免这种情况,您可以删除 BOM,它是一个不可见的字符。

例如,您可以从允许您指定新编码的应用程序(例如 Notepad++)中保存文件。您也可以使用编程选项来读取第一行,从该行中删除字符,然后将新值写入文件中的第一行。

从 Excel 中保存时,有多个 CSV 选项。使用不同的 CSV 选项保存可能会避免出现上述问题。但是你应该检查结果,因为编码的变化可能会影响某些字符。

CSV 格式参数

当你表示一个原本由格式参数保留的值时,你可以使用转义字符。例如,如果引号字符是双引号,则要在数据中表示双引号,请将转义字符放在双引号之前。

有关在创建批量加载任务时何时指定这些内容的信息,请参阅创建批量加载任务

参数 选项
列分隔符 (逗号 (',') | 竖线 ('|') | 分号 (';') | Tab ('/t') | 空格 (''))
转义字符 none
引用字符 控制台:(双引号 (“) | 单引号 ('))
空值 空格 ('')
修剪空白 主机:(否 | 是)