本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用连接文本文件中的数据 DataBrew
您可以为 DataBrew 支持的输入文件配置以下格式选项:
-
逗号分隔值 () 文件 CSV
分隔符
.csv 文件的默认分隔符是逗号。如果您的文件使用不同的分隔符,请在创建数据集时在 “其他配置” 部分中选择CSV分隔符的分隔符。.csv 文件支持以下分隔符:
逗号 (,)
结肠 (:)
分号 (;)
竖线 (|)
制表符 (\t)
Caret (^)
反斜杠 (\)
空格
列标题值
您的CSV文件可以包含标题行作为文件的第一行。如果不是,则为你 DataBrew 创建一个标题行。
如果您的CSV文件包含标题行,请选择 “将第一行视为标题”。如果这样做,则CSV文件的第一行将被视为包含列标题值。
如果您的CSV文件不包含标题行,请选择添加默认标题。如果这样做,则会为文件 DataBrew 创建一个标题行,并且不会将您的第一行数据视为包含标题值。 DataBrew 创建的标题由下划线和文件中每列的数字组成
Column_1
,格式为Column_2
Column_3
、、等。
JSON文件
DataBrew 支持两种JSON文件格式,即JSON行和JSON文档。JSON行文件每行包含一行。在JSON文档文件中,所有行都包含在单个JSON结构或数组中。创建JSON数据集时,可以在其他配置部分指定JSON文件类型。默认格式为 “JSON行”。
Excel 文件
以下内容适用于中的 Excel 工作表 DataBrew:
Excel 表格加载
默认情况下, DataBrew 加载您的 Excel 文件中的第一张工作表。但是,创建 Excel 数据集时,您可以在 “其他配置” 部分中指定不同的表单编号或工作表名称。
列标题值
您的 Excel 工作表可以将标题行作为文件的第一行,但如果没有,则 DataBrew 会为您创建一个标题行。
如果您的 Excel 工作表包含标题行,请选择 “将第一行视为标题”。如果这样做,Excel 工作表的第一行将被视为包含列标题值。
如果您的 Excel 文件不包含标题行,请选择 “添加默认标题”。通过这样做,您可以指定 DataBrew应该为文件创建标题行,而不是将您的第一行数据视为包含标题值。 DataBrew创建的标题由下划线和文件中每列的数字组成
Column_1
,格式为Column_2
Column_3
、、等。