本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
对跳过行错误进行问题排查
当您导入数据时,Amazon 会 QuickSight 预览您的部分数据。如果它出于任何原因无法解释某行,则 QuickSight 跳过该行。在某些情况下,导入将失败。发生这种情况时,会 QuickSight 返回一条解释失败原因的错误消息。
幸运的是,可能出错的情况并不多。通过注意以下示例,可以避免某些问题:
-
请确保字段数据类型与字段数据没有不一致,例如,具有数字数据类型的字段中偶尔会包含字符串数据的情况。以下是一些在扫描表格内容时可能难以检测到的示例:
-
''
– 使用空字符串表示缺失值 -
'NULL'
– 使用“null”词表示缺失值 -
$1000
– 在货币值中包含美元符号会将其转换为字符串 -
'O'Brien'
– 使用标点符号来标记本身包含相同标点符号的字符串。
但是,这类错误并不总是那么容易发现,尤其是在数据量很大或数据是手动输入的情况下。例如,有些客户服务或销售应用程序需要输入客户口头提供的信息。最初输入数据的人可能以错误字段输入了数据。他们可能添加了字符或数字,或者忘记添加字符或数字。例如,他们可能输入了“0/10/12020”的日期,或者本应输入年龄的字段中输入性别。
-
-
无论是否有标题,请确保正确处理导入的文件。如果有标题行,请确保选择包含标题上传选项。
-
确保数据不超过一个或多个 数据来源限额。
-
确保数据与 支持的数据类型和值 兼容。
-
确保计算字段包含适用于计算的数据,而不是与计算字段中的函数不兼容或被函数排除在外。例如,如果您的数据集中有一个使用的parseDate计算字段,则会 QuickSight 跳过该字段不包含有效日期的行。
QuickSight 提供了在以下情况下发生的错误的详细列表 SPICE 引擎尝试摄取数据。当保存的数据集报告跳过行时,您可以查看错误,以便采取措施修复问题。
查看期间跳过的行的错误 SPICE 摄取(数据导入)
-
在数据集页面上,选择有问题的数据集以打开它。
-
在打开的数据集详细信息页面上,选择刷新选项卡。
SPICE摄取历史记录显示在底部。
-
对于出现错误的摄取,请选择查看错误摘要。此链接位于状态列下。
-
检查打开的文件导入日志。它会显示以下部分:
-
摘要 – 提供一个百分比分数,用于表示总导入行数中跳过的行数。例如,如果在总共 1728 行中跳过了 864 行,则分数为 50.00%。
-
跳过的行数 – 提供每组相似的已跳过行的行数、字段名称和错误消息。
-
问题排查 – 提供下载包含错误信息的文件的链接。
-
-
在问题排查下,选择下载错误行文件。
错误文件中每个错误都占一行。文件名为
error-report_123_fe8.csv
,其中123_fe8
替换为唯一标识字符串。文件包含以下列:-
ERROR_ TYPE — 导入此行时发生的错误的类型或错误代码。可以在该过程之后的 SPICE 摄取错误代码 部分中查找此错误。
-
COLUMN_ NAME — 数据中导致错误的列的名称。
-
导入行中的所有列(其余列复制整行数据)。如果一行中有多个错误,则该行可能会在此文件中出现多次。
-
-
选择编辑数据集对数据集进行更改。您可以筛选数据、省略字段、更改数据类型、调整现有计算字段以及添加用于验证数据的计算字段。
-
在完成错误代码所示的更改后,请再次导入数据。如果更多 SPICE 日志中会显示摄取错误,请再次执行此过程以修复所有剩余的错误。
提示
如果您无法使用数据集编辑器在合理时间内解决数据问题,请咨询拥有数据的管理员或开发人员。从长远来看,比起在准备用于分析的数据时添加异常处理,清理接近数据来源的数据会更加经济高效。通过从源头上进行修复,可以避免多人以不同方式修复错误,从而导致日后出现不同报告结果。
练习对跳过行进行问题排查
-
将文件解压缩到一个文件夹,您可以使用该文件夹将示例.csv 文件上传到QuickSight该文件夹。
zip 文件包含以下两个文本文件:
-
sample dataset - data ingestion error.csv
– 包含导致跳过行问题的示例 .csv 文件。您可以尝试自己导入文件,以了解错误过程是如何运行的。 -
sample data ingestion error file
— 期间生成的示例错误文件 SPICE 在将示例.csv 文件导入时进行摄取。 QuickSight
-
-
按照以下步骤导入数据:
-
选择数据集、新数据集。
-
选择 Upload a file (上传文件)。
-
查找并选择名为
sample dataset - data ingestion error.csv
的文件。 -
选择上传文件、编辑设置并准备数据。
-
选择保存退出。
-
-
选择数据集查看其信息,然后选择查看错误摘要。检查错误和数据以帮助您解决问题。