对跳过行错误进行问题排查 - 亚马逊 QuickSight
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

重要:我们已经重新设计了 Amazon QuickSight 分析工作空间。您可能会遇到无法反映 QuickSight 控制台新外观的屏幕截图或程序化文本。我们正在更新屏幕截图和过程文本。

要查找特征或项目,请使用快速搜索栏

有关新外观 QuickSight的更多信息,请参阅在 Amazon 上引入全新的分析体验 QuickSight

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

对跳过行错误进行问题排查

当您导入数据时,Amazon 会 QuickSight 预览您的部分数据。如果出于某种原因无法解释某一行,该行会被跳过。

幸运的是,可能出错的情况并不多。通过注意以下示例,可以避免某些问题:

  • 请确保字段数据类型与字段数据没有不一致,例如,具有数字数据类型的字段中偶尔会包含字符串数据的情况。以下是一些在扫描表格内容时可能难以检测到的示例:

    • '' – 使用空字符串表示缺失值

    • 'NULL' – 使用“null”词表示缺失值

    • $1000 – 在货币值中包含美元符号会将其转换为字符串

    • 'O'Brien' – 使用标点符号来标记本身包含相同标点符号的字符串。

    但是,这类错误并不总是那么容易发现,尤其是在数据量很大或数据是手动输入的情况下。例如,有些客户服务或销售应用程序需要输入客户口头提供的信息。最初输入数据的人可能以错误字段输入了数据。他们可能添加了字符或数字,或者忘记添加字符或数字。例如,他们可能输入了“0/10/12020”的日期,或者本应输入年龄的字段中输入性别。

  • 无论是否有标题,请确保正确处理导入的文件。如果有标题行,请确保选择包含标题上传选项。

  • 确保数据不超过一个或多个 数据来源限额

  • 确保数据与 支持的数据类型和值 兼容。

  • 确保计算字段包含适用于计算的数据,而不是与计算字段中的函数不兼容或被函数排除在外。例如,如果您的数据集中有一个使用的parseDate计算字段,则会 QuickSight 跳过该字段不包含有效日期的行。

QuickSight 提供了SPICE引擎尝试摄取数据时发生的错误的详细列表。当保存的数据集报告跳过行时,您可以查看错误,以便采取措施修复问题。

查看在 SPICE 摄取(数据导入)期间跳过的行的错误
  1. 数据集页面上,选择有问题的数据集以打开它。

  2. 在打开的数据集详细信息页面上,选择刷新选项卡。

    SPICE 摄取历史记录显示在底部。

  3. 对于出现错误的摄取,请选择查看错误摘要。此链接位于状态列下。

  4. 检查打开的文件导入日志。它会显示以下部分:

    • 摘要 – 提供一个百分比分数,用于表示总导入行数中跳过的行数。例如,如果在总共 1728 行中跳过了 864 行,则分数为 50.00%。

    • 跳过的行数 – 提供每组相似的已跳过行的行数、字段名称和错误消息。

    • 问题排查 – 提供下载包含错误信息的文件的链接。

  5. 问题排查下,选择下载错误行文件

    错误文件中每个错误都占一行。文件名为 error-report_123_fe8.csv,其中 123_fe8 替换为唯一标识字符串。文件包含以下列:

    • ERROR_TYPE – 导入此行时发生的错误的类型或错误代码。可以在该过程之后的 SPICE 摄取错误代码 部分中查找此错误。

    • COLUMN_NAME – 数据中导致错误的列的名称。

    • 导入行中的所有列(其余列复制整行数据)。如果一行中有多个错误,则该行可能会在此文件中出现多次。

  6. 选择编辑数据集对数据集进行更改。您可以筛选数据、省略字段、更改数据类型、调整现有计算字段以及添加用于验证数据的计算字段。

  7. 在完成错误代码所示的更改后,请再次导入数据。如果日志中出现更多 SPICE 摄取错误,请再次执行此过程以修复所有剩余错误。

提示

如果您无法使用数据集编辑器在合理时间内解决数据问题,请咨询拥有数据的管理员或开发人员。从长远来看,比起在准备用于分析的数据时添加异常处理,清理接近数据来源的数据会更加经济高效。通过从源头上进行修复,可以避免多人以不同方式修复错误,从而导致日后出现不同报告结果。

练习对跳过行进行问题排查
  1. 下载 CSV files for troubleshooting skipped rows.zip

  2. 将文件解压缩到一个文件夹,您可以使用该文件夹将示例.csv 文件上传到QuickSight该文件夹。

    zip 文件包含以下两个文本文件:

    • sample dataset - data ingestion error.csv – 包含导致跳过行问题的示例 .csv 文件。您可以尝试自己导入文件,以了解错误过程是如何运行的。

    • sample data ingestion error file— 将示例.csv 文件导入时在SPICE摄取过程中生成的示例错误文件。 QuickSight

  3. 按照以下步骤导入数据:

    1. 选择数据集新数据集

    2. 选择 Upload a file (上传文件)。

    3. 查找并选择名为 sample dataset - data ingestion error.csv 的文件。

    4. 选择上传文件编辑设置并准备数据

    5. 选择保存退出。

  4. 选择数据集查看其信息,然后选择查看错误摘要。检查错误和数据以帮助您解决问题。