创建 Amazon S3 数据集 - Amazon QuickSight
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建 Amazon S3 数据集

创建 Amazon S3 数据集
  1. 选中 数据来源限额 以确保目标文件设置未超出数据来源限制。

  2. 使用 支持的 Amazon S3 清单文件格式中指定的格式之一创建清单文件,以确定要导入的文本文件。

  3. 将清单文件保存到本地目录中,或者将其上传到 Amazon S3 中。

  4. 在 Amazon QuickSight 起始页上,选择数据集

  5. 数据集页面上,选择新数据集

  6. 创建数据集页面的使用新数据来源部分,选择 Amazon S3 图标。

  7. 对于 Data source name (数据源名称),输入数据源的描述。这应该是帮助将该数据源与其他数据源区分开来的名称。

  8. 对于 Upload a manifest file,请执行以下操作之一:

    • 要使用本地清单文件,请选择 Upload,然后选择 Upload a JSON manifest file。对于 Open,请选择一个文件,然后选择 Open

    • 要使用 Amazon S3 中的清单文件,请选择 URL,然后输入该清单文件的 URL。要在 Amazon S3 控制台中查找预先存在的清单文件的 URL,请导航到并选择相应的文件。随即显示属性面板,包括链接 URL。您可以复制网址并将其粘贴到 Amazon 中 QuickSight。

  9. 选择连接

  10. 要确保已完成连接,请选择 Edit/Preview data。否则,选择 Visualize 以原样使用数据创建分析。

    如果选择编辑/预览数据,您可以在准备数据过程中指定数据集名称。否则,数据集名称与将与清单文件名称匹配。

    要了解数据准备的更多信息,请参阅在 Amazon 中准备数据 QuickSight

基于多个 Amazon S3 文件创建数据集

您可以使用以下几种方法之一来合并或合并亚马逊内的 Amazon S3 存储桶中的文件: QuickSight

  • 使用清单组合文件 – 在这种情况下,这些文件必须具有相同数量的字段(列)。文件的相同位置中的字段必须具有匹配的数据类型。例如,每个文件中的第一个字段必须具有相同的数据类型。第二个字段、第三个字段以及后续字段也是如此。Amaz QuickSight on 从第一个文件中获取字段名称。

    必须在清单中明确列出这些文件。但是,它们不必位于同一个 Amazon S3 存储桶内。

    此外,这些文件还必须遵循支持的 Amazon S3 清单文件格式中所述的规则。

    有关使用清单组合文件的更多详细信息,请参阅使用 Amazon S3 文件创建数据集

  • 不使用清单合并文件 – 要将多个文件合并为一个文件而不必在清单中单独列出这些文件,您可以使用 Athena。在使用这种方法时,您只需查询您的文本文件,就像它们位于数据库的表中一样。有关更多信息,请参阅大数据博客中的 Analyzing data in Amazon S3 using Athena

  • 在导入之前使用脚本附加文件 – 在上传之前,您可以使用用于组合文件的脚本。