将数据导入 Data Wrangler - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将数据导入 Data Wrangler

配置 SageMaker 域并在新选项卡中启动 Data Wrangler 后,就可以将数据从源导入到 Data Wrangler 了。当您使用 Data Wrangler 为 Amazon Personalize 准备数据时,一次只能导入一个数据集。我们建议从物品交互数据集开始。您不能使用 Data Wrangler 来准备操作数据集或操作交互数据集。

您从数据流页面开始。该页面应类似于以下内容。

描绘了 Data Wrangler 的数据流页面,其中包含导入数据和使用示例数据集选项。

要开始导入数据,请选择导入数据并指定您的数据源。Data Wrangler 支持 40 多个源。其中包括诸如亚马逊 Redshift、亚马逊 EMR 或亚马逊 Athena 之类的 Amazon 服务,以及第三方,例如 Snowflake 或。 DataBricks不同的数据源有不同的连接和导入数据的步骤。

有关可用来源的完整列表和数据导入 step-by-step 说明,请参阅《Amazon SageMaker 开发者指南》中的导入

将数据导入 Data Wrangler 后,就可以对其进行转换了。有关数据转换的信息,请参阅转换数据