Amazon Redshift ML 如何与 结合使用 Amazon SageMaker - Amazon Redshift
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon Redshift ML 如何与 结合使用 Amazon SageMaker

Amazon Redshift 使用 Amazon SageMaker Autopilot 以自动获取最佳模型并使预测函数在 中可用Amazon Redshift。

下图说明了 Amazon Redshift ML 的工作原理。

一般工作流程如下所示:

  1. Amazon Redshift 将训练数据导出到 Amazon S3。

  2. Amazon SageMaker Autopilot 预处理训练数据。预处理执行重要的功能,例如输入缺失值。它确认某些列是分类的(如邮政编码),正确设置列的格式以进行训练,并执行许多其他任务。选择最佳预处理器以应用于训练数据集本身是一个问题Amazon SageMaker,Autopilot 会自动执行其解决方案。

  3. Amazon SageMaker Autopilot 查找算法和算法超参数,这些超参数提供预测最精确的模型。

  4. Amazon Redshift 将预测函数注册为Amazon Redshift集群中的 SQL 函数。

  5. 当您运行 CREATE MODEL 语句时, Amazon Redshift 使用 Amazon SageMaker 进行训练。因此,训练模型会产生关联的成本。这是您的 Amazon SageMaker 账单AWS中用于 的单独行项目。您还需要为用于存储训练数据的 Amazon S3 存储付费。使用使用 CREATE MODEL 创建的模型进行推理时,无需付费,这些模型可在Amazon Redshift集群上进行编译并运行。使用 Amazon Redshift ML 不Amazon Redshift收取任何额外费用。