机器学习如何解决问题 - Amazon Redshift
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

机器学习如何解决问题

机器学习模型通过查找训练数据中的模式,然后将这些模式应用于新数据来生成预测。在机器学习中,您可以通过学习最能解释数据的模式来训练这些模型。然后,使用模型对新数据进行预测(也称为推理)。机器学习通常是一个迭代过程,您可以通过迭代更改参数和改进训练数据来继续提高预测的准确性。如果数据更改,则使用新数据集重新训练新模型。

为了实现各种业务目标,有不同的基本机器学习方法。 Amazon Redshift 支持指导式学习,这是进行高级企业分析的最常见方法。当您具有一组已建立的数据并了解特定输入数据如何预测各种业务结果时,指导式学习是首选机器学习方法。这些结果有时称为标签。具体而言,您的数据集是一个表,其中包含包含特征(输入)和目标(输出)的属性。例如,假设您有一个为过去和现在的客户提供期限和邮政编码的 表。假设您还有一个字段“活动”,对于当前客户为 true,对于暂停其成员资格的客户为 false。指导式机器学习的目标是发现目标为“False”的客户所表示的导致客户流失的年龄和邮政编码模式。您可以使用此模型预测可能流失的客户,例如暂停其成员资格,并可能提供保留奖励。

Amazon Redshift 支持指导式学习,其中包括回归、二进制分类和多类别分类。回归是指预测连续值的问题,例如客户的总支出。二进制分类是指预测两个结果之一的问题,例如,预测客户是否流失。多类别分类是指预测很多结果之一的问题,例如预测客户可能感兴趣的项目。数据分析师和数据科学家可以使用它来执行指导式学习,以解决从预测、个性化或客户流失预测等问题。您还可以在问题中使用指导式学习,例如预测哪些销售将关闭、收入预测、欺诈检测和客户生命周期值预测。