机器学习 - Amazon Step Functions
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

机器学习

机器学习能够帮助组织快速分析收集的数据,识别模式,从而在做出决策时尽可能减少人为干预。机器学习始于一组初始数据,即训练数据。这些训练数据有助于提高机器学习模型的预测准确性,也是该模型学习的基础。模型经过验证,准确性达到要求,足以满足业务需求后,便会将其部署到生产中。Amazon Step Functions 数据科学软件开发工具包 (SDK) 是一个开源库,允许您使用 Amazon SageMaker 和 Step Functions 轻松创建预处理数据、执行训练,以及发布模型的工作流。

预处理现有数据集是组织创建训练数据的常用方式。这种方法可以添加信息,例如标注图像中的对象、注释文本或处理音频。要预处理数据,您可以使用 Amazon Glue,也可以创建一个运行 Jupyter 笔记本应用程序的 SageMaker 笔记本实例。数据准备就绪后,可以将其上传到 Amazon S3 以便于访问。训练机器学习模型完成后,您可以调整每个模型的参数,提高准确性,直到模型可以部署为止。

Step Functions 允许您在 SageMaker 上编排端到端的机器学习工作流。这些工作流可能包括数据预处理、后处理、特征工程、数据验证和模型评估。将模型部署到生产后,您可以改进和测试新方法,持续改善业务成果。您可以直接在 Python 中创建生产就绪型工作流,也可以使用 Step Functions 数据科学开发工具包复制该工作流,体验新选项,然后将改进后的工作流投入到生产中。

客户使用 Step Functions 的机器学习工作流类型包括:

欺诈侦测

  • 识别并防止欺诈性交易(例如信用欺诈)的发生。

  • 使用经过训练的机器学习模型侦测并预防账户盗用。

  • 识别促销滥用行为,包括创建虚假账户,以便您可以快速采取行动。

个性化和推荐

  • 根据对目标客户兴趣的预测,向其推荐产品。

  • 预测客户是否会将其账户从免费套餐升级为付费订阅。

数据扩充

  • 将数据扩充作为预处理的一部分,为更精确的机器学习模型提供更好的训练数据。

  • 为文本和音频摘录添加注释,以便添加语法信息,例如讽刺和俚语。

  • 为图像中的其他对象添加标签,为模型学习提供关键信息,例如对象是苹果、篮球、岩石还是动物。