机器学习 - Amazon Step Functions
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

机器学习

机器学习使组织能够快速分析收集的数据以识别模式,然后在最少的人工干预下做出决策。机器学习从一组初始数据开始,称为训练数据。这些训练数据有助于提高机器学习模型的预测准确性,并且是该模型学习的基础。一旦模型被认为足够精确,足以满足业务需求,就会将其部署到生产环境中。这些区域有:Amazon Step Functions数据科学软件开发工具包 (SDK)是一个开源库,您可以使用 Amazon SageMaker 和 Step Functions 数轻松创建预处理数据、训练和发布模型的工作流。

预处理现有数据集是组织通常创建培训数据的方式。此方法添加信息,例如通过标记图像中的对象、注释文本或处理音频。要预处理数据,您可以使用Amazon Glue,也可以创建运行 Jupyter 笔记本应用程序的 SageMaker 笔记本实例。数据准备就绪后,可将其上传到 Amazon S3 以便轻松访问。随着机器学习模型的培训,您可以对每个模型的参数进行调整,以提高准确性,直到它准备好部署。

Step Functions 使您能够在 SageMaker 上编排端到端机器学习工作流程。这些工作流可以包括数据预处理、后处理、特征工程、数据验证和模型评估。一旦将模型部署到生产环境中,您就可以改进和测试新方法,以持续改善业务成果。您可以直接在 Python 中创建生产就绪型工作流程,或者使用 Step Functions 数据科学开发工具包复制该工作流程,体验新选项,并将精细的工作流程投入到生产中。

客户使用 Step Functions 的某些类型的机器学习工作流包括:

欺诈侦测

  • 识别和防止欺诈性交易(如信用欺诈)的发生。

  • 使用训练有素的机器学习模型检测和防止帐户接管。

  • 识别促销滥用行为,包括创建假账户,以便您快速采取措施。

个性化和建议

  • 根据预测吸引目标客户兴趣的内容,向他们推荐产品。

  • 预测客户是否会将其帐户从免费套餐升级到付费订阅。

数据丰富

  • 使用数据丰富作为预处理的一部分,为更精确的机器学习模型提供更好的训练数据。

  • 注释文本和音频摘录以添加语法信息,如讽刺和俚语。

  • 标记图像中的其他对象,以提供模型要学习的关键信息,例如对象是苹果、篮球、岩石还是动物。