End-to-end JumpStart 解决方案模板 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

End-to-end JumpStart 解决方案模板

重要

截至 2023 年 11 月 30 日,之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新后的 Studio 体验的信息,请参阅亚马逊 SageMaker Studio

注意

JumpStart 解决方案仅在 Studio 经典版中可用。

SageMaker JumpStart 提供一键式 end-to-end解决方案,旨在解决常见的机器学习用例。他们为自己的领域使用成熟的算法,并提供完整的工作流程,通常包括数据处理、模型训练、部署、推理和监控。浏览以下使用案例,了解有关可用解决方案模板的更多信息。

从 JumpStart 登录页面中选择最适合您的用例的解决方案模板。选择解决方案模板后,会 JumpStart 打开一个显示解决方案描述的新选项卡和一个启动按钮。选择 Launch 后,将 JumpStart 创建运行解决方案所需的所有资源,包括训练和模型托管实例。有关启动 JumpStart 解决方案的更多信息,请参阅启动解决方案

启动解决方案后,您可以在中浏览解决方案功能和任何生成的工件 JumpStart。使用 “已启动的 JumpStart 资产” 菜单查找您的解决方案。在解决方案的选项卡中,选择打开笔记本以使用提供的笔记本并浏览解决方案的功能。由于构件是在启动期间或运行提供的笔记本之后生成的,因此它们在生成的构件表中列出。您可以使用垃圾桶图标 ( The trash icon for JumpStart. ) 删除单独的构件。您可以通过选择删除解决方案资源来删除解决方案的所有资源。

需求预测

需求预测使用历史时间序列数据来对未来特定时期的客户需求进行估计,从而简化企业的供需决策流程。

需求预测使用案例包括预测交通行业的车票销售、股票价格、医院就诊次数、下个月在多个地点雇用的客户代表人数、下一季度多个地区的产品销售、第二天的视频流服务云服务器使用情况、下周多个地区的用电量、物联网设备和传感器(例如能耗)的数量等等。

时间序列数据分为单变量多变量。例如,单个家庭的总用电量是一段时间内的单变量时间序列。当多个单变量时间序列相互堆叠时,它被称为多变量时间序列。例如,一个街区中 10 个不同(但相关)家庭的总用电量构成了一个多变量时间序列数据集。

解决方案名称 描述 开始使用
需求预测 使用三 state-of-the-art种时间序列预测算法对多变量时间序列数据进行需求预测:LSTNet、Prophet 和 Deepa SageMaker r。

GitHub »

信用评级预测

使用 JumpStart我们的信用评级预测解决方案来预测企业信用评级或解释机器学习模型做出的信用预测决策。与传统的信用评级建模方法相比,机器学习模型可以自动进行信用预测并提高其准确性。

解决方案名称 描述 开始使用
企业信用评级预测 使用 Amazon AutoGluon 表格进行多模态(长文本和表格)机器学习,用于高质量的信用预测。 GitHub »
基于图形的信用评分 通过训练图神经网络图和表格模型,使用表格数据和企业网络预测企业信用评级。SAGE Amazon AutoGluon 在亚马逊 SageMaker Studio 经典版中查找。
解释信用决策 预测信用申请中的信用违约,并使用 L igh t GBM 和 SHAP(AdditiveexPlanations)SHapley提供解释。

GitHub »

欺诈侦测

许多企业每年因欺诈损失数十亿美元。基于机器学习的欺诈检测模型有助于以系统化的方式,从海量数据中识别可能的欺诈活动。以下解决方案使用交易和用户身份数据集来识别欺诈性交易。

解决方案名称 描述 开始使用
检测恶意用户和交易 使用过度采样技术自动检测交易中潜在SageMakerXGBoost的欺诈活动合成少数族裔过度采样 () SMOTE。

GitHub »

使用深度图形库检测金融交易中的欺诈行为 通过使用深度图库和模型训练图形卷积网络,检测金融交易中的欺诈行为。SageMaker XGBoost

GitHub »

财务支付分类 使用交易信息对财务付款进行分类SageMaker XGBoost。使用此解决方案模板作为欺诈检测、个性化或异常检测的中间步骤。

在亚马逊 SageMaker Studio 经典版中查找。

计算机视觉

随着自动驾驶汽车、智能视频监控、医疗保健监控和各种对象计数任务等业务使用案例的兴起,对快速、准确的对象检测系统的需求也在不断增加。这些系统不仅涉及识别和分类图像中的每个对象,还需要通过在图像周围绘制相应的边界框来定位每个对象。在过去的十年中,深度学习技术的飞速发展极大地加速了对象检测的进步。

解决方案名称 描述 开始使用
视觉产品缺陷检测 通过从头开始训练物体检测模型或微调预训练 SageMaker 模型来识别产品图像中的缺陷区域。

GitHub »

手写识别 通过训练对象检测模型手写识别模型来识别图像中的手写文本。使用 G SageMaker round Trut h 标记你自己的数据。 GitHub »
针对鸟类种类的对象检测 使用物SageMaker 体检测模型识别场景中的鸟类。

在亚马逊 SageMaker Studio 经典版中查找。

从文档中提取和分析数据

JumpStart 为您提供解决方案,让您在关键业务文档中发现宝贵的见解和联系。使用案例包括文本分类、文档摘要、手写识别、关系提取、问答以及填写表格记录中的缺失值。

解决方案名称 描述 开始使用
情绪分类的隐私性 文本匿名化,以便在情绪分类中更好地保护用户隐私。

GitHub »

文档理解 使用中的转换器库进行文档摘要、实体和关系提取。 PyTorch

GitHub »

手写识别 通过训练对象检测模型手写识别模型来识别图像中的手写文本。使用 G SageMaker round Trut h 标记你自己的数据。 GitHub »
填写表格记录中的缺失值 通过训练SageMaker AutoPilot模型填充表格记录中的缺失值。

GitHub »

预测性维护

预测性维护的目标是协调及时更换部件,从而在纠正性维护和预防性维护之间实现最佳的平衡。以下解决方案使用来自工业资产的传感器数据,预测机器故障、计划外停机时间和维修成本。

解决方案名称 描述 开始使用
车队的预测性维护 通过卷积神经网络模型,使用车辆传感器信息和维护信息预测车队故障。

GitHub »

制造业的预测性维护 通过使用历史传感器读数训练堆叠式双向LSTM神经网络模型,预测每个传感器的剩余使用寿命。

GitHub »

流失预测

客户流失率是许多公司面临的代价高昂的问题。在减少客户流失的工作中,公司可以识别可能退出其服务的客户,以便将精力集中在客户保留上。使用 JumpStart流失预测解决方案来分析用户行为和客户支持聊天记录等数据源,以确定哪些客户面临取消订阅或服务的高风险。

解决方案名称 描述 开始使用
使用文本预测流失 使用带有BERT编码器的数字、分类和文本特征预测流失率和. RandomForestClassifier

GitHub »

手机客户流失预测 识别不满意的手机客户正在使用SageMaker XGBoost

在亚马逊 SageMaker Studio 经典版中查找。

个性化推荐

您可以使用 JumpStart 解决方案来分析客户身份图或用户会话,以更好地了解和预测客户行为。针对个性化推荐,使用以下解决方案,对客户在多台设备上的身份建模,确定客户购买的可能性,或者根据过去的客户行为创建自定义电影推荐程序。

解决方案名称 描述 开始使用
使用深度图形库对身份图中的实体进行解析 通过使用深度图形库训练图形卷积网络,为线上广告投放执行跨设备实体链接。

GitHub »

购买建模 通过训练SageMaker XGBoost模型来预测客户是否会进行购买。

GitHub »

自定义推荐系统

训练和部署自定义推荐系统,该系统使用神经协作筛选根据过去的行为为客户生成电影建议。 SageMaker

在亚马逊 SageMaker Studio 经典版中查找。

强化学习

强化学习 (RL) 是一种基于与环境的交互进行学习的类型。这种类型的学习是由代理人使用的,该代理必须通过与动态环境的 trial-and-error互动来学习行为,在这种环境中,目标是最大限度地提高代理人因其行为而获得的长期回报。通过权衡具有不确定奖励的探索行为与具有已知奖励的探索行为,实现奖励最大化。

RL 非常适合解决大型复杂问题,例如供应链管理、HVAC系统、工业机器人、游戏人工智能、对话系统和自动驾驶汽车。

解决方案名称 描述 开始使用
适用于 Battlesnake AI 竞赛的强化学习 通过BattleSnake人工智能竞赛为训练和推理提供强化学习工作流程。

GitHub »

适用于 Procgen 挑战的分布式强化学习 适用于 Neur IPS 2020 Procgen 强化学习挑战赛的分布式强化学习入门套件。 GitHub »

医疗保健与生命科学

临床医生和研究人员可以使用 JumpStart 解决方案来分析医学影像、基因组信息和临床健康记录。

解决方案名称 描述 开始使用
肺癌存活率预测 使用三维肺部计算机断层扫描 (CT) 扫描、基因组数据和临床健康记录,预测非小细胞肺癌患者的存活状态。SageMakerXGBoost

GitHub »

财务定价

许多企业定期动态调整定价,以尽可能地提高回报。使用以下 JumpStart 解决方案进行价格优化、动态定价、期权定价或投资组合优化用例。

解决方案名称 描述 开始使用
价格优化

使用双重机器学习 (ML)(用于因果推断)和 Prophet 预测程序估算价格弹性。使用这些估算值来优化每日价格。

在亚马逊 SageMaker Studio 经典版中查找。

因果推理

研究人员可以使用贝叶斯网络等机器学习模型来表示因果依赖关系,并根据数据得出因果结论。使用以下 JumpStart解决方案来了解氮基肥料施用与玉米作物产量之间的因果关系。

解决方案名称 描述 开始使用
作物产量反设事实

对玉米对氮肥的反应进行反设事实分析。该解决方案使用多光谱卫星图像和地面观测数据来全面了解作物物候周期。

在亚马逊 SageMaker Studio 经典版中查找。