Amazon SageMaker JumpStart Industry:Financial - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon SageMaker JumpStart Industry:Financial

使用 SageMaker JumpStart Industry:Financial 解决方案、模型和示例笔记本,通过针对行业关注的机器学习 (ML) 问题精心设计的一步到位解决方案和示例笔记本,了解 SageMaker 的特性和功能。这些笔记本还介绍了如何使用 SageMaker JumpStart Industry Python SDK 来增强行业文本数据并微调预训练模型。

Amazon SageMaker JumpStart Industry Python SDK

SageMaker JumpStart 通过名为 SageMaker JumpStart Industry Python SDK 的客户库,提供了用于管理行业数据集和微调预训练模型的处理工具。有关 SDK 的详细 API 文档,以及要了解有关处理和增强行业文本数据集以在 SageMaker JumpStart 上改善先进模型性能的更多信息,请参阅 SageMaker JumpStart Industry Python SDK 开源文档

Amazon SageMaker JumpStart Industry:Financial 解决方案

SageMaker JumpStart Industry:Financial 提供以下解决方案笔记本:

  • 企业信用评级预测

此 SageMaker JumpStart Industry:Financial 解决方案提供了用于文本增强型企业信用评级模型的模板。它展示了如何根据数字特征(在本例中为 Altman 著名的 5 个财务比率)与 SEC 申报文件中的文本相结合的模型,来改善信用评级的预测。除了 5 个 Altman 比率之外,您还可以根据需要添加更多变量或设置自定义变量。本解决方案笔记本展示了 SageMaker JumpStart Industry Python SDK 如何帮助处理 SEC 申报文件中文本的自然语言处理 (NLP) 评分。此外,该解决方案还演示了如何使用增强数据集来训练模型以获得先进的模型,将模型部署到 SageMaker 端点用于生产,以及如何实时接收改进的预测。

  • 基于图形的信用评分

传统上,信用评级是通过使用财务报表数据和市场数据的模型生成的,这些数据仅为表格数据(数字和类别)。该解决方案使用 SEC 申报文件构建了一个公司网络,并展示了如何通过表格数据使用公司关系网络来生成准确的评级预测。该解决方案演示了一种方法,使用公司关联数据,将基于表格的传统信用评分模型(已在评级行业中使用了数十年),扩展到网络上的机器学习模型类别。

注意

解决方案笔记本仅用于演示目的。不应将其作为财务或投资建议。

您可以通过 Studio 中的 SageMaker JumpStart 页面找到这些金融服务解决方案。

注意

SageMaker JumpStart Industry:Financial 解决方案、模型卡和示例笔记本只能通过 SageMaker Studio 托管和运行。登录 SageMaker 控制台,然后启动 SageMaker Studio。有关如何查找解决方案卡的更多信息,请参阅上一主题:SageMaker JumpStart

Amazon SageMaker JumpStart Industry:Financial 模型

SageMaker JumpStart Industry:Financial 提供以下预训练的 Robustly Optimized BERT 方法 (RoBERTa) 模型。

  • Financial Text Embedding (RoBERTa-SEC-Base)

  • RoBERTa-SEC-WIKI-Base

  • RoBERTa-SEC-Large

  • RoBERTa-SEC-WIKI-Large

RoBERTa-SEC-Base 和 RoBERTa-SEC-Large 模型是文本嵌入模型,基于 GluonNLP 的 RoBERTa 模型,在 2010 年到 2019 年的 S&P 500 SEC 10-K/10-Q 报告上进行预训练。除此之外,SageMaker JumpStart Industry:Financial 还提供两个 RoBERTa 变体:RoBERTa-SEC-WIKI-Base 和 RoBERTa-SEC-WIKI-Large,这些模型使用 SEC 申报文件和 Wikipedia 上的常用文本进行预训练。

您可以在 SageMaker JumpStart 中,通过导航到文本模型节点,选择搜索所有文本模型,然后筛选 ML 任务文本嵌入来查找这些模型。选择所选模型后,您可以访问任何对应的笔记本。配对的笔记本将引导您了解如何在多模式数据集上,针对特定分类任务对预训练模型进行微调,SageMaker JumpStart Industry Python SDK 增强了这些模型。

注意

模型笔记本仅用于演示目的。不应将其作为财务或投资建议。

以下屏幕截图显示了 Studio 上的 SageMaker JumpStart 页面所提供的预训练模型卡。

注意

SageMaker JumpStart Industry:Financial 解决方案、模型卡和示例笔记本只能通过 SageMaker Studio 托管和运行。登录 SageMaker 控制台,然后启动 SageMaker Studio。有关如何查找模型卡的更多信息,请参阅上一主题:SageMaker JumpStart

Amazon SageMaker JumpStart Industry:Financial 示例笔记本

SageMaker JumpStart Industry:Financial 提供了以下示例笔记本,用来演示针对行业关注的 ML 问题的解决方案:

注意

示例笔记本仅用于演示目的。不应将其作为财务或投资建议。

注意

SageMaker JumpStart Industry:Financial 解决方案、模型卡和示例笔记本只能通过 SageMaker Studio 托管和运行。登录 SageMaker 控制台,然后启动 SageMaker Studio。有关如何查找示例笔记本的更多信息,请参阅上一主题:SageMaker JumpStart

要预览示例笔记本的内容,请参阅 SageMaker JumpStart Industry Python SDK 文档中的教程 – 金融业

Amazon SageMaker JumpStart Industry:Financial 博客文章

有关使用 SageMaker JumpStart Industry:Financial 解决方案、模型、示例和 SDK 的全面应用,请参阅以下博客文章:

Amazon SageMaker JumpStart Industry:Financial 相关研究

有关与 SageMaker JumpStart Industry:Financial 解决方案相关的研究,请参阅以下论文:

Amazon SageMaker JumpStart Industry:Financial 其他资源

有关其他文档和教程,请参阅以下资源: