Amazon SageMaker JumpStart Industry:Financial
使用 SageMaker JumpStart Industry:Financial 解决方案、模型和示例笔记本,通过针对行业关注的机器学习 (ML) 问题精心设计的一步到位解决方案和示例笔记本,了解 SageMaker 的特性和功能。这些笔记本还介绍了如何使用 SageMaker JumpStart Industry Python SDK 来增强行业文本数据并微调预训练模型。
主题
- Amazon SageMaker JumpStart Industry Python SDK
- Amazon SageMaker JumpStart Industry:Financial 解决方案
- Amazon SageMaker JumpStart Industry:Financial 模型
- Amazon SageMaker JumpStart Industry:Financial 示例笔记本
- Amazon SageMaker JumpStart Industry:Financial 博客文章
- Amazon SageMaker JumpStart Industry:Financial 相关研究
- Amazon SageMaker JumpStart Industry:Financial 其他资源
Amazon SageMaker JumpStart Industry Python SDK
SageMaker JumpStart 通过名为 SageMaker JumpStart Industry Python SDK 的客户库,提供了用于管理行业数据集和微调预训练模型的处理工具。有关 SDK 的详细 API 文档,以及要了解有关处理和增强行业文本数据集以在 SageMaker JumpStart 上改善先进模型性能的更多信息,请参阅 SageMaker JumpStart Industry Python SDK 开源文档
Amazon SageMaker JumpStart Industry:Financial 解决方案
SageMaker JumpStart Industry:Financial 提供以下解决方案笔记本:
-
企业信用评级预测
此 SageMaker JumpStart Industry:Financial 解决方案提供了用于文本增强型企业信用评级模型的模板。它展示了如何根据数字特征(在本例中为 Altman 著名的 5 个财务比率)与 SEC 申报文件中的文本相结合的模型,来改善信用评级的预测。除了 5 个 Altman 比率之外,您还可以根据需要添加更多变量或设置自定义变量。本解决方案笔记本展示了 SageMaker JumpStart Industry Python SDK 如何帮助处理 SEC 申报文件中文本的自然语言处理 (NLP) 评分。此外,该解决方案还演示了如何使用增强数据集来训练模型以获得先进的模型,将模型部署到 SageMaker 端点用于生产,以及如何实时接收改进的预测。
-
基于图形的信用评分
传统上,信用评级是通过使用财务报表数据和市场数据的模型生成的,这些数据仅为表格数据(数字和类别)。该解决方案使用 SEC 申报文件
注意
解决方案笔记本仅用于演示目的。不应将其作为财务或投资建议。
您可以通过 Studio 中的 SageMaker JumpStart 页面找到这些金融服务解决方案。
注意
SageMaker JumpStart Industry:Financial 解决方案、模型卡和示例笔记本只能通过 SageMaker Studio 托管和运行。登录 SageMaker 控制台
Amazon SageMaker JumpStart Industry:Financial 模型
SageMaker JumpStart Industry:Financial 提供以下预训练的 Robustly Optimized BERT 方法 (RoBERTa)
-
Financial Text Embedding (RoBERTa-SEC-Base)
-
RoBERTa-SEC-WIKI-Base
-
RoBERTa-SEC-Large
-
RoBERTa-SEC-WIKI-Large
RoBERTa-SEC-Base 和 RoBERTa-SEC-Large 模型是文本嵌入模型,基于 GluonNLP 的 RoBERTa 模型
您可以在 SageMaker JumpStart 中,通过导航到文本模型节点,选择搜索所有文本模型,然后筛选 ML 任务文本嵌入来查找这些模型。选择所选模型后,您可以访问任何对应的笔记本。配对的笔记本将引导您了解如何在多模式数据集上,针对特定分类任务对预训练模型进行微调,SageMaker JumpStart Industry Python SDK 增强了这些模型。
注意
模型笔记本仅用于演示目的。不应将其作为财务或投资建议。
以下屏幕截图显示了 Studio 上的 SageMaker JumpStart 页面所提供的预训练模型卡。
注意
SageMaker JumpStart Industry:Financial 解决方案、模型卡和示例笔记本只能通过 SageMaker Studio 托管和运行。登录 SageMaker 控制台
Amazon SageMaker JumpStart Industry:Financial 示例笔记本
SageMaker JumpStart Industry:Financial 提供了以下示例笔记本,用来演示针对行业关注的 ML 问题的解决方案:
-
Financial TabText 数据构造 – 本示例介绍了如何使用 SageMaker JumpStart Industry Python SDK 来处理 SEC 申报文件,例如基于 NLP 分数类型及其相应词汇表的文本摘要和评分文本。要预览此笔记本的内容,请参阅根据 SEC 申报文件的多模式数据集和 NLP 分数简单地进行构建
。 -
TabText 数据上的多模式 ML – 此示例演示如何将不同类型的数据集合并到名为 TabText 的单个数据框中并执行多模式 ML。要预览此笔记本的内容,请参阅 TabText 数据框上的机器学习 – 基于薪水保障计划的示例
-
SEC 申报文件数据上的多类别 ML – 此示例演示如何在从 SEC 申报文件编纂的多模式 (TabText) 数据集上训练 AutoGluon NLP 模型,以执行多类分类任务。根据 MDNA 文本列将 SEC 10K/Q 身份文件按行业代码分类
。
注意
示例笔记本仅用于演示目的。不应将其作为财务或投资建议。
注意
SageMaker JumpStart Industry:Financial 解决方案、模型卡和示例笔记本只能通过 SageMaker Studio 托管和运行。登录 SageMaker 控制台
要预览示例笔记本的内容,请参阅 SageMaker JumpStart Industry Python SDK 文档中的教程 – 金融业
Amazon SageMaker JumpStart Industry:Financial 博客文章
有关使用 SageMaker JumpStart Industry:Financial 解决方案、模型、示例和 SDK 的全面应用,请参阅以下博客文章:
Amazon SageMaker JumpStart Industry:Financial 相关研究
有关与 SageMaker JumpStart Industry:Financial 解决方案相关的研究,请参阅以下论文:
Amazon SageMaker JumpStart Industry:Financial 其他资源
有关其他文档和教程,请参阅以下资源: