Amazon SageMaker R 用户指南 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon SageMaker R 用户指南

本文档将介绍使用 R 以利用 Amazon SageMaker 特征的各种方法。本指南介绍了 SageMaker 的内置 R 内核,介绍了如何开始使用 SageMaker 上的 R,并最后介绍了几个示例笔记本。

这些示例分为三个级别:初级、中级和高级。它们从开始使用 SageMaker 上的 R 开始,使用 SageMaker 上的 R 进行端到端机器学习,然后以更高级的主题结束,例如使用 R 脚本的 SageMaker Processing 以及 SageMaker 的自带 (BYO) R 算法。 

有关如何将自己的自定义 R 映像带入 Studio 中的信息,请参阅自带 SageMaker 映像。有关类似的博客文章,请参阅将自己的 R 环境带入 Amazon SageMaker Studio 中

SageMaker 中的 RStudio 支持

Amazon SageMaker 支持将 RStudio 作为与 Amazon SageMaker 域集成的完全托管的集成开发环境 (IDE)。通过 RStudio 集成,您可以在域中启动 RStudio 环境,用于在 SageMaker 资源上运行 RStudio 工作流。有关更多信息,请参阅 RStudio on Amazon SageMaker

SageMaker 中的 R 内核

SageMaker 笔记本实例使用预装的 R 内核支持 R。此外,R 内核还具有 reticulate 库,这是 R 到 Python 的接口,因此,您可以从 R 脚本中使用 SageMaker Python SDK 的特征。

SageMaker 中的 R 入门

  •  使用 t2.medium 实例类型和默认存储大小创建笔记本实例。如果您打算继续将该实例用于更高级的示例,或者以后创建更大的实例,您可以选择更快的实例和更多的存储空间。

  • 等到笔记本状态变为“In Service”(正在使用),然后单击 Open Jupyter (打开 Jupyter)。

  • 从可用的环境列表中创建一个具有 R 内核的新笔记本。 

  • 在创建了新的笔记本时,您将会在笔记本环境的右上角看到 R 徽标,并且还会在该徽标下看到内核为 R。这表明 SageMaker 已成功为该笔记本启动 R 内核。

  • 或者,在您位于 Jupyter 笔记本时,您可以使用 Kernel (内核) 菜单,然后从 Change Kernel (更改内核) 选项中选择 R。

示例笔记本

先决条件

SageMaker 上的 R 入门:该示例笔记本介绍了如何使用 Amazon SageMaker 的 R 内核开发 R 脚本。在此笔记本中,您可以设置 SageMaker 环境和权限,从 UCI 机器学习存储库下载鲍鱼数据集,对数据进行一些基本处理和可视化,然后将数据以 .csv 格式保存到 S3。

初级

使用 R 内核进行 SageMaker 批量转换:该示例笔记本介绍了如何使用 SageMaker 的 Transformer API 和 XGBoost 算法执行批量转换作业。该笔记本还使用 Abalone 数据集。

中级

R 中的 XGBoost 超参数优化:该示例笔记本扩展了前面使用鲍鱼数据集和 XGBoost 的初级笔记本。它介绍了如何使用超参数优化进行模型优化。您还会了解如何使用批量转换进行批量预测,以及如何创建模型端点以进行实时预测。 

使用 R 的 Amazon SageMaker Processing:通过使用 SageMaker Processing,您可以预处理、后处理和运行模型评估工作负载。该示例说明了如何创建 R 脚本以编排处理作业。 

高级

在 SageMaker 中训练和部署您自己的 R 算法:您是否已具有 R 算法,并且要将其添加到 SageMaker 以优化、训练或部署该算法? 该示例介绍了如何使用自定义 R 程序包自定义 SageMaker 容器,一直到使用托管的端点推断 R 源模型。