Amazon SageMaker R 用户指南 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon SageMaker R 用户指南

该文档介绍了使用 R 以利用 Amazon SageMaker 功能的各种方法。该指南介绍了 SageMaker 的内置 R 内核,介绍了如何在 SageMaker 上开始使用 R,并最后介绍了几个示例笔记本。

这些示例分为三个级别:初级、中级和高级。他们从SageMaker 上的 R 入门中,在 SageMaker 上使用 R 进行端到端机器学习,然后以更高级的主题结束,例如使用 R 脚本的 SageMaker 处理以及的自带 (BYO) R 算法。 

有关如何将自己的自定义 R 图像带到 Studio 的信息,请参阅自带 SageMaker 图像. 有关类似的博客文章,请参阅将自己的 R 环境带到 Amazon SageMaker Studio.

SageMaker 中的 rStudio Support

Amazon SageMaker 支持 rStudio 作为与 Amazon SageMaker 域集成的完全托管的集成开发环境 (IDE)。借助 rStudio 集成,您可以在域中启动 rStudio 环境,以便在 SageMaker 资源上运行 rStudio 工作流程。有关更多信息,请参阅 Amazon SageMaker 上的 rStudio

SageMaker 中的 R 内核

使用预装的 R 内核 SageMaker 笔记本实例支持 R。此外,R 内核具有网状库,这是 R 到 Python 的接口,因此,您可以从 R 脚本中使用 SageMaker Python 开发工具包的功能。

在 SageMaker 中开始使用 R

  •  使用 t2.medium 实例类型和默认存储大小创建笔记本实例。如果您打算继续将该实例用于更高级的示例,或者以后创建更大的实例,您可以选择更快的实例和更多的存储空间。

  • 等到笔记本状态变为“In Service”(正在使用),然后单击 Open Jupyter (打开 Jupyter)。

  • 从可用的环境列表中创建一个具有 R 内核的新笔记本。 

  • 在创建了新的笔记本时,您将会在笔记本环境的右上角看到 R 徽标,并且还会在该徽标下看到内核为 R。这表明 SageMaker 已成功为该笔记本启动 R 内核。

  • 或者,在您位于 Jupyter 笔记本时,您可以使用 Kernel (内核) 菜单,然后从 Change Kernel (更改内核) 选项中选择 R。

示例笔记本

先决条件

SageMaker 上的 R 入门:该示例笔记本介绍了如何使用 Amazon SageMaker R 内核开发 R 脚本。在本笔记本中,您可以设置 SageMaker 环境和权限,下载鲍鱼数据集来自 的UCI Machine Learning 存储库,对数据执行一些基本的处理和可视化,然后将数据另存为 .csv 格式到 S3。

初级

使用 R 内核 SageMaker Batch 转换:该示例笔记本介绍了如何使用 SageMaker 的转换器 API 和XGBoost 算法。 该笔记本也使用鲍鱼数据集。

中级

R 中 xgBoost 的超参数优化:该示例笔记本扩展了以前使用鲍鱼数据集和 XGBoost 的初级笔记本。它介绍了如何使用模型调整超参数优化。 您还会了解如何使用批量转换进行批量预测,以及如何创建模型终端节点以进行实时预测。 

Amazon SageMaker 与 R 进行处理SageMaker 处理您可以预处理、后处理和运行模型评估工作负载。该示例说明了如何创建 R 脚本以编排处理作业。 

高级

在 SageMaker 中训练和部署自己的 R 算法:您是否已具有 R 算法,并且想将它引入 SageMaker 以优化、训练或部署它? 该示例介绍了如何使用自定义 R 程序包自定义 SageMaker 容器,一直到使用托管终端节点推断 R 源模型。