R Amazon SageMaker 的 R 用户指南 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

R Amazon SageMaker 的 R 用户指南

该文档介绍了使用 R 以利用 Amazon SageMaker 功能的各种方法。该指南介绍了 SageMaker 的内置 R 内核,介绍了如何在 SageMaker 上开始使用 R,并最后介绍了几个示例笔记本。

这些示例分为三个级别:初级、中级和高级。他们从SageMaker 上的 R 入门,使用 SageMaker 上的 R 进行端到端机器学习,然后以更高级的主题结束,例如使用 R 脚本的 SageMaker 处理以及的自带 (BYO) R 算法。 

有关如何将自己的自定义 R 映像带到 Studio 的信息,请参阅自带 SageMaker 映像. 有关类似的博客文章,请参阅将您自己的 R 环境带到 Amazon SageMaker 工作室.

SageMaker 中的 R 内核

SageMaker 笔记本实例使用预装的 R 内核支持 R。此外,R 内核具有网状库,这是 R 到 Python 的接口,因此,您可以从 R 脚本中使用 SageMaker Python 开发工具包的功能。

SageMaker 中的 R 入门

  •  使用 t2.medium 实例类型和默认存储大小创建笔记本实例。如果您打算继续将该实例用于更高级的示例,或者以后创建更大的实例,您可以选择更快的实例和更多的存储空间。

  • 等到笔记本状态变为“In Service”(正在使用),然后单击 Open Jupyter (打开 Jupyter)。

  • 从可用的环境列表中创建一个具有 R 内核的新笔记本。 

  • 在创建了新的笔记本时,您将会在笔记本环境的右上角看到 R 徽标,并且还会在该徽标下看到内核为 R。这表明 SageMaker 已成功为该笔记本启动 R 内核。

  • 或者,在您位于 Jupyter 笔记本时,您可以使用 Kernel (内核) 菜单,然后从 Change Kernel (更改内核) 选项中选择 R。

示例笔记本

先决条件

SageMaker 上的 R 入门:该示例笔记本介绍了如何使用 Amazon SageMaker 的 R 内核开发 R 脚本。在此笔记本中,您可以设置 SageMaker 环境和权限,下载鲍鱼数据集来自 的UCI Machine Learning 库,对数据执行一些基本的处理和可视化,然后将数据保存为 .csv 格式到 S3。

初级

R 内核的 SageMaker Batch 转换:该示例笔记本介绍了如何使用 SageMaker 的 Transformer API 和XGBoost 算法。 该笔记本也使用鲍鱼数据集。

中级

R 中 XGBoost 的超参数优化: 此示例笔记本扩展了前面使用鲍鱼数据集和 XGBoost 的初级笔记本。它介绍了如何使用超参数优化。 您还会了解如何使用批量转换进行批量预测,以及如何创建模型终端节点以进行实时预测。 

Amazon SageMaker 使用 R 处理SageMaker 处理允许您预处理、后处理和运行模型评估工作负载。该示例说明了如何创建 R 脚本以编排处理作业。 

高级

在 SageMaker 中训练和部署您自己的 R 算法:您是否已具有 R 算法,并且要将其带入 SageMaker 以优化、训练或部署该算法? 该示例介绍了如何使用自定义 R 程序包自定义 SageMaker 容器,一直到使用托管的终端节点推断 R 源模型。