使用 SageMaker 内置算法 - 亚马逊 SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

如果我们为英文版本指南提供翻译,那么如果存在任何冲突,将以英文版本指南为准。在提供翻译时使用机器翻译。

使用 SageMaker 内置算法

机器学习算法使用示例数据创建一个通用解决方案 (模型) 来处理您努力回答的业务问题。在使用示例数据创建模型后,您可以使用它来回答针对一组新数据的相同业务问题。这也称作获得推理结果。

SageMaker 提供了多种内置的机器学习算法,可供您用于各种问题类型。

由于您创建模型来处理业务问题,因此,您的第一步是了解要解决的问题。具体而言,您要查找的答案的格式将影响您选择的算法。例如,假设您是银行的营销经理,并且您想开展直邮活动来吸引新客户。考虑您要查找的答案的潜在类型:

  • 适合离散类别的答案 — 例如,以下问题的答案:

     

    • “根据过去的客户响应,我是否应向此特定客户寄送邮件?” 此问题的答案分为两类:“是”或“否”。在此情况下,您使用答案来缩小邮件活动的收件人范围。

       

    • “根据过去的客户细分,此客户将归入哪个类别?” 答案可能归为以下类别,例如“空巢者”、“郊区家庭”或“城市专业人员”。您可以使用这些分类来决定邮件接收者。

       

    对于此类离散分类问题,SageMaker 提供了两种算法:线性学习器算法XGBoost 算法。您可以设置以下超级参数来指示这些算法生成离散结果:

     

    • 对于线性学习器算法,请将 predictor_type 超级参数设置为 binary_classifier

       

    • 对于 XGBoost 算法,设置 objective 超参数至 reg:logistic.

     

  • 定量答案—考虑这个问题: “根据过去邮寄的投资回报率(ROI),邮寄该客户的投资回报率是多少?” 在此情况下,您使用 ROI 来确立邮件活动的目标客户。对于这些定量分析问题,您还可以使用 线性学习器算法XGBoost 算法 算法。您可以设置以下超级参数来指示这些算法生成定量结果:

     

    • 对于线性学习器算法,请将 predictor_type 超级参数设置为 regressor

       

    • 对于 XGBoost 算法,设置 objective 超参数至 reg:linear.

     

  • 以离散推荐的形式回答—考虑这个问题: 根据过去对邮件的回复,每个客户的建议内容是什么? 在此情况下,您正在寻找有关向客户寄送的邮件内容的建议,而不是是否向客户寄送邮件。对于此问题,SageMaker 提供了 因子分解机算法 算法。

     

前面的示例中的所有问题都依赖于包含答案的示例数据。有时,您不需要或者无法获得包含答案的示例数据。这适用于其答案标识组的问题。例如:

  • “我想根据当前客户和潜在客户的属性将这些客户分成 10 组。我应该如何将它们分组?英寸 您可以选择将邮件寄送给拥有最高当前客户百分比的组中的客户。也就是说,根据同一组属性,与当前客户最接近的潜在客户。对于此类问题,SageMaker 提供了 K-Means 算法

     

  • “区分这些客户的特征是什么,以及在这些维度上每个客户的价值是什么。” 您使用这些答案来简化当前和潜在客户的视图,或者是更好地理解这些客户属性。对于此类问题,SageMaker 提供了 主成分分析 (PCA) 算法 算法。

除了这些通用算法之外,SageMaker 还提供了专用于特定使用案例的算法。包括: