配方步骤和功能参考 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

配方步骤和功能参考

在本参考中,您可以从Amazon CLI或者使用其中一个Amazon开发工具包。在 DatabreW 中,配方步骤是一种将原始数据转换为可供数据管道使用的表单的操作。DataBrew功能是一种基于参数执行计算的特殊配方步骤。

用户界面中的转换类别包括以下内容:

  • 基本栏食谱步骤

    • 筛选

  • 数据清理食谱步骤

    • 格式

    • 清除

    • 提取

  • 数据质量食谱步骤

    • Missing

    • 无效

    • 重复

    • 异常值

  • 个人身份识别信息 (PII) 食谱步骤

    • 遮罩个人信息

    • 替换个人信息

    • 加密个人信息

    • 随机排序

  • 列结构配方步骤

    • Split

    • 合并

    • 创建

  • 列格式化处方步骤

    • 小数精度

    • 千位分隔符

    • 缩短数字

  • 数据结构配方步骤

    • 巢 Unnest

    • Pivot

    • 加入

    • 联盟

  • 数据科学食谱步骤

    • 文本

    • Scale

    • 映射

    • 编码

  • 函数

    • 数学函数

    • 聚合函数

    • 文本函数

    • 日期和时间函数

    • 窗口函数

    • Web 函数

    • 其他函数

有关如何在配方中使用这些配方步骤和函数的详细信息(包括使用条件表达式),请参阅定义配方结构.

以下各节介绍了配方步骤和功能,按照它们的工作进行组织。