本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
配方步骤和功能参考
在本参考中,您可以从Amazon CLI或者使用其中一个Amazon开发工具包。在 DatabreW 中,配方步骤是一种将原始数据转换为可供数据管道使用的表单的操作。DataBrew功能是一种基于参数执行计算的特殊配方步骤。
用户界面中的转换类别包括以下内容:
-
基本栏食谱步骤
-
筛选
-
列
-
-
数据清理食谱步骤
-
格式
-
清除
-
提取
-
-
数据质量食谱步骤
-
Missing
-
无效
-
重复
-
异常值
-
-
个人身份识别信息 (PII) 食谱步骤
-
遮罩个人信息
-
替换个人信息
-
加密个人信息
-
随机排序
-
-
列结构配方步骤
-
Split
-
合并
-
创建
-
-
列格式化处方步骤
-
小数精度
-
千位分隔符
-
缩短数字
-
-
数据结构配方步骤
-
巢 Unnest
-
Pivot
-
组
-
加入
-
联盟
-
-
数据科学食谱步骤
-
文本
-
Scale
-
映射
-
编码
-
-
函数
-
数学函数
-
聚合函数
-
文本函数
-
日期和时间函数
-
窗口函数
-
Web 函数
-
其他函数
-
有关如何在配方中使用这些配方步骤和函数的详细信息(包括使用条件表达式),请参阅定义配方结构.
以下各节介绍了配方步骤和功能,按照它们的工作进行组织。