统计方差和偏差函数 - Amazon Kinesis Data Analytics SQL 参考
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

统计方差和偏差函数

这些函数都接受一组数字,忽略 null,并且既可用作聚合函数,也可用作分析函数。有关更多信息,请参阅聚合函数分析函数

下表列出了这些函数之间的关系。

函数目的 函数名称 公式 评论

热点

HOTSPOTS (expr)

检测数据流中频繁出现的数据的热点。

Random Cut Forest

RANDOM_CUT_FOREST (expr)

在数据流中检测异常。

随机砍伐森林以及解释

RANDOM_CUT_FOREST_WITH_EXPLANATION (expr)

检测数据流中的异常,并根据每列中的数据异常情况返回归因分数。

总体方差

VAR_POP(expr)

( SUM(expr*expr) - SUM(expr)*SUM(expr) / COUNT(expr)) / COUNT(expr)

如果应用于空集,则返回 null。

总体标准差

STDDEV_POP

总体方差的平方根 (VAR_POP)。

当 VAR_POP 返回 null 时,STDDEV_POP 返回 null。

样本方差

VAR_SAMP

(SUM(expr*expr) - SUM(expr)*SUM(expr) / COUNT(expr)) / (COUNT(expr)−1)

如果应用于空集,则返回 null。

如果应用于由一个元素组成的输入集,则 VAR_SAMP 返回 null。

样本标准差

STDDEV_SAMP (expr)

样本方差的平方根 (VAR_SAMP)。

如果仅应用于 1 行输入数据,则 STDDEV_SAMP 返回 null。