插值函数

如果时间序列数据在某些时间点存在事件缺失值，可通过插值法估计这些缺失事件的值。Amazon Timestream 支持四种插值变体：线性插值、三次样条插值、末次观测值结转（LOCF）插值以及常数插值。本节提供 LiveAnalytics插值函数的 Timestream 的用法信息以及示例查询。

使用情况信息

函数	输出数据类型	说明
`interpolate_linear(timeseries, array[timestamp])`	时间序列	使用线性插值填充缺失数据。
`interpolate_linear(timeseries, timestamp)`	double	使用线性插值填充缺失数据。
`interpolate_spline_cubic(timeseries, array[timestamp])`	时间序列	使用三次样条插值填充缺失数据。
`interpolate_spline_cubic(timeseries, timestamp)`	double	使用三次样条插值填充缺失数据。
`interpolate_locf(timeseries, array[timestamp])`	时间序列	使用上次采样值填充缺失数据。
`interpolate_locf(timeseries, timestamp)`	double	使用上次采样值填充缺失数据。
`interpolate_fill(timeseries, array[timestamp], double)`	时间序列	使用常量值填充缺失数据。
`interpolate_fill(timeseries, timestamp, double)`	double	使用常量值填充缺失数据。

查询示例

例

计算过去 2 小时内特定 EC2 主机的 CPU 平均利用率，按 30 秒间隔进行分箱，并使用线性插值填补缺失值：


WITH binned_timeseries AS (
SELECT hostname, BIN(time, 30s) AS binned_timestamp, ROUND(AVG(measure_value::double), 2) AS avg_cpu_utilization
FROM "sampleDB".DevOps
WHERE measure_name = 'cpu_utilization'
    AND hostname = 'host-Hovjv'
    AND time > ago(2h)
GROUP BY hostname, BIN(time, 30s)
), interpolated_timeseries AS (
SELECT hostname,
    INTERPOLATE_LINEAR(
        CREATE_TIME_SERIES(binned_timestamp, avg_cpu_utilization),
            SEQUENCE(min(binned_timestamp), max(binned_timestamp), 15s)) AS interpolated_avg_cpu_utilization
FROM binned_timeseries
GROUP BY hostname
)
SELECT time, ROUND(value, 2) AS interpolated_cpu
FROM interpolated_timeseries
CROSS JOIN UNNEST(interpolated_avg_cpu_utilization)

例

计算过去 2 小时内特定 EC2 主机的 CPU 平均利用率，按 30 秒间隔进行分箱，并使用基于末次观测值结转的插值填补缺失值：


WITH binned_timeseries AS (
SELECT hostname, BIN(time, 30s) AS binned_timestamp, ROUND(AVG(measure_value::double), 2) AS avg_cpu_utilization
FROM "sampleDB".DevOps
WHERE measure_name = 'cpu_utilization'
    AND hostname = 'host-Hovjv'
    AND time > ago(2h)
GROUP BY hostname, BIN(time, 30s)
), interpolated_timeseries AS (
SELECT hostname,
    INTERPOLATE_LOCF(
        CREATE_TIME_SERIES(binned_timestamp, avg_cpu_utilization),
            SEQUENCE(min(binned_timestamp), max(binned_timestamp), 15s)) AS interpolated_avg_cpu_utilization
FROM binned_timeseries
GROUP BY hostname
)
SELECT time, ROUND(value, 2) AS interpolated_cpu
FROM interpolated_timeseries
CROSS JOIN UNNEST(interpolated_avg_cpu_utilization)

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

时间序列函数

导数