亚马逊 Data Firehose 以前被称为亚马逊 Kinesis Data Firehose
本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
对亚马逊数据 Firehose 进行故障排除
如果 Firehose 在传送或处理数据时遇到错误,它会重试,直到配置的重试持续时间到期。如果重试持续时间在成功传输数据之前结束,Firehose 会将数据备份到配置的 S3 备份存储桶。如果目标是 Amazon S3 且交付失败,或者向备份 S3 存储桶交付失败,Firehose 会继续重试,直到保留期结束。对于直播DirectPut
流,Firehose 会将记录保留 24 小时。对于其数据来源为 Kinesis 数据流的传输流,您可以按照更改数据留存期中的说明更改保留期。
如果数据源是 Kinesis 数据流,Firehose 会无限期地重试以下操作:、和。DescribeStream
GetRecords
GetShardIterator
如果传输流使用 DirectPut
,请检查 IncomingBytes
和 IncomingRecords
指标,查看是否有传入流量。如果您正在使用 PutRecord
或 PutRecordBatch
,请务必捕获异常并重试。我们建议使用带指数退避的重试策略,并且提供抖动和多次重试功能。此外,如果您使用 PutRecordBatch
API,请确保您的代码检查响应FailedPutCount中的值,即使 API 调用成功也是如此。
如果传输流使用 Kinesis 数据流作为源,请检查源数据流的 IncomingBytes
和 IncomingRecords
指标。此外,请确保为传输流发出 DataReadFromKinesisStream.Bytes
和 DataReadFromKinesisStream.Records
指标。
有关使用追踪配送错误的信息 CloudWatch,请参阅使用日志监控亚马逊数据 Firehose CloudWatch 。