实时向量嵌入蓝图 - 故障排除 - Managed Service for Apache Flink
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon Managed Service for Apache Flink(Amazon MSF)之前称为 Amazon Kinesis Data Analytics for Apache Flink。

实时向量嵌入蓝图 - 故障排除

查看以下有关实时向量嵌入蓝图的故障排除主题。有关实时向量嵌入蓝图的更多信息,请参阅实时向量嵌入蓝图

我的 CloudFormation 堆栈部署失败或已回滚。我可以采取哪些行动来修复此问题?

  • 转到您的 CFN 堆栈并找到堆栈失败的原因。这可能与权限缺失、Amazon 资源名称冲突等原因有关。修复部署失败的根本原因。有关更多信息,另请参阅 CloudWatch 故障排除指南

  • [可选]每个 VPC 中的每个服务只能有一个 VPC 端点。如果您部署多个实时向量嵌入蓝图来写入同一 VPC 中的 Amazon OpenSearch Service 集合,则它们可能会共享 VPC 端点。它们可能已经存在于您的 VPC 账户中,或者第一个实时向量嵌入蓝图堆栈将为 Amazon Bedrock 和 Amazon OpenSearch Service 创建 VPC 端点,供您账户中部署的所有其他堆栈使用。如果堆栈出现故障,请检查该堆栈是否为 Amazon Bedrock 和 Amazon OpenSearch Service 创建 VPC 端点,如果这些端点未在您账户中的其他任何位置使用,则将其删除。有关删除 VPC 端点的步骤,请参阅如何安全地删除我的应用程序?(删除)

  • 您的账户中可能还有其他使用该 VPC 端点的服务或应用程序。删除该端点可能会导致其他服务的网络中断。删除这些端点时务必小心。

我不想让自己的应用程序从 Amazon MSK 主题的开头开始读取消息。我应该怎么办?

根据所需的行为,必须将 source.msk.starting.offset 显式设置为以下值之一:

  • 最早偏移量:分区中最早的偏移量。

  • 最新偏移量:使用者将从分区末端读取消息。

  • 提交的偏移量:从使用者在分区内处理的最后一条消息中读取。

如何知道 Managed Service for Apache Flink 应用程序是否存在问题,以及如何对其进行调试?

使用 Managed Service for Apache Flink 故障排除指南,调试与应用程序有关的 Managed Service for Apache Flink 问题。

我应该为自己的 Managed Service for Apache Flink 应用程序监控哪些关键指标?

  • 常规 Managed Service for Apache Flink 应用程序的所有可用指标都可以帮助您监控应用程序。有关更多信息,请参阅 Managed Service for Apache Flink 中的指标和维度

  • 要监控 Amazon Bedrock 指标,请参阅 Amazon Bedrock 的 Amazon CloudWatch 指标

  • 我们添加两个用于监控生成嵌入的性能的新指标。可在 CloudWatch 中的 EmbeddingGeneration 操作名称下找到它们。这两个指标是:

    • BedrockTitanEmbeddingTokenCount:向 Amazon Bedrock 发出的单个请求中存在的令牌数量。

    • BedrockEmbeddingGenerationLatencyMs:报告发送和接收来自 Amazon Bedrock 的生成嵌入相关响应所花费的时间,以毫秒为单位。

  • 对于 Amazon OpenSearch Service 无服务器集合,您可以使用诸如 IngestionDataRateIngestionDocumentErrors 之类的指标。有关更多信息,请参阅使用 Amazon CloudWatch 监控 OpenSearch Serverless

  • 有关 OpenSearch 预置指标,请参阅使用 Amazon CloudWatch 监控 OpenSearch 集群指标