在 Amazon EKS 集群上启用应用程序
CloudWatch Application Signals 支持 Java、Python、Node.js 和 .NET 应用程序。您可以使用 Amazon Web Services 管理控制台、Amazon CDK 或 CloudWatch 可观测性附加组件的“自动监控”高级配置,为现有 Amazon EKS 集群上的应用程序启用 Application Signals。
主题
使用控制台在 Amazon EKS 集群上启用 Application Signals
要在现有 Amazon EKS 集群的应用程序上启用 CloudWatch Application Signals,请按照本节中的说明进行操作。
重要
如果您已经在打算为 Application Signals 启用的应用程序中使用 OpenTelemetry,请在启用 Application Signals 之前参阅 支持的系统。
为现有 Amazon EKS 集群上的应用程序启用 Application Signals
注意
如果还没有启用 Application Signals,请按照在账户中启用 Application Signals中的说明操作,然后完成以下程序。
通过 https://console.aws.amazon.com/cloudwatch/
打开 CloudWatch 控制台。 选择 Application Signals。
在指定平台中,选择 EKS。
在选择 EKS 集群中,选择要在其中启用 Application Signals 的集群。
如果此集群尚未启用 Amazon CloudWatch Observability EKS 附加组件,则系统会提示您将其启用。在这种情况下,请执行以下操作:
选择添加 CloudWatch Observability EKS 附加组件。Amazon EKS 控制台出现。
选中 Amazon CloudWatch Observability 对应的复选框,然后选择下一步。
CloudWatch Observability EKS 附加组件启用 Application Signals 和 CloudWatch Container Insights,从而增强 Amazon EKS 的可观测性。有关安装 Container Insights 的更多信息,请参阅 Container Insights。
选择要安装的最新版本的附加组件。
选择要用于附加组件的 IAM 角色。如果您选择从节点继承,请将正确的权限附加到您的 Worker 节点使用的 IAM 角色。将
my-worker-node-role替换为您的 Kubernetes Worker 节点使用的 IAM 角色。aws iam attach-role-policy \ --role-namemy-worker-node-role\ --policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy \ --policy-arn arn:aws:iam::aws:policy/AWSXRayWriteOnlyAccess如果您想要创建服务角色以使用附加组件,请参阅 使用 Amazon CloudWatch Observability EKS 附加组件或 Helm 图表安装 CloudWatch 代理。
选择下一步,确认屏幕上的信息,然后选择创建。
在下一个屏幕中,选择启用 CloudWatch Application Signals 以返回 CloudWatch 控制台并完成该过程。
-
有两个选项可以为您的应用程序启用 Application Signals。为保持一致性,建议您为每个集群选择一个选项。
控制台选项更简单。使用此方法会导致您的容器组(pod)立即重启。
注释清单文件方法可以让您更好地控制容器组(pod)何时重启;如果您不想集中监控,还可以帮助您以更分散的方式管理监控。
注意
要为使用 ESM 的 Node.js 应用程序启用 Application Signals,改为跳转到设置采用 ESM 模块格式的 Node.js 应用程序。
选择完成后查看服务。这将带您进入 Application Signals 服务视图,您可以在其中查看 Application Signals 正在收集的数据。可能需要几分钟才会显示数据。
要在另一个 Amazon EKS 集群中启用 Application Signals,请从服务屏幕中选择启用 Application Signals。
有关服务视图的更多信息,请参阅 使用 Application Signals 监控应用程序的运行状况。
注意
如果您在 Python 应用程序中使用 WSGI 服务器,请参阅使用 WSGI 服务器的 Python 应用程序没有 Application Signals 数据以获取有关使 Application Signals 起作用的信息。
我们也已经明确在为 Application Signals 启用 Python 应用程序时应注意的其他注意事项。有关更多信息,请参阅 启用 Application Signals 后,Python 应用程序无法启动。
设置采用 ESM 模块格式的 Node.js 应用程序
我们对采用 ESM 模块格式的 Node.js 应用程序提供有限的支持。有关更多信息,请参阅 使用 ESM 的 Node.js 的已知限制。
对于 ESM 模块格式,通过控制台或通过注释清单文件来启用 Application Signals 不起作用。跳过之前程序的步骤 8,改为执行以下操作。
为使用 ESM 的 Node.js 应用程序启用 Application Signals
将相关依赖项安装到您的 Node.js 应用程序中以进行自动检测:
npm install @aws/aws-distro-opentelemetry-node-autoinstrumentation npm install @opentelemetry/instrumentation@0.54.0将以下环境变量添加到应用程序的 Dockerfile 中并构建映像。
... ENV OTEL_AWS_APPLICATION_SIGNALS_ENABLED=true ENV OTEL_TRACES_SAMPLER_ARG='endpoint=http://cloudwatch-agent.amazon-cloudwatch:2000' ENV OTEL_TRACES_SAMPLER='xray' ENV OTEL_EXPORTER_OTLP_PROTOCOL='http/protobuf' ENV OTEL_EXPORTER_OTLP_TRACES_ENDPOINT='http://cloudwatch-agent.amazon-cloudwatch:4316/v1/traces' ENV OTEL_AWS_APPLICATION_SIGNALS_EXPORTER_ENDPOINT='http://cloudwatch-agent.amazon-cloudwatch:4316/v1/metrics' ENV OTEL_METRICS_EXPORTER='none' ENV OTEL_LOGS_EXPORTER='none' ENV NODE_OPTIONS='--import @aws/aws-distro-opentelemetry-node-autoinstrumentation/register --experimental-loader=@opentelemetry/instrumentation/hook.mjs' ENV OTEL_SERVICE_NAME='YOUR_SERVICE_NAME' #replace with a proper service name ENV OTEL_PROPAGATORS='tracecontext,baggage,b3,xray' ... # command to start the application # for example # CMD ["node", "index.mjs"]将环境变量
OTEL_RESOURCE_ATTRIBUTES_POD_NAME、OTEL_RESOURCE_ATTRIBUTES_NODE_NAME、OTEL_RESOURCE_ATTRIBUTES_DEPLOYMENT_NAME、POD_NAMESPACE和OTEL_RESOURCE_ATTRIBUTES添加到应用程序的部署 yaml 文件中。例如:apiVersion: apps/v1 kind: Deployment metadata: name: nodejs-app labels: app: nodejs-app spec: replicas: 2 selector: matchLabels: app: nodejs-app template: metadata: labels: app: nodejs-app # annotations: # make sure this annotation doesn't exit # instrumentation.opentelemetry.io/inject-nodejs: 'true' spec: containers: - name: nodejs-app image:your-nodejs-application-image#replace with a proper image uri imagePullPolicy: Always ports: - containerPort: 8000 env: - name: OTEL_RESOURCE_ATTRIBUTES_POD_NAME valueFrom: fieldRef: fieldPath: metadata.name - name: OTEL_RESOURCE_ATTRIBUTES_NODE_NAME valueFrom: fieldRef: fieldPath: spec.nodeName - name: OTEL_RESOURCE_ATTRIBUTES_DEPLOYMENT_NAME valueFrom: fieldRef: fieldPath: metadata.labels['app'] # Assuming 'app' label is set to the deployment name - name: POD_NAMESPACE valueFrom: fieldRef: fieldPath: metadata.namespace - name: OTEL_RESOURCE_ATTRIBUTES value: "k8s.deployment.name=$(OTEL_RESOURCE_ATTRIBUTES_DEPLOYMENT_NAME),k8s.namespace.name=$(POD_NAMESPACE),k8s.node.name=$(OTEL_RESOURCE_ATTRIBUTES_NODE_NAME),k8s.pod.name=$(OTEL_RESOURCE_ATTRIBUTES_POD_NAME)"将 Node.js 应用程序部署到集群。
在 Amazon EKS 集群上启用应用程序后,就可以监控应用程序的运行状况。有关更多信息,请参阅 使用 Application Signals 监控应用程序的运行状况。
使用 CloudWatch 可观测性附加组件的高级配置在 Amazon EKS 集群上启用 Application Signals
默认情况下,在安装 CloudWatch 可观测性 EKS 附加组件(V5.0.0 或更高版本)或 Helm 图表时,会通过 Application Signals 启用基于 OpenTelemetry(OTEL)的应用程序性能监控(APM)。您可以使用 Amazon EKS 附加组件的高级配置或通过 Helm 图表覆盖值,进一步自定义特定设置。
注意
如果您使用任何基于 OpenTelemetry(OTEL)的 APM 解决方案,启用 Application Signals 将会影响现有的可观测性设置。在继续操作之前,先检查当前的实施情况。若需在升级到 5.0.0 及更高版本后保留原有 APM 配置,请参阅选择退出 Application Signals。
CloudWatch 可观测性附加组件还提供了额外的精细控制功能,可根据需要在新的高级配置中包含或排除特定服务。有关更多信息,请参阅 通过 Application Signals 为 Amazon EKS 集群启用 APM。
使用 Amazon CDK 在 Amazon EKS 上启用 Application Signals
如果您尚未在此账户中启用 Application Signals,则必须向 Application Signals 授予发现您的服务所需的权限。请参阅在账户中启用 Application Signals。
为您的应用程序启用 Application Signals。
import { aws_applicationsignals as applicationsignals } from 'aws-cdk-lib'; const cfnDiscovery = new applicationsignals.CfnDiscovery(this, 'ApplicationSignalsServiceRole', { } );Discovery CloudFormation 资源授予 Application Signals 下列权限:
-
xray:GetServiceGraph -
logs:StartQuery -
logs:GetQueryResults -
cloudwatch:GetMetricData -
cloudwatch:ListMetrics -
tag:GetResources
有关该角色的更多信息,请参阅CloudWatch Application Signals 的服务相关角色权限。
-
安装
amazon-cloudwatch-observability插件。使用
CloudWatchAgentServerPolicy以及与集群关联的 OIDC 创建 IAM 角色。const cloudwatchRole = new Role(this, 'CloudWatchAgentAddOnRole', { assumedBy: new OpenIdConnectPrincipal(cluster.openIdConnectProvider), managedPolicies: [ManagedPolicy.fromAwsManagedPolicyName('CloudWatchAgentServerPolicy')], });
使用上面创建的 IAM 角色安装附加组件。
new CfnAddon(this, 'CloudWatchAddon', { addonName: 'amazon-cloudwatch-observability', clusterName: cluster.clusterName, serviceAccountRoleArn: cloudwatchRole.roleArn });将其中一行添加到工作负载清单文件的
PodTemplate部分。语言 文件 Java
instrumentation.opentelemetry.io/inject-java: "true"
Python
instrumentation.opentelemetry.io/inject-python: "true"
.Net
instrumentation.opentelemetry.io/inject-dotnet: "true"
Node.js
instrumentation.opentelemetry.io/inject-nodejs: "true"
const deployment = { apiVersion: "apps/v1", kind: "Deployment", metadata: { name: "sample-app" }, spec: { replicas: 3, selector: { matchLabels: { "app": "sample-app" } }, template: { metadata: { labels: { "app": "sample-app" }, annotations: { "instrumentation.opentelemetry.io/inject-$LANG": "true" } }, spec: {...}, }, }, }; cluster.addManifest('sample-app', deployment)
使用模型上下文协议(MCP)服务器在 Amazon EKS 上启用 Application Signals
您可以使用 CloudWatch Application Signals 模型上下文协议(MCP)服务器,通过对话式人工智能交互在 Amazon EKS 集群上启用 Application Signals。这为设置 Application Signals 监控提供了自然语言界面。
MCP 服务器通过理解您的需求并生成相应的配置来自动执行启用过程。您只需简单描述要启用的功能,无需手动执行控制台步骤或编写 CDK 代码。
先决条件
在使用 MCP 服务器启用 Application Signals 之前,请确保满足以下条件:
支持 MCP 的开发环境(例如 Kiro、Claude Desktop、带有 MCP 扩展的 VSCode 或其他与 MCP 兼容的工具)
已在 IDE 中配置 CloudWatch Application Signals MCP 服务器。有关详细的设置说明,请参阅 CloudWatch Application Signals MCP 服务器文档
。
使用 MCP 服务器
在 IDE 中配置好 CloudWatch Application Signals MCP 服务器后,即可使用自然语言提示来请求启用指导。尽管编码助手可以从项目结构中推断出上下文,但在提示中提供具体细节有助于确保获得更准确、更相关的指导。包含一些信息,例如应用程序语言、Amazon EKS 集群名称以及基础设施和应用程序代码的绝对路径等等。
最佳实践提示(具体且完整):
"Enable Application Signals for my Python service running on EKS. My app code is in /home/user/flask-api and IaC is in /home/user/flask-api/terraform" "I want to add observability to my Node.js application on EKS cluster 'production-cluster'. The application code is at /Users/dev/checkout-service and the Kubernetes manifests are at /Users/dev/checkout-service/k8s" "Help me instrument my Java Spring Boot application on EKS with Application Signals. Application directory: /opt/apps/payment-api CDK infrastructure: /opt/apps/payment-api/cdk"
效果较差的提示:
"Enable monitoring for my app" → Missing: platform, language, paths "Enable Application Signals. My code is in ./src and IaC is in ./infrastructure" → Problem: Relative paths instead of absolute paths "Enable Application Signals for my EKS service at /home/user/myapp" → Missing: programming language
快速模板:
"Enable Application Signals for my [LANGUAGE] service on EKS. App code: [ABSOLUTE_PATH_TO_APP] IaC code: [ABSOLUTE_PATH_TO_IAC]"
使用 MCP 服务器的优势
使用 CloudWatch Application Signals MCP 服务器具有以下优势:
自然语言界面:无需记住命令或配置语法,即可描述要启用的功能
上下文感知指导:MCP 服务器了解特定环境并提供量身定制的建议
减少错误:自动生成配置可最大限度地减少手动输入错误
更快设置:更快地将想法过渡到实施
学习工具:查看生成的配置,了解 Application Signals 的工作原理
有关配置和使用 CloudWatch Application Signals MCP 服务器的更多信息,请参阅 MCP 服务器文档