排除 Amazon SMS 的故障 - Amazon Server Migration Service
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

产品更新

我们建议AmazonApplication Migration Service(AmazonMGN) 作为主要的迁移服务 lift-and-shift 迁移。如果AmazonMGN 在特定版本中不可用Amazon区域,你可以使用Amazon SMSAPI直到 2023 年 3 月。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

排除 Amazon SMS 的故障

以下信息可以帮助您解决与在使用 Amazon SMS 时可能遇到的错误相关的问题。在使用这些过程之前,请确认您的 SMS 设置和您尝试迁移的服务器满足Amazon Server Migration Service 的要求中的要求。

连接器的日志文件

服务器迁移连接器提供了日志文件,您可以使用这些文件对在完成上传到 Amazon S3 之前失败的复制作业进行故障排除。按照以下过程可下载连接器日志文件。

下载连接器日志文件

  1. 在 Web 浏览器中,输入连接器 VM 的 IP 地址。

  2. 登录连接器。

  3. 验证连接器是否通过了所有检查。

  4. 在下Support 链接,选择下载日志文件包.

  5. 提取日志文件包中的文件。

日志包中包括以下连接器日志文件:

  • connector.log— 检查连接器配置问题。

  • connectorsetup.log— 检查有关初始配置的详细信息。

  • frontend.log— 检查连接到的问题Amazon终端节点。

  • metrics.log— 检查吞吐量统计数据和上传速度(请参阅UploadStats)。

  • netstat.log— 检查网络数据包错误。

  • poller.log— 确认数据库轮询活动。

  • sms-replication-poller-log— 从验证复制作业到磁盘的审核活动将上传到 Amazon S3。例如,您可以按百分比验证上传进度,然后查看复制作业每个阶段的开始和结束。

注册连接器时失败

如果您在注册连接器时遇到问题,请联系sms-service@amazon.com.

将虚拟机上传到 Amazon S3 时出现证书错误

由于 VM 所在的 ESXi 主机出现 SSL 证书问题,连接器可能无法复制 VM。如果出现这种情况,您会看到在中显示以下错误消息。最新跑步的状态消息部分: “serveRerRror:无法将基本磁盘上传到 S3。请重试。如果问题仍存在,请联系AmazonSupport:vSphere 证书主机名不匹配:< 的证书somehost.somedomain.com> 与任何主题替代名称都不匹配:[localhost.local域名]。”

您可以通过完成以下任务来覆盖此 ESXi 主机证书问题:

升级连接器

本部分适用于手动升级连接器的客户。如果之前已配置自动升级,请跳过这些步骤并继续重新注册连接器

升级连接器

  1. 打开连接器控制台。

  2. 登录连接器。

  3. 选择 Upgrade

  4. 等待连接器完成升级到版本 1.0.11.13 或更高版本。

重新注册连接器

此部分适用于遇到证书不匹配问题的所有客户。

重新注册连接器

  1. 打开连接器控制台。

  2. 登录连接器。

  3. 一般 Health部分中,检查连接器版本是 1.0.11.13 或更高版本。

  4. 选择编辑Amazon Server Migration Service设置.

  5. 在存储库的设置页面,对于Amazon区域对于,从列表中选择所需区域。适用于Amazon凭证对于,输入您在的步骤 2 中创建的 IAM 访问密钥和私有密钥。设置指南. 选择 Next(下一步)。

  6. vCenter Service Account (vCenter 服务账户) 页面上,输入您在设置指南的步骤 3 中创建的 vCenter 主机名、用户名和密码。

  7. 选中 Ignore hostname mismatch and expiration errors for vCenter and ESXi certificates 复选框。选择 Next(下一步)。

  8. 完成注册并查看连接器配置控制面板。

  9. 使用Amazon SMS用于删除并重启出问题的复制作业的 CLI 或 API。

服务器迁移连接器无法连接到Amazon出现错误消息 “PKIX path 建设失败”

在有些客户环境中,为了便于审核和管理,会通过证书重新签名机制来代理安全的网络流量。这可能会导致Amazon在连接器尝试联系时,凭证将失败Amazon SMS. 错误消息包含“PKIX path building failed”,指示提供的证书无效。

为使连接器在此类环境中正常运行,必须将重新签名的证书 (您的组织信任并用来签署出站数据包的用户证书) 添加到连接器的信任存储中,如以下步骤所述。

将重新签名的证书添加到连接器信任存储中

  1. 在连接器系统中,使用以下命令禁用 FreeBSD 数据包筛选并启用 SSH:

    sudo service pf stop sudo service sshd onestart
  2. 通过类似如下的方法将用户证书复制到连接器:

    scp userCertFile ec2-user@10.0.0.100:/tmp/
  3. 将用户证书添加到信任存储:

    keytool -importcert -keystore /usr/local/amazon/connector/config/jetty/trustStore -storepass AwScOnNeCtOr -file /tmp/userCertFileName -alias userCertName
  4. 使用以下命令重启服务(Amazon Management Portal for vCenter 的一部分):

    sudo setup.rb

    选择选项 3 并键入“yes”。

  5. 重新启用数据包筛选:

    sudo service pf start

此 CA 根证书不受信任

当您访问安装在本地的虚拟机的 IP 地址时,您可能会收到以下消息:

This CA Root certificate is not trusted. To enable trust,
install this certificate in the Trusted Root Certifications
Authorities store.

您可以放心地忽略此消息。

在准备阶段复制运行失败

在某些情况下,Amazon SMS 允许复制作业继续调度增量复制运行,即使最新的复制运行失败也是如此。达到允许的最大连续失败次数时,将暂停复制作业的默认行为。该作业可在四天内恢复,之后将被删除。在这种情况下,来自最新复制运行的 Amazon EBS 快照将与客户账户共享,并发送失败复制运行的状态消息。该消息包含快照 ID 并说明失败的原因。典型的状态消息类似于以下内容:

EBS snapshot(s) created with snapshot ID(s): snap-12345678abcdefgh. Another run  
has been scheduled after the last run failed due to an import failure. 2 re-try run(s) 
remaining before the job will be failed.

复制运行失败(包括首次启动失败)的原因通常与 Amazon EC2 VM 导入/导出用于 VM 迁移时观察到的故障密切相关。有关更多信息,请参阅对 VM Import/Export 进行故障排除

如果您需要有关解决问题的进一步帮助,请联系 Amazon Web Services Support。迁移失败期间生成的 EBS 快照将与您的账户共享,并且快照 ID 包含在复制作业的状态消息中。联系时请务必提供这些详细信息AmazonSupport。

复制的 AMI 不支持某些实例类型进行启动

一些实例需要 ENA 支持。如果迁移不启用 ENA 支持,则复制的 AMI 不允许您启动需要 ENA 支持的实例。

验证是否已启用 ENA。有关更多信息,请参阅 。在 Windows 上启用增强联网要么在 Linux 上启用增强联网在 Amazon EC2 文档中。

Serverror: 无法将基本磁盘上传到 Amazon S3

可能的原因

  • VMDK 不可快照,或者虚拟机已装载 ISO。

  • 连接器将缓冲数据上传到 Amazon S3 时,与虚拟机管理程序(Hyper-V 或 ESXi 主机)的连接超时。

  • 在复制作业将磁盘上传到 Amazon S3 时,正在执行维护。

  • 虚拟磁盘存在压缩问题。

  • 虚拟机管理程序证书存在验证错误。

  • 连接器的状态为Unhealthy.

  • 连接器无法到达Amazon终端节点。

Serverror: 无法验证复制作业

可能的原因

  • 虚拟机路径发生了变化。

  • IAM 权限发生了变化。

  • 虚拟环境的用户或帐户权限发生了变化。

  • WinRM(Hyper-V)存在配置问题。

  • DNS 解析失败。

  • 连接器虚拟机上存在 NTP 配置错误。

出现内部错误。确认Amazon凭据和虚拟机管理器凭据是正确的。

可能的原因

  • IAM 权限不足以完成连接器设置。

  • 虚拟环境的用户或帐户权限不足。

  • 的 IAM 角色存在问题Amazon SMS.

  • 缺少先决条件。

  • 虚拟机环境尚未准备好。

  • 设置连接器时使用了特殊字符(Hyper-V)。

与快照相关的错误 (VMware)

可能的原因

  • VMDK 被配置为独立磁盘。

  • ESXi 主机无法拍摄快照。

  • VMDK 已锁定。

  • 快照链已损坏。确保在复制运行之间不会手动或由第三方软件拍摄快照。

  • 之前的复制运行没有整合快照。

检查点错误(Hyper-V)

可能的原因

  • 虚拟机有现有检查点。

  • 有手动或由第三方软件创建的检查点。

  • VHD 或 VHDX 已锁定。

  • Hyper-V 主机无法创建检查点。

增量复制增量超过 1 TB

连接器旨在处理具有较小增量的频繁复制。连接器不支持大于 1 TB 的增量。如果您未定期复制,则增量可以超过此限制,并且复制运行将失败。

要防止出现此问题,请设置频繁增量复制运行。如果您无法频繁复制,则可提高增量上传限制。例如,在连接器上运行以下命令可将 S3 上传的部分大小从 25 MB 增至 100 MB。出现提示时,请选择选项 3。

sudo sms-connector-config -set slotSizeMB 100 sudo setup.rb

提高上传限制会影响连接器的性能和内存使用。当连接器上传多个增量时,请勿提高上传限制。