文件系统挂载问题疑难解答 - FSx for Lustre
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

文件系统挂载问题疑难解答

文件系统挂载命令失败有许多潜在原因,如以下主题所述。

文件系统挂载立即失败

文件系统挂载命令立即失败。下面的代码显示了一个示例。

mount.lustre: mount fs-0123456789abcdef0.fsx.us-east-1.aws@tcp:/fsx at /lustre failed: No such file or directory Is the MGS specification correct? Is the filesystem name correct?

如果您的使用没有正确的,则可能发生此错误mountname使用挂载持久性文件系统或暂存 2 文件系统时的值mount命令。你可以得到mountname来自响应的值describe-file-systems Amazon CLI命令或DescribeFileSystemsAPI 操作。

文件系统挂载挂起然后失败并出现超时错误

文件系统挂载命令挂起一两分钟,然后失败,并显示超时错误。

下面的代码显示了一个示例。

sudo mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx [2+ minute wait here] Connection timed out

出现此错误的原因是 Amazon EC2 实例或文件系统的安全组配置不正确。

要采取的操作

确保文件系统的安全组具有中指定的入站规则Amazon VPC 安全组.

自动挂载失败,实例无响应

在某些情况下,文件系统的自动装载可能会失败,并且您的 Amazon EC2 实例可能会停止响应。

在以下情况下,可能会出现此问题_netdev选项未声明。如果_netdev缺少 Amazon EC2 实例可能会停止响应。出现该结果是因为,需要在计算实例启动其网络后初始化网络文件系统。

要采取的操作

如果出现此问题,请与Amazon Web Services Support.

系统启动期间文件系统挂载失败

在系统引导期间,文件系统装载失败。安装是自动使用的/etc/fstab. 未挂载文件系统时,在实例启动时间段的 syslog 中会出现以下错误。

LNetError: 3135:0:(lib-socket.c:583:lnet_sock_listen()) Can't create socket: port 988 already in use LNetError: 122-1: Can't start acceptor on port 988: port already in use

当端口 988 不可用时,可能会出现此错误。当实例配置为挂载 NFS 文件系统时,NFS 挂载可能会将其客户端端口绑定到端口 988

要采取的操作

您可以通过调整 NFS 客户端的noresvportnoauto在可能的情况下,挂载选项。

使用 DNS 名称挂载文件系统失败

错误配置的域名服务 (DNS) 名称可能会导致文件系统挂载失败,如以下场景所示。

方案 1: 使用域名服务 (DNS) 名称的文件系统挂载失败。下面的代码显示了一个示例。

sudo mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx mount.lustre: Can't parse NID 'file_system_dns_name@tcp:/mountname'

要采取的操作

检查您的虚拟私有云 (VPC) 配置。如果使用自定义 VPC,请确保已启用 DNS 设置。有关更多信息,请参阅 Amazon VPC 用户指南中的在您的 VPC 中使用 DNS

要在中指定一个 DNS 名称mount命令,请执行以下操作:

  • 确保 Amazon EC2 实例与适用于 Lustre 的 Amazon FSx 文件系统位于同一 VPC 中。

  • 在配置为使用由 Amazon EC2 提供的 DNS 服务器的 VPC 服务器的 VPC 服务器的 VPC 服务器的 VPC 服务器的 有关更多信息,请参阅 Amazon VPC 用户指南中的 DHCP 选项集

  • 确保连接的 Amazon EC2 VPC 的Amazon EC2 实例已启用 DNS 主机名。有关更多信息,请参阅 。更新您的 VPC 的 DNS 支持中的Amazon VPC User Guide.

方案 2: 使用域名服务 (DNS) 名称的文件系统挂载失败。下面的代码显示了一个示例。

mount -t lustre file_system_dns_name@tcp:/mountname /mnt/fsx mount.lustre: mount file_system_dns_name@tcp:/mountname at /mnt/fsx failed: Input/output error Is the MGS running?

要采取的操作

确保客户端的 VPC 安全组应用了正确的出站流量规则。此建议适用,尤其是在您未使用默认安全组或修改了默认安全组的情况下。有关更多信息,请参阅 Amazon VPC 安全组