

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 将 VMware vSphere 高可用性与 Storage Gateway 配合使用
<a name="vmware-ha"></a>

Storage Gateway VMware 通过一组与 VMware vSphere 高可用性 (HA) 集成的应用程序级运行状况检查提供高可用性。VMware 此方法有助于保护存储工作负载免受硬件、管理程序或网络故障的影响。它还有助于防止软件错误，例如连接超时和文件共享或卷不可用。

vSphere HA 的工作原理是将虚拟机及其所在的主机汇集到一个集群中以实现冗余。集群中的主机将受到监控，如果出现故障，故障主机上的虚拟机将在备用主机上重新启动。通常，这种恢复会快速发生，而不会丢失数据。有关 vSphere HA 的更多信息，请参阅文档中的 [vSphere HA 的工作原理](https://docs.vmware.com/en/VMware-vSphere/7.0/com.vmware.vsphere.avail.doc/GUID-33A65FF7-DA22-4DC5-8B18-5A7F97CCA536.html)。 VMware 

**注意**  
重新启动出现故障的虚拟机并在新主机上重新建立 iSCSI 连接所需的时间取决于许多因素，例如主机操作系统和资源负载、磁盘速度、网络连接和 SAN/storage 基础架构。为最大限度地减少失效转移停机时间，请实施 [Optimizing Gateway Performance](https://docs.amazonaws.cn//storagegateway/latest/tgw/Performance.html#Optimizing-common) 中概述的建议。  
要将 Storage Gateway 与 VMware HA 配合使用，我们建议您执行以下操作：  
仅在 VMware 集群中的一台主机上部署包含 Storage Gateway 虚拟机的 ESX `.ova` 可下载软件包。
在部署 `.ova` 程序包时，选择一个不在主机本地的数据存储。而是使用一个可供群集的所有主机访问的数据存储。如果您选择的是主机本地数据存储，而主机发生了故障，则群集中的其他主机可能无法访问该数据源，并且可能无法成功地故障转移到另一台主机。
要防止启动程序在故障转移期间与存储卷目标断开连接，请遵循针对您的操作系统建议的 iSCSI 设置。在故障转移事件中，网关 VM 在故障转移群集中的新主机中启动时，需要花费几秒钟到几分钟的时间。Windows 和 Linux 客户端的建议 iSCSI 超时超过了完成故障转移通常所需的时间。有关自定义 Windows 客户端的超时设置的更多信息，请参阅 [自定义您的 Windows iSCSI 设置](recommendediSCSISettings.md#CustomizeWindowsiSCSISettings)。有关自定义 Linux 客户端的超时设置的更多信息，请参阅 [自定义您的 Linux iSCSI 设置](recommendediSCSISettings.md#CustomizeLinuxiSCSISettings)。
利用群集化，如果您将 `.ova` 程序包部署到群集，请在系统提示您这样做时选择一台主机。或者您也可以直接部署到群集中的主机里。

以下主题介绍如何在 VMware HA 集群中部署 Storage Gateway：

**Topics**
+ [配置您的 vSphere VMware 高可用集群](#vmware-ha-configure-cluster)
+ [从 Storage Gateway 控制台下载 .ova 映像](#vmware-ha-download-image)
+ [部署网关](#vmware-ha-deploy-gateway)
+ [（可选）为集群 VMs 上的其他人添加覆盖选项](#vmware-ha-overrides)
+ [激活网关](#vmware-ha-activate-gateway)
+ [测试您的 VMware 高可用性配置](#vmware-ha-test-failover)

## 配置您的 vSphere VMware 高可用集群
<a name="vmware-ha-configure-cluster"></a>

首先，如果您尚未创建 VMware 集群，请创建一个集群。有关如何创建 VMware 集群的信息，请参阅文档中的[创建 vSphere HA 集群](https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.avail.doc/GUID-4BC60283-B638-472F-B1D2-1E4E57EAD213.html)。 VMware 

接下来，将您的 VMware 集群配置为使用 Storage Gateway。

**配置您的 VMware 集群**

1. 在 VMware vSphere 的 “**编辑集群设置**” 页面上，确保为虚拟机和应用程序监控配置了虚拟机监控。为此，请为每个选项设置以下值：
   + **主机故障响应**：**重新启动 VMs**
   + **主机隔离的响应**：**关闭并重启 VMs**
   + **Datastore with PDL (具有 PDL 的数据存储)**：**Disabled (已禁用)**
   + **Datastore with APD (具有 APD 的数据存储)**：**Disabled (已禁用)**
   + **VM Monitoring (VM 监控)**：**VM and Application Monitoring (VM 和应用程序监控)**

1. 通过调整以下值来微调集群的敏感度：
   + **故障间隔** - 在此间隔之后，如果未收到 VM 检测信号，则将重新启动 VM。
   + **最短正常运行时间** - 在 VM 开始监控 VM 工具的检测信号之后，集群等待的时间。
   + **每个 VM 的最大重置次数** - 集群在最大重置时段内重启 VM 的最大次数。
   + **最大重置次数的时段** - 计算每个 VM 的最大重置次数的时段。

   如果您不确定要设置的值，请使用以下示例设置：
   + **Failure interval (故障间隔)**：**30** 秒 
   + **Minimum uptime (最短正常运行时间)**：**120** 秒 
   + **Maximum per-VM resets (每个 VM 的最大重置次数)**：**3**
   + **Maximum resets time window (最长重置时段)**：**1** 小时 

如果您在集群上 VMs 运行其他值，则可能需要专门为虚拟机设置这些值。在从 .ova 部署 VM 之前，无法执行此操作。有关设置这些值的更多信息，请参阅 [（可选）为集群 VMs 上的其他人添加覆盖选项](#vmware-ha-overrides)。

## 从 Storage Gateway 控制台下载 .ova 映像
<a name="vmware-ha-download-image"></a>

**下载适用于您的网关的 .ova 映像**
+ 在 Storage Gateway 控制台的**设置网关**页面上，选择您的网关类型和主机平台，然后使用控制台中提供的链接来下载 .ova，如[设置磁带网关](https://docs.amazonaws.cn/storagegateway/latest/tgw/create-gateway-vtl.html)中所述。

## 部署网关
<a name="vmware-ha-deploy-gateway"></a>

在已配置的集群中，将 .ova 映像部署到集群的主机之一。

**部署网关 .ova 映像**

1.  将 .ova 映像部署到集群中的主机之一。

1. 确保为根磁盘和缓存选择的数据存储对集群中的所有主机可用。在 VMware 或本地环境中部署 Storage Gateway .ova 文件时，这些磁盘被描述为半虚拟化 SCSI 磁盘。*半虚拟化* 是一种模式，在此模式下，网关 VM 使用主机操作系统来让控制台标识您添加到 VM 的虚拟磁盘。

   如需将 VM 配置为使用半虚拟化的控制器

   1. 在 VMware vSphere 客户端中，打开网关 VM 的上下文（右键单击）菜单，然后选择**编辑**设置。

   1. 在 **Virtual Machine Properties** 对话框中，选择 **Hardware** 选项卡，再选择 **SCSI controller 0**，然后选择 **Change Type**。

   1. **在 “**更改 SCSI 控制器类型**” 对话框中，选择 “**VMware 半虚拟 SCSI** 控制器类型”，然后选择 “确定”。**

## （可选）为集群 VMs 上的其他人添加覆盖选项
<a name="vmware-ha-overrides"></a>

如果您的集群上 VMs 正在运行其他虚拟机，则可能需要专门为每个 VM 设置集群值。有关说明，请参阅 VMware vSphere 在线文档中的[自定义单个虚拟机](https://docs.vmware.com/en/VMware-vSphere/7.0/com.vmware.vsphere.avail.doc/GUID-CFD74742-26EA-4BED-A4FC-4E8F50A46C83.html)。

**为集群 VMs 上的其他人添加覆盖选项**

1. **在 VMware vSphere 的 “**摘要**” 页面上，选择您的集群以打开集群页面，然后选择配置。**

1. 选择 **Configuration (配置)** 选项卡，然后选择 **VM Overrides (VM 覆盖)**。

1. 添加新的 VM 覆盖选项来更改每个值。

   为 **vSphere HA - VM 监控**下的每个选项设置以下值：
   + **VM 监控**：**已启用覆盖** - **VM 和应用程序监控**
   + **VM 监控灵敏度**：**已启用覆盖** - **VM 和应用程序监控**
   + **VM 监控**：**自定义**
   + **故障间隔**：**30** **秒**
   + **最短正常运行时间**：**120** **秒**
   + **Maximum per-VM resets (每个 VM 的最大重置次数)**：**5**
   + **最大重置时段**：**1** **小时****内**

## 激活网关
<a name="vmware-ha-activate-gateway"></a>

在部署适用于网关的 .ova 后，激活网关。有关每个网关类型的不同之处的说明。

**激活网关**
+ 请按照以下主题概述的步骤操作：

  1. [将您的磁带网关连接到 Amazon](https://docs.amazonaws.cn/storagegateway/latest/tgw/create-gateway-vtl.html#connect-to-amazon-tape)

  1. [检查设置并激活磁带网关](https://docs.amazonaws.cn/storagegateway/latest/tgw/create-gateway-vtl.html#review-and-activate-tape)

  1. [配置磁带网关](https://docs.amazonaws.cn/storagegateway/latest/tgw/create-gateway-vtl.html#configure-gateway-tape)

## 测试您的 VMware 高可用性配置
<a name="vmware-ha-test-failover"></a>

激活网关后，请测试您的配置。

**测试您的 VMware HA 配置**

1. 在[https://console.aws.amazon.com/storagegateway/家](https://console.amazonaws.cn/storagegateway/)中打开 Storage Gateway 控制台。

1. **在导航窗格上，选择 Gateways，然后选择要测试 VMware HA 的网关。**

1. 在 “**操作**” 中，选择 “**验证 VMware HA**”。

1. 在出现的 “**验证 VMware 高可用性配置**” 框中，选择 “**确定”**。
**注意**  
测试 VMware HA 配置会重新启动网关 VM 并中断与网关的连接。该测试可能需要几分钟才能完成。

   如果测试成功，则控制台中网关的详细信息选项卡中将显示 **Verified (已验证)** 状态。

1. 请选择 **Exit**（退出）。

您可以在 Amazon CloudWatch 日志组中找到有关 VMware HA 事件的信息。有关更多信息，请参阅使用日志组[获取 Tape Gateway Health CloudWatch 日志使用日志组](https://docs.amazonaws.cn/storagegateway/latest/tgw/GatewayMetrics-vtl-common.html#cw-log-groups-tape)。 CloudWatch 