AWS Snowball
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本指南适用于 Snowball Edge。如果您正在查找 Snowball 的相关文档,请参阅 AWS Snowball 用户指南

管理集群

接下来,您可以查找有关操作 Snowball Edge 设备的正常运行的集群的管理任务的信息。以下主题涵盖了主要管理任务。

大多数管理任务要求您使用 Snowball 客户端及其命令来执行以下操作:

在集群中读取和写入数据

解锁集群后,您可以开始在集群中读取和写入数据。目前,建议您使用 适用于 Snowball 的 Amazon S3 Adapter 在集群中读取和写入数据。有关更多信息,请参阅 使用 Amazon S3 Adapter

要向集群写入数据,您必须具有不超过 1 个不可用节点的读/写 quorum。要从集群中读取数据,您必须具有不超过 2 个不可用节点的读 quorum。有关 quorum 的更多信息,请参阅Snowball Edge 集群 Quorum

重新连接不可用集群节点

节点可能因出现问题 (如断电或网损) 而导致临时不可用,而不会损坏节点上的数据。在发生这种情况时,它会影响集群的状态。使用 snowballEdge status 命令在 Snowball 客户端中报告节点的临时不可用性。

由于此功能,建议您物理放置集群,以便能够访问所有节点的前部、后部和顶部。这样一来,您可以接触到背面的电源线和网线、顶部的装运标签 (从而获取节点 ID) 以及设备前面的 LCD 屏幕 (从而获取 IP 地址和其他管理信息)。

您可以使用命令 Snowball 客户端 snowballEdge status 检测到节点不可用。此命令报告回整个集群的 quorum 状态以及每个可用节点的状态。如果主节点不可用,则该状态命令将返回错误。如果辅助节点不可用,则它应作为不可用节点列出。

当您检测到节点不可用时,建议您尝试下列过程之一,具体取决于导致不可用性的场景。

重新连接不可用的主节点

  1. 确保节点已通电。

  2. 确保节点已连接到集群的其他部分所在的同一内部网络。

  3. 等待节点完成启动 (如果节点需要通电)。

  4. 运行 snowballEdge unlock 命令。有关示例,请参阅解锁

重新连接已关闭的不可用辅助节点

以下过程说明了如何为集群添加正常运行的节点。

  1. 重新启动不可用的节点。

  2. 确保节点已连接到集群的其他部分所在的同一内部网络。

  3. 等待节点完成启动。

  4. 运行 snowballEdge addnode 命令。有关示例,请参阅向集群添加节点

重新连接已丢失网络但未断电的不可用的辅助节点

  1. 确保节点已连接到集群的其他部分所在的同一内部网络。

  2. 运行 snowballEdge status 命令以查看何时将之前不可用的节点添加回集群。有关示例,请参阅获取设备状态

在执行前面的过程后,您的节点应正常运行。您还应具有一个读/写 quorum。如果不是这样,则您的一个或多个节点可能有更严重的问题,并且可能需要从集群中将其删除。

更改集群上的主节点

主节点是集群的领导节点,它执行集群的大多数后台管理工作。首次解锁集群时,指定集群的所有节点中的主节点。如果当前节点不可用,也可以更改主节点。

因旧的主节点不可用而更改主节点

  1. 通过按 LCD 屏幕上的电源按钮不超过 2 秒的时间来关闭所有集群节点。

  2. 关闭所有集群节点。

  3. 等待节点完成启动 (如果节点需要通电)。

  4. 确保节点连接到同一内部网络并记下其 IP 地址。

  5. 运行 Snowball 客户端命令 snowballEdge unlock,将其他节点作为主节点。

从集群中删除不正常节点

集群中的节点很少变得运行状况不佳。如果节点不可用,建议您完成重新连接不可用集群节点中列出的过程。

如果这样做不能解决此问题,则节点可能运行状况不正常。在以下情况下,会出现运行状况不正常的节点:节点被外部源损坏、出现不寻常的电活动或发生其他不太可能发生的事件。如果发生这种情况,您需要先从集群中删除节点,然后才能添加新节点来作为替换。

如果需要删除的节点是主节点,则在完成以下过程之前,您应更改主节点。有关更多信息,请参阅 更改集群上的主节点

当您检测到辅助节点的运行状况不佳并需要删除时,建议您通过以下过程执行该操作。

删除运行状况不佳的节点

  1. 确保节点运行状况不佳且不仅仅是不可用。有关更多信息,请参阅 重新连接不可用集群节点

  2. 从网络断开运行状况不佳的节点并将其关闭。

  3. 运行 Snowball 客户端命令 snowballEdge removenode。有关更多信息,请参阅从集群中删除节点

  4. 再次关闭集群中的每个节点。

  5. 重新启动集群中的每个节点。

  6. 再次解锁集群而没有运行状况不佳的节点。

  7. 使用控制台、AWS CLI 或某个 AWS 开发工具包订购替换节点。

  8. 将运行状况不佳的节点寄回 AWS。当我们拥有该节点时,我们对设备执行完整擦除。此擦除过程遵循美国国家标准与技术研究院 (NIST) 800-88 标准。

在您成功删除节点后,您的数据仍在集群上可用 (如果您仍具有读 quorum)。要拥有读 quorum,集群必须具有不超过 2 个的不可用节点。因此,建议您在从集群中删除不可用节点后,立即订购替换节点。

在集群中添加或替换节点

您可以在从集群中删除运行状况不佳的节点后添加新节点。您还可以添加新节点以增大本地存储空间。

要添加新节点,您首先需要订购替换。您可以从控制台、AWS CLI 或某个 AWS 开发工具包订购替换节点。如果您正在从控制台订购替换节点,则可为任何尚未取消或完成的任务订购替换节点。

从控制台订购替换节点

  1. 登录 AWS Snowball 管理控制台

  2. 为属于从“Job”控制面板创建的集群的节点查找和选择任务。

  3. 对于 Actions,选择 Replace node

    执行此操作将打开任务创建向导的最后一步,所有设置与最初创建集群的方式相同。

  4. 选择 Create job

您的替换 Snowball Edge 目前正在寄送给您的途中。在它送达后,请使用以下过程将它添加到集群中。

添加替换节点

  1. 为集群放置新节点,以便能够接触到所有节点的前部、后部和顶部。

  2. 确保节点已通电。

  3. 确保节点已连接到集群的其他部分所在的同一内部网络。

  4. 等待节点完成启动 (如果节点需要通电)。

  5. 运行 snowballEdge add 命令。有关示例,请参阅向集群添加节点