Amazon SnowballEdge 的工作原理 - Amazon Snowball Edge 开发人员指南
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon SnowballEdge 的工作原理

Amazon SnowballEdge 设备归您所有Amazon,并在使用期间驻留在您的本地位置。

一台Amazon Snowball Edge设备可以使用四种作业类型。尽管不同类型的任务有不同的使用情形,但这些任务类型在订购、接收和寄回设备方面具有相同的工作流程。无论作业类型如何,每项作业都将在作业完成后删除美国国家标准与技术研究所 (NIST) 800-88 标准的数据。

共享工作流程
  1. 创建作业-每个任务都是在中Amazon Snow 系列管理控制台或通过任务管理 API 以编程方式创建的。可以在控制台中或通过 API 跟踪任务的状态。

  2. 设备已为您的工作准备就绪-我们为您的工作准备了一Amazon Snowball Edge台设备,现在您的工作状态为 “正在准备 Snowball”。

  3. 设备由您所在地区的运营商运送给您——承运人从这里接管,您的工作状态现在为 “在运送中”。您可以在控制台中或使用任务管理 API 找到追踪编号以及追踪网站的链接。有关您所在地区的承运人是谁的信息,请参阅Snow 系列设备的运输注意事项

  4. 接收设备-几天后,您所在地区的运营商将Amazon Snowball Edge设备交付到您在创建任务时提供的地址,您的工作状态更改为已交付给您。设备运抵后,您会注意到它并没有装箱,因为设备本身就是一个运输容器。

  5. 获取您的凭据并下载 Snowball Edge 客户端 — 获取您的证书、任务清单和清单的解锁代码,然后下载 Snowball Edge 客户端,准备好开始传输数据。

    • Snowball Edge 客户端是用来管理从设备到本地数据目的地的数据流的工具。

      您可以从Amazon Snowball资源页面下载和安装 Snowball Edge 客户端。

    • 清单用于验证您对设备的访问权限,它经过加密,必须使用解锁代码才能解密。当设备运抵您的本地位置后,您可从控制台或使用任务管理 API 获取清单。

    • 解锁代码由 29 个字符组成,用于解密清单。您可从控制台或使用任务管理 API 获取解锁代码。建议您将解锁代码与清单分开保存,以防在设备位于您的经营场所期间,他人未经授权而访问设备。

  6. 放@@ 置硬件-将设备移入您的数据中心,然后按照机箱上的说明将其打开。给设备通电并将其连接到您的本地网络。

  7. 开启设备电源 — 接下来,按下 LCD 显示屏上方的电源按钮,打开设备电源。稍等几分钟将显示 Ready 屏幕。

  8. 获取设备的 IP 地址-液晶显示屏上有一个 “连接” 选项卡。点击此选项卡并获取Amazon Snowball Edge设备的 IP 地址。

  9. 使用 Snowball Edge 客户端解锁设备-使用 Snowball Edge 客户端解锁Amazon Snowball Edge设备时,输入设备的 IP 地址、清单路径和解锁码。Snowball Edge 客户端解密清单并使用它来验证您对设备的访问权限。

  10. 使用设备-设备已启动并正在运行。您可以使用它通过 Amazon S3 适配器或网络文件系统 (NFS) 挂载点传输数据,或者在 Snow Family 设备上使用 Amazon S3 兼容存储进行本地计算和存储。

  11. 为设备回程做好准备 — 在本地使用完设备且文件接口状态为 “完成” 后,按下 LCD 显示屏上方的电源按钮。设备关闭大约需要 20 秒。拔掉设备电源,将其电源线放入设备顶部的线缆凹槽内,然后将设备的三个门全部关闭。现在可以将设备寄回了。

  12. 您所在地区的运营商将设备退还给 Amazon ——当承运人收到Amazon Snowball Edge设备时,任务的状态将变为 “正在发送中” Amazon。

    注意

    导出和集群作业还有其他步骤。有关更多信息,请参阅 出口工作是如何运作的集群本地计算和存储作业的工作原理

导入任务的工作原理

每个导入任务都使用单个 Snowball 设备。在Amazon Snow 系列管理控制台或任务管理 API 中创建任务后,我们会向您发送 Snowball。当它在几天后到达时,您将 Snowball Edge 设备连接到您的网络,并将要导入到 Amazon S3 的数据传输到该设备上。当您完成数据传输后,将 Snowball 运回Amazon,我们会将您的数据导入 Amazon S3。

出口工作是如何运作的

每个导出任务可以使用任意数量的 Amazon Snowball Edge 设备。如果列表中包含的数据量超过了单个设备所能容纳的数据,则会向您提供多台设备。每个任务部分都正好有一个与其关联的设备。创建任务部分后,您的第一个任务部分将进入准备中 Snowball 状态。

注意

用于将任务拆分为多个部分的列出操作是 Amazon S3 的功能,其计费方式与任何 Amazon S3 操作相同。

在此之后,我们很快就会开始将您的数据导出到设备。导出数据所需的时间将根据数据集的性质而有所不同。例如,导出许多小文件(小于 10 MB)所花费的时间要长得多。导出完成后,Amazon准备好设备供您所在地区的运营商提货。当设备到达时,您将AmazonAmazon Snowball Edge设备连接到网络,并将数据从设备传输到网络上的存储。

完成数据传输后,将设备寄回Amazon。当我们收到用于您的导出任务部分的设备时,我们会将其完全清除。此擦除过程遵循美国国家标准与技术研究院 (NIST) 800-88 标准。此步骤标记这一特定任务部分的完成。

  • 用于键盘列表

    在导出 S3 存储桶中的对象之前,我们会扫描该存储桶。如果在扫描后更改存储桶,则作业可能会遇到延迟,因为我们会扫描丢失或更改的对象。

  • 适用于 S3 冰川灵活检索

    请务必注意,Amazon Snowball无法导出 S3 Glacier 存储类中的对象。必须先恢复这些对象,然后Amazon Snowball才能成功导出存储桶中的对象。

本地计算和存储作业的工作原理

您可以通过在 Amazon EKS Anywhere on Snow 中运行与 Amazon EC2 兼容的计算实例或 Kubernetes 容器来使用Amazon Snowball Edge设备的本地计算和存储功能。对于计算功能,数据存储由 Snow Family 设备上的 Amazon S3 兼容存储提供。有关更多信息,请参阅仅限本地计算和存储任务

集群本地计算和存储作业的工作原理

集群作业是一种特殊的作业,仅用于本地存储和计算。它适用于那些需要提高数据耐久性和存储容量的工作负载。有关更多信息,请参阅本地集群选项

注意

与独立的本地存储和计算任务一样,如果不在单独的导入任务中订购其他设备,则无法将存储在集群中的数据导入到 Amazon S3。如果您对这些设备排序,您可以将数据从集群传输到这些设备,并在寄回设备时为导入任务导入数据。

集群有 3 到 16 个 Amazon Snowball Edge 设备,称为节点。当您从区域运营商处收到节点时,将所有节点连接到电源和网络以获取它们的 IP 地址。您可以使用这些 IP 地址使用其中一个节点的 IP 地址,通过单个解锁命令一次性解锁群集的所有节点。有关更多信息,请参阅使用 Snowball Edge 客户端

您可以在 Snow Family 设备上使用或使用 Amazon S3 兼容存储以及分布在其他节点之间的数据,将数据写入解锁的集群。

完成集群后,将所有节点运回到Amazon。当我们收到群集节点时,我们会完全清除 Snowball。此擦除过程遵循美国国家标准与技术研究院 (NIST) 800-88 标准。

《雪球边缘》视频和博客