AWS Snowball
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本指南适用于 Snowball Edge。如果您正在查找 Snowball 的相关文档,请参阅 AWS Snowball 用户指南

AWS Snowball 如何与 Snowball Edge 结合使用

对于 AWS Snowball,您可以从两种设备中选择一种来使用。在本指南中,您将了解如何将 AWS Snowball 与 AWS Snowball Edge 设备结合使用。设备归 AWS 所有,在使用时驻留在您的本地位置上。

对于 AWS Snowball Edge 设备,您可以使用三种类型的任务。尽管不同类型的任务有不同的使用情形,但这些任务类型在订购、接收和寄回设备方面具有相同的工作流程。

共享工作流程

  1. 创建任务 – 对于每个任务,既可在 AWS Snowball 管理控制台中创建,也可以通过任务管理 API 以编程方式创建,且可在控制台中或通过 API 追踪任务的状态。

  2. 为您的任务准备设备 – 我们为您的任务准备 AWS Snowball Edge 设备,此时您的任务状态为正在准备 Snowball

  3. 由您所在区域的承运商将设备运送给您 – 承运商从这里接管,您的任务状态现在为正发送给您。您可以在控制台中或使用任务管理 API 找到追踪编号以及追踪网站的链接。有关您所在区域的运营商的信息,请参阅AWS Snowball 运输注意事项

  4. 接收设备 – 几天后,区域承运商将 AWS Snowball Edge 设备运到您在创建任务时提供的地址,此时您的任务状态将更改为已交付给您。设备运抵后,您会注意到它并没有装箱,因为设备本身就是一个运输容器。

  5. 获取您的凭证并下载 Snowball 客户端 – 获取您的凭证、任务清单以及清单的解锁代码,然后下载 Snowball 客户端,从而准备好开始传输数据。

    • Snowball 客户端是一个工具,用于管理从设备到本地数据目标的数据流。

      可在您的高性能工作站上为已安装的 WindowsMacLinux 下载并安装 Snowball 客户端。

    • 清单用于验证您对设备的访问权限,它经过加密,必须使用解锁代码才能解密。当设备运抵您的本地位置后,您可从控制台或使用任务管理 API 获取清单。

    • 解锁代码由 29 个字符组成,用于解密清单。您可从控制台或使用任务管理 API 获取解锁代码。建议您将解锁代码与清单分开保存,以防在设备位于您的经营场所期间,他人未经授权而访问设备。

  6. 定位硬件 – 将设备移动到您的数据中心内并按照外壳上的说明打开。给设备通电并将其连接到您的本地网络。

  7. 启动设备 – 接下来,按下 LCD 显示屏上的电源按钮启动设备。稍等几分钟将显示 Ready 屏幕。

  8. 获取设备的 IP 地址 – LCD 显示屏上有一个 CONNECTION 选项卡。点击此选项卡,即可获取 AWS Snowball Edge 设备的 IP 地址。

  9. 使用 Snowball 客户端解锁设备 – 在您使用 Snowball 客户端解锁 AWS Snowball Edge 设备时,请键入设备的 IP 地址、清单路径和解锁代码。Snowball 客户端解密清单并使用清单来验证您对设备的访问权限。

    注意

    对于集群任务,则还需要执行其他步骤,请参阅 群集化本地计算和存储的工作方式

  10. 使用设备 – 设备现已启动且正在运行。您可以使用它来传输数据或进行本地计算和存储。您可使用 适用于 Snowball 的 Amazon S3 Adapter 或网络文件系统 (NFS) 装载点读取和写入数据。

  11. 为寄回设备做准备 – 在本地位置使用设备完成任务后,当文件接口状态显示为 Complete 时,按下 LCD 显示屏上的电源按钮。设备关闭大约需要 20 秒。拔掉设备电源,将其电源线放入设备顶部的线缆凹槽内,然后将设备的三个门全部关闭。现在可以将设备寄回了。

  12. 您所在区域的承运商将设备运回 AWS – 承运商拿到 AWS Snowball Edge 设备后,任务的状态将变为正在发送到 AWS

    注意

    对于导出任务和集群任务,还需要执行其他步骤,请参阅导出的工作方式群集化本地计算和存储的工作方式

导入的工作方式

每个导入任务使用一个 Snowball 设备。当您在 AWS Snowball 管理控制台或任务管理 API 中创建任务之后,我们会向您发运 Snowball。Snowball 经过数日到达之后,请将其连接到您的网络,并将要导入到 Amazon S3 的数据传输到该 Snowball 上。在您完成数据传输之后,将 Snowball 发运回 AWS,我们会将您的数据导入到 Amazon S3。

导出的工作方式

每个导出任务可以使用任意数量的 AWS Snowball Edge 设备。当您在 AWS Snowball 管理控制台或作业管理 API 中创建任务之后,Amazon S3 中将启动列举操作。此列举操作将您的任务分割为几个部分。每个任务部分都正好有一个与其关联的设备。在您创建任务部分之后,第一个任务部分进入 Preparing Snowball 状态。

注意

将任务拆分为多个部分的列举操作是 Amazon S3 的一项功能;与您使用其他 Amazon S3 操作一样,您需要为该操作付费。

在此之后,我们很快就会开始将您的数据导出到设备。通常,导出数据需要一个工作日;不过,此过程可能需要更长时间。导出完成之后,AWS 将会为您所在区域的承运商备好设备。

设备经过数日到达后,请将 AWS Snowball Edge 设备连接到您的网络,并将要导入到 Amazon S3 的数据传输到该设备上。完成数据传输之后,请将 设备 寄回 AWS。在收到该导出任务部分的返回设备后,我们会将其完全擦除。此擦除过程遵循美国国家标准与技术研究院 (NIST) 800-88 标准。此步骤标记这一特定任务部分的完成。如果有多个任务部分,则现已准备好下一个任务部分的发运。

本地计算和存储的工作方式

您可以在支持 Lambda 的区域针对所有类型的任务使用 AWS Snowball Edge 设备的本地计算和存储功能。计算功能是 由 AWS Greengrass 提供支持的 AWS Lambda,其中 Python 语言的 AWS Lambda 函数可由针对您在创建任务时指定的存储桶执行的 Amazon S3 PUT 对象操作触发。有关更多信息,请参阅仅限本地计算和存储任务

群集化本地计算和存储的工作方式

集群任务是仅用于本地存储和计算的一种特殊类型的任务,适用于需要更高数据持久性和更多存储容量的工作负载。有关更多信息,请参阅 本地集群选项

注意

与独立的本地存储和计算任务一样,如果不将其他设备作为单独导入任务的一部分进行排序,则集群中存储的数据无法导入 Amazon S3 中。如果您对这些设备排序,您可以将数据从集群传输到这些设备,并在寄回设备时为导入任务导入数据。

具有 5 到 10 个 AWS Snowball Edge 设备的集群称作节点。在您收到所在区域承运商运抵的节点后,为所有节点接通电源并将其连接到网络,以便获取它们的 IP 地址。借助这些 IP 地址,您可以通过节点之一的 IP 地址,使用单个解锁命令同时解锁集群的所有节点。有关更多信息,请参阅 使用 Snowball 客户端

您可以使用 适用于 Snowball 的 Amazon S3 Adapter 将数据写入解锁集群,也可使用 NFS 装载点通过领导节点写入数据,之后领导节点会将数据分发到其他节点。

完成集群任务后,请将所有节点运回 AWS。收到运回的节点后,我们将完全擦除 Snowball 中的数据。此擦除过程遵循美国国家标准与技术研究院 (NIST) 800-88 标准。