使用 Snowball Edge 设备的最佳实践 - Amazon Snowball Edge 开发者指南
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Snowball Edge 设备的最佳实践

为了帮助您的 Amazon Snowball Edge 设备获得最大的收益和满意度,我们建议您遵循以下最佳实践。

安全性

以下是在使用 Amazon Snowball Edge 设备时维护安全的建议和最佳实践。

一般安全性
  • 如果您发现 Amazon Snowball Edge 设备有任何可疑之处,请不要将其连接到内部网络。而是联系 Amazon Web Services Support,公司将向您发运新的 Amazon Snowball Edge 设备。

  • 建议您不要将解锁代码副本和该作业的清单保存在工作站上的同一位置。将它们保存在不同的位置有助于防止未经授权的各方访问 Amazon Snowball Edge 设备。例如,您可以将清单的副本保存到本地服务器,并将解锁设备的代码通过电子邮件发送给一位用户。这种方法将访问 Amazon Snowball Edge 设备的权限限制为有权访问服务器上保存的文件和用户电子邮件地址的个人。

  • 运行 Snowball Edge 客户端命令时显示的凭据 list-access-keys 和 get-secret-access-key是一对用于访问设备的访问密钥。

    这些密钥仅与相关作业和设备上的本地资源相关联。它们不会映射到你 Amazon Web Services 账户 或任何其他人 Amazon Web Services 账户。如果您尝试使用这些密钥访问中的服务和资源 Amazon Web Services 云,它们将失败,因为它们仅适用于与您的任务关联的本地资源。

  • 如果您觉得自己的凭证丢失或已泄露,请按照更新设备的 SSL 证书的流程申请新的清单文件和解锁代码。请参阅 更新 SSL 证书

有关如何使用 Amazon Identity and Access Management (IAM) 策略控制访问的信息,请参阅适用于 Amazon Snowball Edge 的 Amazon 托管(预定义)策略

网络安全性
  • 我们建议您一次只使用一种方法在 Amazon Snowball Edge 设备上的本地存储桶中读取和写入数据。同时在同一 Amazon S3 存储桶上使用文件接口和 Amazon S3 Adapter 会导致读取/写入冲突。

  • 为防止数据损坏,在传输数据时,请勿断开 Amazon Snowball Edge 设备连接或更改其网络设置。

  • 设备上正在写入的文件应该处于静态状态。在写入时修改文件可能会导致读取/写入冲突。

  • 有关提高 Amazon Snowball Edge 设备性能的更多信息,请参阅Performance

资源管理

在 Amazon Snowball Edge 设备上管理作业和资源时,请考虑以下最佳实操。

  • 作业已创建状态是唯一您可以取消作业的状态。当作业变为其他状态时,您无法取消作业。这适用于集群。

  • 对于导入作业,请勿删除所传输数据的本地副本,直至成功导入到 Amazon S3。作为过程的一部分,请确保验证数据传输的结果。

Performance

注意

您体验到的数据传输性能将因网络环境、操作系统、复制方法、协议、源数据读取性能和数据集特征(例如文件大小)而异。为了确定准确的数据传输速率和数据传输时间,我们建议您通过在您的环境中 proof-of-concept 进行测试来衡量性能。

接下来,您可以找到有关 Amazon Snowball Edge 设备性能的建议和信息。本部分简要介绍性能,因为每个本地环境的运营方式各不相同:不同的网络技术、不同的硬件、不同的操作系统、不同的过程等。

下表概述了您的网络传输速率如何影响向 Snowball Edge 设备填充数据所需的时间。由于较小的文件开销很小,因此,较小的文件将加快传输速度。如果您有很多小文件,则建议您在将这些文件传输到 Snowball Edge 设备之前将它们打包为较大的存档文件。

速率(MB/s) 82 TB 传输时间
800 1.22 天
450 2.11 天
400 2.37 天
300 3.16 天
277 3.42 天
200 4.75 天
100 9.49 天
60 15.53 天
30 31.06 天
10 85.42 天

为了提供有关性能的有意义的指导,以下各节描述了如何确定何时使用 Amazon Snowball Edge 设备以及如何充分利用该服务。

性能建议

强烈建议采纳以下实操,因为这些实操在提高数据传输性能方面具有最大影响:

  • 建议每个目录包含的文件或目录数不超过 500,000 个。

  • 建议传输到 Snowball Edge 设备的所有文件的大小不小于 1 MB。

  • 如果您有很多文件的大小小于 1 MB,则建议您在将这些文件传输到 Snowball Edge 设备之前将它们打包为较大的存档。

加快数据传输速度

提高 Amazon Snowball Edge 设备性能的最佳方法之一是加快传入和传出设备的数据的速度。一般来说,您可通过以下方法加快数据从数据来源到设备的传输速度:以下列表按对性能的积极影响从大到小的顺序排列:

  1. 一次执行多个写入操作:要执行此操作,请在与单个 Amazon Snowball Edge 设备有网络连接的计算机上从多个终端窗口运行每个命令。

  2. 批量传输小文件:因为要进行加密,每个复制操作都会产生一些开销。要加快处理速度,请将文件批量存储在单个存档文件中。批量处理文件时,在将它们导入到 Amazon S3 中时可以进行自动提取。有关更多信息,请参阅批量处理小文件

  3. 请勿在传输过程中对文件执行其他操作:在传输过程中重命名文件,更改其元数据,或在执行复制操作期间在文件中写入数据,都会对传输性能产生负面影响。我们建议您在传输文件时将文件保持静态。

  4. 减少本地网络使用:您的 Amazon Snowball Edge 设备将跨本地网络进行通信。因此,您可以通过降低 Amazon Snowball Edge 设备、该设备连接到的交换机和承载您的数据来源的计算机之间的其他本地网络流量来提高数据传输速度。

  5. 消除不必要的跳跃 — 我们建议您设置 Amazon Snowball Edge 设备、数据源和运行它们之间终端连接的计算机,以便它们成为唯一通过单个交换机进行通信的计算机。这样做可以提高数据传输速度。