推荐的 Inferentia 实例 - 深度学习 AMI
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

推荐的 Inferentia 实例

Amazon Inferentia 实例旨在为深度学习模型推理工作负载提供高性能和成本效益。具体来说,Inf2 实例类型使用 Amazon Inferentia 芯片和 Amazon Neuron SDK,后者与 TensorFlow 和 PyTorch 等流行的机器学习框架集成。

客户使用 Inf2 实例之后,能够以最低的云端成本来运行大规模的机器学习推理应用程序,例如搜索、推荐引擎、计算机视觉、语音识别、自然语言处理、个性化和欺诈检测。

注意

应将模型大小作为选择实例的一个考虑因素。如果模型超出了实例的可用 RAM,请为应用程序选择其他具有足够内存的实例类型。

有关 Amazon Amazon DLAMI 入门的更多信息,请参阅 带有 DLAMI 的 Amazon 推理芯片

后续步骤

推荐的 Trainium 实例