本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
TensorFlow和 Horovod 在一起
本教程展示了如何TensorFlow使用 Horovod 在 Amazon Deep Learning AMI (DLAMI) 上使用 Conda 进行激活。Horovod 已预先安装在 Conda 环境中,用于. TensorFlow 推荐使用 Python3 环境。
注意
仅支持 P3.*、P2.* 和 G3.* 实例类型。
用 Conda 在 DLAMI 上激活TensorFlow和测试 Horovod
-
使用 Conda 打开 DLAMI 的亚马逊弹性计算云 (亚马逊 EC2) 实例。要获得入门 DLAMI 的帮助,请参阅。如何开始使用 DLAMI
-
(推荐)对于搭载 CUDA 11 的 Python 3 上的 Horovod 的 TensorFlow 1.15,运行以下命令:
$
source activate tensorflow_p37 -
启动 iPython 终端:
(tensorflow_p37)$
ipython -
TensorFlow使用 Horovod 测试导入以验证其是否正常运行:
import horovod.tensorflow as hvd hvd.init()
以下内容可能显示在您的屏幕上(您可能会忽略任何警告消息)。
-------------------------------------------------------------------------- [[55425,1],0]: A high-performance Open MPI point-to-point messaging module was unable to find any relevant network interfaces: Module: OpenFabrics (openib) Host: ip-172-31-72-4 Another transport will be used instead, although this may result in lower performance. --------------------------------------------------------------------------
更多信息
有关教程,请参阅 DLAMI 主目录中的
examples/horovod
文件夹。如需更多教程和示例,请参阅 Horovod 项目GitHub
。