安装horovod要诀

type
status
date
slug
summary
tags
category
icon
password
comment_flag
SLUGS

安装

  1. 建议编译安装nccl。(在https://github.com/NVIDIA/nccl/tags下载)。
    1. 关于NVCC_GENCODE的获取(来源),执行如下shell脚本:
  1. 添加NCCL_HOME环境变量(.zshrc中)。
    1.  
  1. 跑通nccl-tests,见https://github.com/NVIDIA/nccl-tests,只有保证通过nccl-tests才可进行horovod安装,否则horovod不会被正确构建。
  1. 安装openmpi,archlinux发行版下,直接sudo pacman -S openmpi。编译安装可参考http://hmli.ustc.edu.cn/doc/mpi/openmpi-install.htm
    1. .zshrc中添加:
  1. 安装horovod:
    1.  
  1. https://github.com/horovod/horovod/tree/master/examples下载demo来进行测试,如:
     
    如果第6步显示:
    根据https://github.com/NVIDIA/nccl/issues/631知道P2P不能正常启用可能会降低性能。解决方案:保证bios关闭了虚拟化(按照这个帖子检查是否开启了虚拟化),然后添加内核参数iommu=pt,重启。
    Loading...