VASP中GPU并行编译安装的示例分析

发布时间:2021-06-13 09:46:30 作者:小新
来源:亿速云 阅读:1076

小编给大家分享一下VASP中GPU并行编译安装的示例分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!

安装CUDA

CUDA版本11.0及以上
略。。。

安装Intel编译器

##Intel编译器选择2021版免费的oneAPI,Base基础包+HPC包
sudo bash l_BaseKit_p_2021.2.0.2883_offline.sh
sudo bash l_HPCKit_p_2021.2.0.2997_offline.sh

##添加环境变量
编辑.bashrc或/etc/profile添加
source /opt/intel/oneapi/setvars.sh intel64

##编译fftw
cd /opt/intel/oneapi/mkl/2021.2.0/interfaces/fftw3xf/
make libintel64			#无权限可将/opt/intel/oneapi修改user属主属组

安装VASP

tar xvf vasp.6.1.0.tar.gz
cd vasp.6.1.0
cp arch/makefile.include.linux_intel makefile.include
修改文件makefile.include
make all

测试VASP

unzip test.zip
cd test 
mpirun  -np 30  vasp_std
mpirun  -np 30  vasp_gpu

makefile.include配置文件内容如下

#Precompiler options
CPP_OPTIONS= -DHOST=\"LinuxIFC\"\
			 -DMPI -DMPI_BLOCK=8000 -Duse_collective \
			 -DscaLAPACK \
			 -DCACHE_SIZE=4000 \
			 -Davoidalloc \
			 -Dvasp6 \
			 -Duse_bse_te \
			 -Dtbdyn \
			 -Dfock_dblbuf

CPP        = fpp -f_com=no -free -w0  $*$(FUFFIX) $*$(SUFFIX) $(CPP_OPTIONS)

FC         = mpiifort
FCL        = mpiifort -mkl=sequential

FREE       = -free -names lowercase

FFLAGS     = -assume byterecl -w -xHOST
OFLAG      = -O2
OFLAG_IN   = $(OFLAG)
DEBUG      = -O0

MKLROOT    = /opt/intel/oneapi/mkl/2021.2.0
MKL_PATH   = $(MKLROOT)/lib/intel64
BLAS       = -L$(MKL_PATH) -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread
LAPACK     = -L$(MKL_PATH) -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread
BLACS      = -lmkl_blacs_intelmpi_lp64
SCALAPACK  = $(MKL_PATH)/libmkl_scalapack_lp64.a $(BLACS)

OBJECTS    = fftmpiw.o fftmpi_map.o fft3dlib.o fftw3d.o \
			 $(MKLROOT)/interfaces/fftw3xf/libfftw3xf_intel.a

INCS       =-I$(MKLROOT)/include/fftw

LLIBS      = $(SCALAPACK) $(LAPACK) $(BLAS)


OBJECTS_O1 += fftw3d.o fftmpi.o fftmpiw.o
OBJECTS_O2 += fft3dlib.o

#For what used to be vasp.5.lib
CPP_LIB    = $(CPP)
FC_LIB     = $(FC)
CC_LIB     = icc
CFLAGS_LIB = -O
FFLAGS_LIB = -O1
FREE_LIB   = $(FREE)

OBJECTS_LIB= linpack_double.o getshmem.o

#For the parser library
CXX_PARS   = icpc
LLIBS      += -lstdc++

#Normally no need to change this
SRCDIR     = ../../src
BINDIR     = ../../bin

#================================================
#GPU Stuff

CPP_GPU    = -DCUDA_GPU -DRPROMU_CPROJ_OVERLAP -DUSE_PINNED_MEMORY -DCUFFT_MIN=28 -UscaLAPACK -Ufock_dblbuf

OBJECTS_GPU= fftmpiw.o fftmpi_map.o fft3dlib.o fftw3d_gpu.o fftmpiw_gpu.o

CC         = icc
CXX        = icpc
CFLAGS     = -fPIC -DADD_ -Wall -qopenmp -DMAGMA_WITH_MKL -DMAGMA_SETAFFINITY -DGPUSHMEM=300 -DHAVE_CUBLAS

CUDA_ROOT  ?= /usr/local/cuda/
NVCC       := $(CUDA_ROOT)/bin/nvcc -ccbin=icc -allow-unsupported-compiler
CUDA_LIB   := -L$(CUDA_ROOT)/lib64 -lnvToolsExt -lcudart -lcuda -lcufft -lcublas

GENCODE_ARCH    := -gencode=arch=compute_60,code=\"sm_60,compute_60\" \
				   -gencode=arch=compute_70,code=\"sm_70,compute_70\" \
				   -gencode=arch=compute_72,code=\"sm_72,compute_72\" \
				   -gencode=arch=compute_80,code=\"sm_80,compute_80\"
I_MPI_ROOT = /opt/intel/oneapi/mpi/2021.2.0
MPI_INC    = $(I_MPI_ROOT)/include/

看完了这篇文章,相信你对“VASP中GPU并行编译安装的示例分析”有了一定的了解,如果想了解更多相关知识,欢迎关注亿速云行业资讯频道,感谢各位的阅读!

推荐阅读:
  1. keras如何用多gpu并行运行
  2. Tensorflow如何实现多GPU并行

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

gpu

上一篇:易语言中怎么实现进程检测

下一篇:java中怎么操作List集合

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》