Dell AMD EPYC 7662 / NVIDIA Tesla A100

Softwares Instalados

Categoria: Programação

DeepMD-Kit-NVidia
Versão 2.1.1
Descrição DeepMD-Kit is a package written in Python/C++, designed to minimize the effort required to build deep learning based model of interatomic potential energy and force field and to perform molecular dynamics (MD). This brings new hopes to addressing the accuracy-versus-efficiency dilemma in molecular simulations. Applications of DeePMD-kit span from finite molecules to extended systems and from metallic systems to chemically bonded systems. The NVidia NGC DeePMD-kit container builds upon the NGC TensorFlow container, adding DeePMD-kit with LAMMPS plugin support.
Documentação Documentação
Licença licensed under GNU LGPLv3.0
Localização https://catalog.ngc.nvidia.com/orgs/hpc/containers/deepmd-kit

Como usar

Instalação customizada pela NVidia através do uso de 'container singularity', apenas para execuçõesi nas filas:
'testegpu','miggpu','umagpu' e 'duasgpus'

- Módulo para ativação:
module load deepmd-kit/nvidia-ngc
É importante utilizar as seguintes opções na execução de qualquer programa do DeePMD-kit, por exemplo, o programa 'dp':

$nv_deepmd dp train input.json

input.json = Arquivo de entrada de dados.

Utilize e adapte o modelo de script de submissão dependendo da fila que será utilizada.

Exemplo de script para submissao e processamento em filas do PBS (Fila: duasgpus)

#!/bin/bash
### Nome da fila de execucao ###
#PBS -q duasgpus

### Nome do job ###
#PBS -N teste

### Nome do arquivo de saida ###
#PBS -o saida

### Nome do arquivo de erros ###
#PBS -e erro

### Recursos necessarios para execucao:
###   1 node, 64 cpus, 1 gpu (fila umagpu) 
###   ou 1 node, 128 cpus, 2 gpus (fila duasgpus)
### Nao eh necessario especificar diretiva -l nodes=X,ppn=Y.
###  Numero de cpus eh configurado automaticamente de acordo com a fila

cd $PBS_O_WORKDIR
echo "-----------------------------------------"
echo "Inicio do job:" `date`

module load deepmd-kit/nvidia-ngc

export OMP_NUM_THREADS=2
export TF_INTRA_OP_PARALLELISM_THREADS=2
export TF_INTER_OP_PARALLELISM_THREADS=1

$nv_deepmd dp train input.json

echo "Final do job:" `date`
echo "-----------------------------------------"