Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/79989

TítuloPerformance tuning to determine electronic properties of materials with Quantum Espresso
Outro(s) título(s)Ajuste de desempenho para determinar propriedades eletrónicas de materiais com Quantum Espresso
Autor(es)Caldas, Sérgio Manuel Rodrigues
Orientador(es)Proença, Alberto José
Ribeiro, R. M.
Palavras-chaveBiblioteca ELPA
Computação paralela
Disselénio de tungsténio
Eficiência computacional
Intel KNL
Quantum Espress
Computational efficiency
ELPA-library
Parallel computing
Tungsten diselenide
Data23-Dez-2019
Resumo(s)Desde os anos 70, a teoria do funcional da densidade tem sido uma das técnicas mais utilizadas em física quântica para resolver a equação de Schrödinger, para determinar as propriedades eletrónicas dos materiais, usando funções de onda eletrónica e a energia de cada eletrão. O método de resolução do campo autoconsistente (sigla em inglês SCF) é um processo iterativo que calcula a densidade dos eletrões a partir de funções de onda. Estes cálculos com a equação de Schrödinger são realizados múltiplas vezes de forma sucessiva até se atingir a convergência autoconsistente. O SCF neste processo iterativo é atualmente calculado em pacotes de software dedicado, como o Quantum ESPRESSO (QE), um produto open-source em Fortran 90, para cálculo da estrutura eletrónica dos materiais. Sendo estes cálculos computacionalmente intensivos, a sua execução paralela permite melhorar o desempenho do processo de cálculo. O Quantum ESPRESSO (QE) suporta paralelismo em ambiente de memória distribuída, com message passing interface (MPI) e, mais recentemente, em memória partilhada, com OpenMP. A presente dissertação apresenta várias propostas de instalação e configuração desta fer ramenta. Estas propostas sugerem diferentes estratégias de paralelismo tendo em vista obter melhorias de desempenho deste tipo de simulações, comparativamente a um estudo anterior realizado nas mesmas condições de experimentação. Para o presente estudo foram utilizados processadores multicore e many-core do cluster SeARCH. Estes testes exploraram o impacto de versões multiprocesso com múltiplos fios de execução por processo, introduzi das em versões mais recentes do QE com desenvolvimento de paralelizações híbridas. Através de diferentes casos de teste, diferentes instalações e parâmetros configuráveis (número de pools) este trabalho explorou e procurou obter um ambiente de execução que melhor favorecia o desempenho de simulações do tungsten diselenide (WSe2) no cluster SeARCH. Os resultados obtidos nestes testes, onde se aconselham certas configurações e se desaconselham outras, destinam-se a ajudar as comunidades de Física a encontrar um ambiente de execução afinado em termos de desempenho, para o caso concreto deste tipo de simulações.
Since the 70’s, density functional theory (DFT) has been one of the most used techniques in quantum physics to solve the Schrödinger equation. The resolution of this equation assumes a prominent role in the characterization of the electronic properties of the materials, with the use of wave functions and the energy of each electron. The computation method follows an iterative process, known as self consistent field (SCF), to compute the electrons density from an initial set of wave functions. This iterative process successively recurs to the Schrödinger equation until it reaches a self-consistence convergence. The SCF computation uses QE, an open-source software package written in Fortran 90, to determine the electronic structure of materials. This calculation is computationally very intensive, requiring an adequate support for parallelism to improve the computation per formance to reach the convergence point. The QE already has message passing interface (MPI) support for distributed memory systems and recently introduced support for shared memory parallelization with OpenMP. This dissertation presents alternative approaches to adequately install and configure QE in a compute cluster with distributed memory nodes, where each node contains one or more multicore devices sharing the same memory address space. These approaches suggest different parallelism strategies that will reflect performance improvements on simulations, when compared to an earlier study, conducted under the same experimental conditions. The testbed uses multicore and many-core processors from the SeARCH cluster to mea sure the impact of multi-process simulations with multiple threads per process, recently introduced in QE with hybrid parallelizations. Using different case studies and through different installations and parameters config urations (number of pools), this work explored and aimed to reach an efficient execution environment for the simulations of tungsten diselenide (WSe2) in the SeARCH cluster. The obtained results in the experimental tests aim to help Physics communities to find the best performance environment for this type of simulations.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado em Computer Science
URIhttps://hdl.handle.net/1822/79989
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
DI - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Sergio Manuel Rodrigues Caldas.pdfDissertação de Mestrado4,33 MBAdobe PDFVer/Abrir

Este trabalho está licenciado sob uma Licença Creative Commons Creative Commons

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID