Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/27998
Título: | Efficient computation of CPW2000 using a CPU-GPU heterogeneous platform |
Autor(es): | Miranda, Pedro Miguel Linhares |
Orientador(es): | Proença, Alberto José Martins, José Luís |
Data: | 15-Dez-2011 |
Resumo(s): | The modelling and simulation of complex systems in natural science usually
require powerfull and expensive computational resources. The study of
the plane wave properties in crystals, based on quantum mechanichs pose
challenging questions to computer scientists to improve the e ciency of the
numerical methods and algorithms. Numerical libraries had a signi cant
boost in recent years, taking advantage of multi-threaded environments.
This dissertation work addresses e ciency improvements in a plane wave
package, CPW2000, developed by a physicist scientist, targeted to a heterogeneous
platform with multicore CPU and CUDA enabled GPU devices.
The performance botlenecks were previously identifed as being the module
functions with FFT computations, and the study started with the application
analysis and pro ling. This study shows that (i)over 90% of the code
execution time was spent in two functions, DGEMM and FFT, (ii) code ef-
ciency of current numerical libraries is hard to improve, and (iii) DGEMM
function calls were spread in the code, while FFT was concentrated in a
single function.
These features were adequately explored to develop a new code version
where parts of the code are computed on a multicore CPU with others taking
advantage of the GPU multistreaming and parallel computing power.
Experimental results show that CPU-GPU combined solutions o er near
10x speedup on the program routines that we proposed to improve, giving
us a promising future work. A modelação e simulação de sistemas complexos em áreas científicas geralmente necessita de enormes e dispendiosos recursos computacionais de processamento. O estudo das propriedades de cristais em ondas planas, com base na mecânica quântica, oferece alguns desafios aos cientistas da computação para melhorar a eficiência dos métodos numéricos e algoritmos. As bibliotecas numéricas evoluíram muito tirando vantagem de ambientes multi-threading de computação. O trabalho apresentado nesta dissertação baseia-se na melhoria da eficiência de um programa de ondas planas, o CPW2000, desenvolvido por um investigador da área da física, orientado para uma plataforma heterogénea de computação com um CPU multicore e um GPU com suporte à plataforma CUDA. As principais causas da deterioração da eficiência foram identificadas no módulo que contêm os cálculos de FFT, e o estudo começou com a análise dos tempos de execução de cada componente da aplicação. Este estudo mostra que (i) mais de 90% do tempo total de computação é dividido por duas funções, DGEMM e FFT, (ii) é difícil de melhorar a eficiência das bibliotecas numéricas atuais, e (iii) que as funções DGEMM estão distribuídas pela aplicação enquanto as funções FFT estão concentradas numa função. Estas características foram devidamente exploradas de forma a desenvolver código em que partes deste executa num CPU multicore e outras aproveitam o paralelismo e multistreaming presente nos GPU. Resultados experimentais mostram que as soluções combinadas de CPU-GPU oferecem uma melhoria de aproximadamente 10x nas funções que nos propusemos a melhorar a eficiência, culminando num trabalho futuro promissor. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Engenharia de Informática |
URI: | https://hdl.handle.net/1822/27998 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
eeum_di_dissertacao_pg15943.pdf | 1,42 MB | Adobe PDF | Ver/Abrir |