Please use this identifier to cite or link to this item: http://hdl.handle.net/1822/27885

TitleSupport Vector Machines na previsão do comportamento de uma ETAR
Other titlesSupport Vector Machines on the prediction of a WWTP performance
Author(s)Ribeiro, Daniel José Silva
Advisor(s)Belo, Orlando
KeywordsData Mining
Regressão
Support Vector Machines
Support Vector Regression
Sequential Minimal Optimization
Estações de Tratamento de Águas Residuais
Carência bioquímica de oxigénio
Sólidos suspensos totais
Previsão de comportamento de ETARs
Regression
Wastewater Treatment Plants
Biochemical oxygen demand
Total suspended solids
Prediction of WWTPs performance
Issue date20-Mar-2013
Abstract(s)O Data Mining é um processo de exploração de grandes quantidades de dados, com um potencial enorme para ajudar as empresas na extração de conhecimento que está oculto nos mais diversos sistemas de dados. Esta tecnologia é utilizada pelas empresas nos mais variados domínios, com o intuito de as ajudar em atividades de tomada de decisões. Entre os diversos campos de aplicações encontramos o domínio da Biologia e do Ambiente, em particular, as questões relacionadas com as Estações de Tratamento de Águas Residuais (ETAR). As ETAR são infraestruturas essenciais para manter o equilíbrio do meio-ambiente, sendo caracterizadas por terem várias fases de tratamento, nas quais são removidas impurezas como sólidos, matéria orgânica e nutrientes. Todo este processo dinâmico e complexo deve ser processado de forma eficiente, permitindo que o efluente final que nelas é tratado tenha a melhor qualidade possível. A previsão da qualidade da água tratada, com base nos vários fluxos que dão entrada nas ETAR, permite medir a eficácia do tratamento e, assim, obter alguma informação útil para um melhor controle de toda a infraestrutura. A ETAR em estudo neste trabalho de dissertação, localiza-se no Norte de Portugal e serve uma população de cerca de 45 mil habitantes. Os dados fornecidos para alimentação dos processos de interação levados a cabo são referentes a tratamentos realizados nessa ETAR durante o período de um ano. Este estudo pretendeu explorar técnicas de Data Mining preditivas, nomeadamente modelos de regressão, por forma a prever com eficácia os valores dos parâmetros de qualidade da ETAR. As medidas de qualidade do tratamento analisadas neste estudo, basearam-se nos parâmetros de previsão Carência Bioquímica de Oxigénio (CBO) e Sólidos Suspensos Totais (SST). Por sua vez, as técnicas de regressão adotadas neste trabalho são baseadas em Support Vector Machines, mais concretamente nos algoritmos Support Vector Regression e numas das suas variantes: Sequential Minimal Optimization. Este conjunto de técnicas tem sido aplicadas com sucesso em diferentes áreas, inclusive em alguns trabalhos relacionados com as ETAR. Pretendeu-se assim, à custa da utilização destas técnicas de previsão, definir um modelo comportamental para a ETAR em questão, por forma a analisar a sua capacidade preditiva neste tipo de sistemas complexos. Neste problema, as fases de análise e preparação dos dados mostraram-se determinantes na obtenção dos resultados alcançados. Analisaram-se ainda as diversas tarefas de modelação desenvolvidas neste estudo. Os modelos desenvolvidos demonstraram uma boa capacidade preditiva, especialmente na previsão do parâmetro do efluente final CBO. As técnicas de previsão utilizadas, para além da capacidade de modelação preditiva não linear, permitem ainda uma análise aos atributos mais influentes à qualidade dos parâmetros de previsão.
Data mining is a process of exploration of large data sets with a huge potential to assist companies in the extraction of knowledge that is hidden in their data systems. Companies in various fields use this technology, in order to assist them in decision-making. Among the various fields are included the Biology and Environment domains, in particular, issues related to the Wastewater Treatment Plants (WWTP). WWTP are essential infrastructures to maintain the environmental balance. Treatment plants are characterized by having several treatment stages in which is done the removal of solids, organic matter and nutrients. All of this dynamic and complex process must be handled efficiently to ensure a good quality effluent. The prediction of the treated wastewater quality, based on the measured inflow parameters, allow the treatment performance evaluation and yet to obtain some useful information for a better control of the entire infrastructure. The data used in this study were collected from a WWTP located in northern Portugal that serves a population of about 45,000 inhabitants, whose data was provided regarding the treatments performed in this WWTP during one year. This study aimed to explore data mining techniques for prediction, namely regression models, in order to successfully predict the concentrations of the quality parameters like Biochemical Oxygen Demand (BOD) and Total Suspended Solids (TSS), which are actually the selected outflow parameters to be predicted in this work. The regression techniques used herein are based on Support Vector Machines (SVM), more particularly Support Vector Regression and in one of its variants: Sequential Minimal Optimization. This set of techniques has been successfully applied in different areas, including some WWTP related work, thus we intended to explore the SVM and analyze their predictive ability in this type of complex systems. The stages of data preparation and data analysis were shown to be crucial to obtain the results achieved. Several regression models for both predictive parameters were analyzed and compared, where the results show that accurate estimates can be achieved especially on the concentrations of BOD. The SVM, beyond the capability of non-linear predictive modeling, yet allow the analysis of the features that are most related to the quality of the prediction parameters.
TypeMaster thesis
DescriptionDissertação de mestrado em Engenharia Informática
URIhttp://hdl.handle.net/1822/27885
AccessOpen access
Appears in Collections:BUM - Dissertações de Mestrado
DI - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
eeum_di_dissertacao_pg17287.pdf11,29 MBAdobe PDFView/Open

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID