Please use this identifier to cite or link to this item: http://hdl.handle.net/1822/27885

Full metadata record
DC FieldValueLanguage
dc.contributor.advisorBelo, Orlando-
dc.contributor.authorRibeiro, Daniel José Silva-
dc.date.accessioned2014-02-10T15:48:54Z-
dc.date.available2014-02-10T15:48:54Z-
dc.date.issued2013-03-20-
dc.identifier.urihttp://hdl.handle.net/1822/27885-
dc.descriptionDissertação de mestrado em Engenharia Informáticapor
dc.description.abstractO Data Mining é um processo de exploração de grandes quantidades de dados, com um potencial enorme para ajudar as empresas na extração de conhecimento que está oculto nos mais diversos sistemas de dados. Esta tecnologia é utilizada pelas empresas nos mais variados domínios, com o intuito de as ajudar em atividades de tomada de decisões. Entre os diversos campos de aplicações encontramos o domínio da Biologia e do Ambiente, em particular, as questões relacionadas com as Estações de Tratamento de Águas Residuais (ETAR). As ETAR são infraestruturas essenciais para manter o equilíbrio do meio-ambiente, sendo caracterizadas por terem várias fases de tratamento, nas quais são removidas impurezas como sólidos, matéria orgânica e nutrientes. Todo este processo dinâmico e complexo deve ser processado de forma eficiente, permitindo que o efluente final que nelas é tratado tenha a melhor qualidade possível. A previsão da qualidade da água tratada, com base nos vários fluxos que dão entrada nas ETAR, permite medir a eficácia do tratamento e, assim, obter alguma informação útil para um melhor controle de toda a infraestrutura. A ETAR em estudo neste trabalho de dissertação, localiza-se no Norte de Portugal e serve uma população de cerca de 45 mil habitantes. Os dados fornecidos para alimentação dos processos de interação levados a cabo são referentes a tratamentos realizados nessa ETAR durante o período de um ano. Este estudo pretendeu explorar técnicas de Data Mining preditivas, nomeadamente modelos de regressão, por forma a prever com eficácia os valores dos parâmetros de qualidade da ETAR. As medidas de qualidade do tratamento analisadas neste estudo, basearam-se nos parâmetros de previsão Carência Bioquímica de Oxigénio (CBO) e Sólidos Suspensos Totais (SST). Por sua vez, as técnicas de regressão adotadas neste trabalho são baseadas em Support Vector Machines, mais concretamente nos algoritmos Support Vector Regression e numas das suas variantes: Sequential Minimal Optimization. Este conjunto de técnicas tem sido aplicadas com sucesso em diferentes áreas, inclusive em alguns trabalhos relacionados com as ETAR. Pretendeu-se assim, à custa da utilização destas técnicas de previsão, definir um modelo comportamental para a ETAR em questão, por forma a analisar a sua capacidade preditiva neste tipo de sistemas complexos. Neste problema, as fases de análise e preparação dos dados mostraram-se determinantes na obtenção dos resultados alcançados. Analisaram-se ainda as diversas tarefas de modelação desenvolvidas neste estudo. Os modelos desenvolvidos demonstraram uma boa capacidade preditiva, especialmente na previsão do parâmetro do efluente final CBO. As técnicas de previsão utilizadas, para além da capacidade de modelação preditiva não linear, permitem ainda uma análise aos atributos mais influentes à qualidade dos parâmetros de previsão.por
dc.description.abstractData mining is a process of exploration of large data sets with a huge potential to assist companies in the extraction of knowledge that is hidden in their data systems. Companies in various fields use this technology, in order to assist them in decision-making. Among the various fields are included the Biology and Environment domains, in particular, issues related to the Wastewater Treatment Plants (WWTP). WWTP are essential infrastructures to maintain the environmental balance. Treatment plants are characterized by having several treatment stages in which is done the removal of solids, organic matter and nutrients. All of this dynamic and complex process must be handled efficiently to ensure a good quality effluent. The prediction of the treated wastewater quality, based on the measured inflow parameters, allow the treatment performance evaluation and yet to obtain some useful information for a better control of the entire infrastructure. The data used in this study were collected from a WWTP located in northern Portugal that serves a population of about 45,000 inhabitants, whose data was provided regarding the treatments performed in this WWTP during one year. This study aimed to explore data mining techniques for prediction, namely regression models, in order to successfully predict the concentrations of the quality parameters like Biochemical Oxygen Demand (BOD) and Total Suspended Solids (TSS), which are actually the selected outflow parameters to be predicted in this work. The regression techniques used herein are based on Support Vector Machines (SVM), more particularly Support Vector Regression and in one of its variants: Sequential Minimal Optimization. This set of techniques has been successfully applied in different areas, including some WWTP related work, thus we intended to explore the SVM and analyze their predictive ability in this type of complex systems. The stages of data preparation and data analysis were shown to be crucial to obtain the results achieved. Several regression models for both predictive parameters were analyzed and compared, where the results show that accurate estimates can be achieved especially on the concentrations of BOD. The SVM, beyond the capability of non-linear predictive modeling, yet allow the analysis of the features that are most related to the quality of the prediction parameters.por
dc.language.isoporpor
dc.rightsopenAccesspor
dc.subjectData Miningpor
dc.subjectRegressãopor
dc.subjectSupport Vector Machinespor
dc.subjectSupport Vector Regressionpor
dc.subjectSequential Minimal Optimizationpor
dc.subjectEstações de Tratamento de Águas Residuaispor
dc.subjectCarência bioquímica de oxigéniopor
dc.subjectSólidos suspensos totaispor
dc.subjectPrevisão de comportamento de ETARspor
dc.subjectRegressionpor
dc.subjectWastewater Treatment Plantspor
dc.subjectBiochemical oxygen demandpor
dc.subjectTotal suspended solidspor
dc.subjectPrediction of WWTPs performancepor
dc.titleSupport Vector Machines na previsão do comportamento de uma ETARpor
dc.title.alternativeSupport Vector Machines on the prediction of a WWTP performanceeng
dc.typemasterThesispor
dc.commentseeum_di_dissertacao_pg17287por
dc.subject.udc628.1:681.3-
dc.subject.udc681.3:628.1-
dc.identifier.tid201195089por
Appears in Collections:BUM - Dissertações de Mestrado
DI - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
eeum_di_dissertacao_pg17287.pdf11,29 MBAdobe PDFView/Open

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID