Publicação
Forecasting na previsão da incidência de pneumonia em Portugal Continental
| Resumo: | A incidência de pneumonia tem vindo a aumentar na última década e, em Portugal, é a principal causa de morte e de internamentos hospitalares, representando um sério problema para o qual é necessário um estudo mais aprofundado de forma a obter novos conhecimentos e perceções sobre este fenómeno. É neste sentido que a Fundação Portuguesa do Pulmão em parceria com a Universidade do Minho tem vindo a desenvolver vários estudos, com o objetivo de caraterizar a população Portuguesa no que diz respeito a doenças respiratórias. O trabalho a realizar nesta dissertação de mestrado surge com o objetivo de dar seguimento aos estudos já realizados através da aplicação de técnicas de time-series forecasting para a previsão deste fenómeno, nomeadamente, o número de casos de pneumonias e vítimas mortais em Portugal Continental, onde foram utilizados algoritmos de Data Mining para identificar modelos preditivos. Este conhecimento poderá ser útil para uma tomada de decisão mais eficaz, por parte da Fundação Portuguesa do Pulmão, ao possibilitar a identificação de padrões temporais sobre a doença. Numa primeira parte, o trabalho resultou na realização de um enquadramento conceptual, baseado em literatura relevante, acerca de conceitos associados ao Data Mining, dando relevância ao conceito e técnicas de forecasting e algoritmos disponíveis que podem ser aplicados em contextos de séries temporais. Apesar de existir uma grande variedade de literatura sobre a aplicação de técnicas de Data Mining em contextos de previsão, quando se fala sobre previsão de séries temporais a informação é mais limitada. Além disso, apesar de existirem alguns de trabalhos realizados neste contexto, não são percetíveis na literatura, trabalhos relacionados com a previsão de fenómenos associados à pneumonia. Posto isto, o trabalho prosseguiu com a aplicação de metodologia CRISP-DM para a determinação de modelos preditivos para a série do número de casos de pneumonias e para a série do número de vítimas mortais. Primeiramente foi realizada uma caracterização dos dados, numa perspetiva temporal, para tentar identificar relações destas séries com outras variáveis incluídas no Data Warehouse, de onde resultou a identificação de algumas relações com outras variáveis. Tendo em conta esta informação, foram testados vários algoritmos com diferentes condições de teste e, posteriormente, foram comparados e avaliados de acordo com a precisão dos mesmos. Daqui foi possível identificar um modelo preditivo, para cada uma das séries, capaz de prever os respetivos fenómenos com elevado desempenho e os quais podem ser utilizados para fazer inferências sobre outras variáveis com as quais são visíveis padrões de relacionamento. |
|---|---|
| Autores principais: | Veloso, Sara Isabel Ferreira |
| Assunto: | Time-series forecasting Data mining Séries temporais Modelos preditivos Time-series Predictive models |
| Ano: | 2017 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso restrito |
| Instituição associada: | Universidade do Minho |
| Idioma: | português |
| Origem: | RepositóriUM - Universidade do Minho |
| Resumo: | A incidência de pneumonia tem vindo a aumentar na última década e, em Portugal, é a principal causa de morte e de internamentos hospitalares, representando um sério problema para o qual é necessário um estudo mais aprofundado de forma a obter novos conhecimentos e perceções sobre este fenómeno. É neste sentido que a Fundação Portuguesa do Pulmão em parceria com a Universidade do Minho tem vindo a desenvolver vários estudos, com o objetivo de caraterizar a população Portuguesa no que diz respeito a doenças respiratórias. O trabalho a realizar nesta dissertação de mestrado surge com o objetivo de dar seguimento aos estudos já realizados através da aplicação de técnicas de time-series forecasting para a previsão deste fenómeno, nomeadamente, o número de casos de pneumonias e vítimas mortais em Portugal Continental, onde foram utilizados algoritmos de Data Mining para identificar modelos preditivos. Este conhecimento poderá ser útil para uma tomada de decisão mais eficaz, por parte da Fundação Portuguesa do Pulmão, ao possibilitar a identificação de padrões temporais sobre a doença. Numa primeira parte, o trabalho resultou na realização de um enquadramento conceptual, baseado em literatura relevante, acerca de conceitos associados ao Data Mining, dando relevância ao conceito e técnicas de forecasting e algoritmos disponíveis que podem ser aplicados em contextos de séries temporais. Apesar de existir uma grande variedade de literatura sobre a aplicação de técnicas de Data Mining em contextos de previsão, quando se fala sobre previsão de séries temporais a informação é mais limitada. Além disso, apesar de existirem alguns de trabalhos realizados neste contexto, não são percetíveis na literatura, trabalhos relacionados com a previsão de fenómenos associados à pneumonia. Posto isto, o trabalho prosseguiu com a aplicação de metodologia CRISP-DM para a determinação de modelos preditivos para a série do número de casos de pneumonias e para a série do número de vítimas mortais. Primeiramente foi realizada uma caracterização dos dados, numa perspetiva temporal, para tentar identificar relações destas séries com outras variáveis incluídas no Data Warehouse, de onde resultou a identificação de algumas relações com outras variáveis. Tendo em conta esta informação, foram testados vários algoritmos com diferentes condições de teste e, posteriormente, foram comparados e avaliados de acordo com a precisão dos mesmos. Daqui foi possível identificar um modelo preditivo, para cada uma das séries, capaz de prever os respetivos fenómenos com elevado desempenho e os quais podem ser utilizados para fazer inferências sobre outras variáveis com as quais são visíveis padrões de relacionamento. |
|---|