Publicação

Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF

Ver documento

Detalhes bibliográficos
Resumo:Big data faz, cada vez mais, parte do nosso dia a dia e tem um impacto cada vez maior na nossa sociedade. Tem entusiasmado os investigadores para encontrarem novos métodos para lidar com conjuntos de dados muito grandes. Na análise das séries temporais, a mesma necessidade surge. Há algumas décadas, os investigadores batalhavam para encontrar séries de dados longas o suficiente para as analisar; hoje em dia, estão frequentemente sobrecarregados com conjuntos de dados que são demasiado grandes para lidar com métodos tradicionais. O objetivo deste trabalho é estudar e propor métodos para medir as semelhanças e diferenças entre diferentes séries temporais. Esses métodos devem ser computacionalmente simples e perdem, naturalmente, algumas informações, mas devem ser capazes de fornecer métricas que são adequadas para agrupar grandes conjuntos para extensas séries temporais. Para ser mais específica, estudo um método muito recente chamado periodograma fragmentado e confirmo por simulação, a sua utilidade para fornecer uma medida simples que leva ao agrupamento correto das séries temporais em consideração. Esta replicação dá al- gum conforto quanto à correção do exercício e leva a uma descoberta interessante sobre as regras de fragmentação. Portanto, proponho um método equivalente no domínio do tempo, o ACF fragmentado, e confirmo por simulação a sua utilidade. Finalmente, comparo os dois métodos e concluo que o ACF fragmentado tem um desempenho comparável, senão superior. As simulações são, naturalmente, limitadas a classes particulares de modelos, o que abre espaço para pesquisas futuras, como discuto na secção final.
Autores principais:Albino, Andreia Filipa Martins
Assunto:Big Data Séries Temporais Agrupamento de séries temporais periodograma fragmentado ACF fragmentado Time Series Time Series Clustering Fragmented-periodogram Fragmented-ACF
Ano:2021
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:Big data faz, cada vez mais, parte do nosso dia a dia e tem um impacto cada vez maior na nossa sociedade. Tem entusiasmado os investigadores para encontrarem novos métodos para lidar com conjuntos de dados muito grandes. Na análise das séries temporais, a mesma necessidade surge. Há algumas décadas, os investigadores batalhavam para encontrar séries de dados longas o suficiente para as analisar; hoje em dia, estão frequentemente sobrecarregados com conjuntos de dados que são demasiado grandes para lidar com métodos tradicionais. O objetivo deste trabalho é estudar e propor métodos para medir as semelhanças e diferenças entre diferentes séries temporais. Esses métodos devem ser computacionalmente simples e perdem, naturalmente, algumas informações, mas devem ser capazes de fornecer métricas que são adequadas para agrupar grandes conjuntos para extensas séries temporais. Para ser mais específica, estudo um método muito recente chamado periodograma fragmentado e confirmo por simulação, a sua utilidade para fornecer uma medida simples que leva ao agrupamento correto das séries temporais em consideração. Esta replicação dá al- gum conforto quanto à correção do exercício e leva a uma descoberta interessante sobre as regras de fragmentação. Portanto, proponho um método equivalente no domínio do tempo, o ACF fragmentado, e confirmo por simulação a sua utilidade. Finalmente, comparo os dois métodos e concluo que o ACF fragmentado tem um desempenho comparável, senão superior. As simulações são, naturalmente, limitadas a classes particulares de modelos, o que abre espaço para pesquisas futuras, como discuto na secção final.