Publicação
Deteção de alterações em imagens de satélite SAR com redes neuronais profundas
| Resumo: | A monitorização da superfície terrestre é essencial para uma variedade de aplicações como, por exemplo, o planeamento urbano, a monitorização ambiental, ou a avaliação de desastres. As imagens de radar de abertura sintética são uma fonte de dados valiosa para este tipo de aplicações, uma vez que estas imagens podem ser adquiridas independentemente das condições meteorológicas e na ausência de luz natural. Esta dissertação teve como objetivo principal desenvolver e avaliar diferentes modelos de redes neuronais profundas para a deteção de alterações em imagens de satélite do tipo radar de abertura sintética, utilizando para isso imagens da mesma localização recolhidas em diferentes instantes temporais. No estado da arte são apresentados os conceitos necessários para desenvolver a dissertação como, por exemplo, o princípio de funcionamento dos sensores incluídos nos satélites do tipo radar de abertura sintética, os sistemas de referência de coordenadas, as projeções em mapas e os modelos tradicionais de aprendizagem automática. Foram desenvolvidos modelos de aprendizagem profunda, incluindo a U-Net, a TransUNet, a ResNet, a EfficientNet, o transformer de visão, o transformer de imagem bitemporal, a LightCDNet e a RSUNet. Estes modelos foram selecionados tendo em consideração o levantamento do estado da arte e a sua relevância na área da visão por computador. A U-Net, incluindo as suas variantes, destacou‑se dos restantes modelos, conseguindo melhores resultados quantitativos, medidos através da acurácia, precisão, coeficiente de Kappa, F1‑score e recall, assim como apresentou resultados qualitativamente superiores, avaliados pela comparação visual entre a previsão do modelo e a máscara de alterações verdadeira. Os resultados obtidos mostram que a U-Net e as suas variantes possuem uma arquitetura robusta capaz de extrair características essenciais para a tarefa de deteção de alterações. O melhor resultado obtido pela U-Net no conjunto de dados S1GFloodsDataset foi uma acurácia de 0.9769, uma precisão de 0.9640, um coeficiente de Kappa de 0.9468, um F1‑score de 0.9635 e um recall de 0.9631. Para o conjunto de dados Portugal v2, os valores obtidos para as mesmas métricas foram 0.7114, 0.5072, 0.3300, 0.5407 e 0.5788. No conjunto de dados Hokkaido, a U-Net obteve uma acurácia de 0.8843, uma precisão de 0.6456, um coeficiente de Kappa de 0.5416, um F1‑score de 0.6092 e um recall de 0.5767. Por fim, os valores alcançados no conjunto BraDD-S1TS para as mesmas métricas foram 0.8549, 0.5491, 0.4832, 0.5705 e 0.5936. O conjunto de dados S1GFloodsDataset permitiu melhores resultados do que os restantes porque as imagens SAR apresentavam menos ruído, a máscara de alterações estava definida com maior precisão e as alterações nas imagens eram mais percetíveis. Assim, concluiu‑se que as alterações em zonas cobertas por água, presentes no conjunto de dados S1GFloodsDataset, são mais facilmente identificadas pelos modelos do que as alterações em zonas com outro tipo de coberto, que são as alterações presentes nos outros conjuntos de dados. Além disso, as polarizações VV e VH das imagens SAR contribuem para identificar padrões distintos no terreno e são mais sensíveis às alterações nas superfícies cobertas por água. O principal problema encontrado no decorrer da dissertação foi não se ter acesso a conjuntos de dados extensos e anotados com uma máscara de alterações de qualidade, para se poder treinar os modelos mais complexos e evoluídos de forma supervisionada. |
|---|---|
| Autores principais: | Ferreira, André Manuel da Costa |
| Assunto: | Imagem de satélite Deteção de alterações Radar de abertura sintética Aprendizagem profunda Rede neuronal Satellite imagery Change detection Synthetic aperture radar Deep learning Neural network |
| Ano: | 2025 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade do Minho |
| Idioma: | português |
| Origem: | RepositóriUM - Universidade do Minho |
| Resumo: | A monitorização da superfície terrestre é essencial para uma variedade de aplicações como, por exemplo, o planeamento urbano, a monitorização ambiental, ou a avaliação de desastres. As imagens de radar de abertura sintética são uma fonte de dados valiosa para este tipo de aplicações, uma vez que estas imagens podem ser adquiridas independentemente das condições meteorológicas e na ausência de luz natural. Esta dissertação teve como objetivo principal desenvolver e avaliar diferentes modelos de redes neuronais profundas para a deteção de alterações em imagens de satélite do tipo radar de abertura sintética, utilizando para isso imagens da mesma localização recolhidas em diferentes instantes temporais. No estado da arte são apresentados os conceitos necessários para desenvolver a dissertação como, por exemplo, o princípio de funcionamento dos sensores incluídos nos satélites do tipo radar de abertura sintética, os sistemas de referência de coordenadas, as projeções em mapas e os modelos tradicionais de aprendizagem automática. Foram desenvolvidos modelos de aprendizagem profunda, incluindo a U-Net, a TransUNet, a ResNet, a EfficientNet, o transformer de visão, o transformer de imagem bitemporal, a LightCDNet e a RSUNet. Estes modelos foram selecionados tendo em consideração o levantamento do estado da arte e a sua relevância na área da visão por computador. A U-Net, incluindo as suas variantes, destacou‑se dos restantes modelos, conseguindo melhores resultados quantitativos, medidos através da acurácia, precisão, coeficiente de Kappa, F1‑score e recall, assim como apresentou resultados qualitativamente superiores, avaliados pela comparação visual entre a previsão do modelo e a máscara de alterações verdadeira. Os resultados obtidos mostram que a U-Net e as suas variantes possuem uma arquitetura robusta capaz de extrair características essenciais para a tarefa de deteção de alterações. O melhor resultado obtido pela U-Net no conjunto de dados S1GFloodsDataset foi uma acurácia de 0.9769, uma precisão de 0.9640, um coeficiente de Kappa de 0.9468, um F1‑score de 0.9635 e um recall de 0.9631. Para o conjunto de dados Portugal v2, os valores obtidos para as mesmas métricas foram 0.7114, 0.5072, 0.3300, 0.5407 e 0.5788. No conjunto de dados Hokkaido, a U-Net obteve uma acurácia de 0.8843, uma precisão de 0.6456, um coeficiente de Kappa de 0.5416, um F1‑score de 0.6092 e um recall de 0.5767. Por fim, os valores alcançados no conjunto BraDD-S1TS para as mesmas métricas foram 0.8549, 0.5491, 0.4832, 0.5705 e 0.5936. O conjunto de dados S1GFloodsDataset permitiu melhores resultados do que os restantes porque as imagens SAR apresentavam menos ruído, a máscara de alterações estava definida com maior precisão e as alterações nas imagens eram mais percetíveis. Assim, concluiu‑se que as alterações em zonas cobertas por água, presentes no conjunto de dados S1GFloodsDataset, são mais facilmente identificadas pelos modelos do que as alterações em zonas com outro tipo de coberto, que são as alterações presentes nos outros conjuntos de dados. Além disso, as polarizações VV e VH das imagens SAR contribuem para identificar padrões distintos no terreno e são mais sensíveis às alterações nas superfícies cobertas por água. O principal problema encontrado no decorrer da dissertação foi não se ter acesso a conjuntos de dados extensos e anotados com uma máscara de alterações de qualidade, para se poder treinar os modelos mais complexos e evoluídos de forma supervisionada. |
|---|