Publicação

Aprendizagem automática para classificar a cobertura do solo em espaços verdes urbanos através de dados de satélite

Detalhes bibliográficos
Resumo:	Atualmente, a maioria da população mundial vive em cidades. A qualidade de vida nas cidades é fortemente afetada pelo planeamento urbano e particularmente, pela existência de Espaços Verdes Urbanos (EVU). A inventariação destes espaços é, por isso, da maior importância. As imagens da superfície terrestre obtidas por deteção remota, através de satélites artificiais, permitem identificar a cobertura do solo através do espectro eletromagnético. Esta é, no entanto uma tarefa complexa, devido à diversidade das caraterísticas envolvidas (árvores e arbustos, suas dimensões, o tipo de folhagem, lagos e respetivas margens) e à variabilidade temporal das imagens em função das estações do ano. Algoritmos de aprendizagem automática para classificação de objetos através de imagens de satélite, como por exemplo, Support Vector Machines (SVM), árvores de decisão, redes neuronais, têm sido amplamente utilizados na análise da cobertura e uso do solo o que sugere a pertinência da sua utilização para classificar a composição dos EVU, em particular, Redes Neuronais Convolucionais (RNC) aplicadas a imagens de satélite. O objetivo desta dissertação é verificar a eficácia de métodos de aprendizagem automática para classificar a cobertura do solo em EVU, a partir de dados extraídos de imagens de satélite. Foi utilizado um conjunto de dados pré classificados obtidos no âmbito do projeto Bioveins. Este projeto é uma parceria entre várias Universidades Europeias e a BiodivERsA the network programming and funding research on biodiversity and ecosystem services across European countries and territories. A Universidade de Lisboa é uma destas Universidades e por isso os dados foram extraídos e preparados pelo Departamento de Biologia Vegetal da FCUL. O conjunto de dados engloba 220 EVU em 7 cidades europeias (Lisboa, Almada, Zurique, Paris, Antuérpia, Poznan e Tartu). Os dados iniciais estão estruturados em três grupos. O primeiro grupo inclui as coordenadas geográficas do centróide do espaço de 10 metros por 10 metros que representa cada instância. O segundo grupo inclui 27 caraterísticas obtidas das imagens de satélite, nomeadamente as frequências do espectro eletromagnético visível e invisível ao olho humano, e um conjunto de índices de vegetação, solo, água, densidade urbana e outras variáveis biofísicas. Finalmente o terceiro grupo, corresponde à classificação dos componentes dos espaços, efetuada por observação no terreno. Esta classificação foi efetuada atribuindo uma percentagem a cada uma de 11 categorias: Allotment gardens, Artificial surfaces, Ornamental bed, Barelands, Grassland, Water surfaces, Riparian vegetation, Shrubs, Broad deciduous, Broad ever e Coniferous. Foram efetuadas três abordagens de aprendizagem automática. Numa primeira abordagem ao problema, aplicámos um método ensemble, floresta aleatória, criando um classificador binário para cada categoria. Para esta abordagem foram utilizados como unidade de entrada, os centróides dos espaços, sem qualquer transformação estrutural, mas o conjunto de dados foi transformado em 11 réplicas, uma para cada categoria, em que a cada instância, foi atribuída uma classe com o valor 0 ou 1, correspondendo à ausência ou presença da respetiva categoria. Na segunda abordagem, utilizámos um único classificador multiclasse, constituído por uma RNC. Os dados foram agrupados de forma a constituirem imagens para input da rede. A cada imagem foi atribuída uma classe através de um número inteiro correspondendo a uma das categorias, aquela com maior predominância nessa imagem, considerando todos os pontos que a formaram. A última abordagem baseou-se também numa RNC mas utilizando tantos classificadores quantas as categorias existentes. À semelhança do que foi feito para o método ensemble, cada imagem foi classificada com valores de 0 ou 1, correspondendo à ausência ou presença da categoria respetiva na imagem. A classificação binária pelo método ensemble não produziu resultados muito satisfatórios, mas ambas as abordagens com RNC evidenciaram serem bastante eficazes para a classificação dos EVU. A abordagem multiclasse apresenta vantagens pela simplicidade de implementação pois utiliza um único classificador. Os dados utilizados para aprendizagem apresentam um elevado desequilíbrio de classes, por isso a obtenção de mais dados e mais variados, poderá representar um desafio para futuro trabalho sobre o tema, assim como uma abordagem multilabel que pode permitir um resultado mais detalhado para cada espaço.
Autores principais:	Mão de Ferro, Adriano António Pinheiro
Assunto:	Espaços Verdes Urbanos Classificação de Imagens de Satélite Aprendizagem Automática Redes Neuronais Convolucionais Aprendizagem Profunda Teses de mestrado - 2021
Ano:	2021
País:	Portugal
Tipo de documento:	dissertação de mestrado
Tipo de acesso:	acesso aberto
Instituição associada:	Universidade de Lisboa
Idioma:	português
Origem:	Repositório da Universidade de Lisboa

Descrição
Resumo:	Atualmente, a maioria da população mundial vive em cidades. A qualidade de vida nas cidades é fortemente afetada pelo planeamento urbano e particularmente, pela existência de Espaços Verdes Urbanos (EVU). A inventariação destes espaços é, por isso, da maior importância. As imagens da superfície terrestre obtidas por deteção remota, através de satélites artificiais, permitem identificar a cobertura do solo através do espectro eletromagnético. Esta é, no entanto uma tarefa complexa, devido à diversidade das caraterísticas envolvidas (árvores e arbustos, suas dimensões, o tipo de folhagem, lagos e respetivas margens) e à variabilidade temporal das imagens em função das estações do ano. Algoritmos de aprendizagem automática para classificação de objetos através de imagens de satélite, como por exemplo, Support Vector Machines (SVM), árvores de decisão, redes neuronais, têm sido amplamente utilizados na análise da cobertura e uso do solo o que sugere a pertinência da sua utilização para classificar a composição dos EVU, em particular, Redes Neuronais Convolucionais (RNC) aplicadas a imagens de satélite. O objetivo desta dissertação é verificar a eficácia de métodos de aprendizagem automática para classificar a cobertura do solo em EVU, a partir de dados extraídos de imagens de satélite. Foi utilizado um conjunto de dados pré classificados obtidos no âmbito do projeto Bioveins. Este projeto é uma parceria entre várias Universidades Europeias e a BiodivERsA the network programming and funding research on biodiversity and ecosystem services across European countries and territories. A Universidade de Lisboa é uma destas Universidades e por isso os dados foram extraídos e preparados pelo Departamento de Biologia Vegetal da FCUL. O conjunto de dados engloba 220 EVU em 7 cidades europeias (Lisboa, Almada, Zurique, Paris, Antuérpia, Poznan e Tartu). Os dados iniciais estão estruturados em três grupos. O primeiro grupo inclui as coordenadas geográficas do centróide do espaço de 10 metros por 10 metros que representa cada instância. O segundo grupo inclui 27 caraterísticas obtidas das imagens de satélite, nomeadamente as frequências do espectro eletromagnético visível e invisível ao olho humano, e um conjunto de índices de vegetação, solo, água, densidade urbana e outras variáveis biofísicas. Finalmente o terceiro grupo, corresponde à classificação dos componentes dos espaços, efetuada por observação no terreno. Esta classificação foi efetuada atribuindo uma percentagem a cada uma de 11 categorias: Allotment gardens, Artificial surfaces, Ornamental bed, Barelands, Grassland, Water surfaces, Riparian vegetation, Shrubs, Broad deciduous, Broad ever e Coniferous. Foram efetuadas três abordagens de aprendizagem automática. Numa primeira abordagem ao problema, aplicámos um método ensemble, floresta aleatória, criando um classificador binário para cada categoria. Para esta abordagem foram utilizados como unidade de entrada, os centróides dos espaços, sem qualquer transformação estrutural, mas o conjunto de dados foi transformado em 11 réplicas, uma para cada categoria, em que a cada instância, foi atribuída uma classe com o valor 0 ou 1, correspondendo à ausência ou presença da respetiva categoria. Na segunda abordagem, utilizámos um único classificador multiclasse, constituído por uma RNC. Os dados foram agrupados de forma a constituirem imagens para input da rede. A cada imagem foi atribuída uma classe através de um número inteiro correspondendo a uma das categorias, aquela com maior predominância nessa imagem, considerando todos os pontos que a formaram. A última abordagem baseou-se também numa RNC mas utilizando tantos classificadores quantas as categorias existentes. À semelhança do que foi feito para o método ensemble, cada imagem foi classificada com valores de 0 ou 1, correspondendo à ausência ou presença da categoria respetiva na imagem. A classificação binária pelo método ensemble não produziu resultados muito satisfatórios, mas ambas as abordagens com RNC evidenciaram serem bastante eficazes para a classificação dos EVU. A abordagem multiclasse apresenta vantagens pela simplicidade de implementação pois utiliza um único classificador. Os dados utilizados para aprendizagem apresentam um elevado desequilíbrio de classes, por isso a obtenção de mais dados e mais variados, poderá representar um desafio para futuro trabalho sobre o tema, assim como uma abordagem multilabel que pode permitir um resultado mais detalhado para cada espaço.