Publicação

Investigating functional connectivity in Autism Spectrum Disorder with graph neural networks

Ver documento

Detalhes bibliográficos
Resumo:A Perturbação do Espetro do Autismo (PEA) abrange um grupo clinicamente diverso de distúrbios do neurodesenvolvimento, caracterizados por traços comportamentais que afetam a comunicação e a interação social, bem como comportamentos e interesses restritivos e repetitivos. O termo "espetro" reflete a ampla gama de severidade nas dimensões cognitivas e comportamentais entre os indivíduos diagnosticados. As causas e mecanismos exatos da PEA permanecem pouco claros, sendo considerada um distúrbio complexo influenciado por fatores genéticos e ambientais e as suas interações. As estimativas de prevalência da PEA situam-se entre 1% e 1,5% da população em geral. Considerando a falta de biomarcadores clinicamente relevantes, o diagnóstico da PEA ainda se baseia na apresentação comportamental, o que faz com que a taxa de deteção atual seja inferior à sua prevalência real. Esta lacuna destaca a necessidade de investigar os mecanismos neuronais subjacentes à PEA e desenvolver métodos de diagnóstico mais objetivos. A PEA é altamente heterogénea em termos de etiologia, fenótipo e desenvolvimento, dificultando que modelos de aprendizagem profunda desenvolvidos obtenham bons resultados na tarefa de diagnóstico, pois estes recorrem apenas a informação individual sobre cada sujeito, sem considerar a informação relacional entre os sujeitos. Recentemente, as Redes Neurais de Grafos (RNGs) surgiram como uma abordagem promissora para enfrentar essa heterogeneidade. As RNGs podem operar em grafos onde cada nó representa um sujeito e cada aresta representa a relação entre dois sujeitos com base em informações complementares, como a idade ou o sexo. Esta abordagem tem potencial para contribuir para uma melhor compreensão e diagnóstico da PEA. Alguns estudos têm proposto RNGs para o diagnóstico da PEA com este tipo de abordagem. Contudo, a maioria utiliza um tipo de contexto de aprendizagem chamado de aprendizagem transdutiva, no qual a RNG é treinada e testada no mesmo grafo, não apresentando capacidade de generalização para novos dados. Por outro lado, num contexto médico é preponderante que as classificações realizadas pelo modelo sejam interpretáveis. Por conseguinte, métodos de inteligência artificial explicável (IAE) têm sido desenvolvidos especificamente para aumentar a transparência das decisões feitas por redes neurais de grafos. Deste modo, nesta dissertação, o objetivo centrou-se em explorar o potencial das RNGs para diagnosticar PEA, ao desenvolver uma RNG num contexto de aprendizagem indutiva em que o modelo é capaz de generalizar para dados independentes do grafo de treino, enquanto se investigam as alterações de conectividade funcional (CF) associadas à doença através de um método de IAE. Para atingir estes objetivos, foram usados dados de ressonância magnética funcional (RMf) em estado de repouso de 871 sujeitos (403 com PEA e 468 com desenvolvimento típico). Estas imagens são provenientes da base de dados ABIDE e já tinham sido previamente processadas no âmbito do Preprocessed Connectomes Project (PCP). A abordagem de pré-processamento incluiu: correção temporal, correção de movimento, normalização da intensidade do voxel e remoção de ruído dos dados, através da regressão de potenciais efeitos perturbadores (como movimento da cabeça, respiração e pulsação cardíaca). Incluiu também filtragem com um filtro passa-banda (0,01 - 0,1 Hz) e os dados foram alinhados com o cérebro padrão Montreal Neurological Institute 152 (MNI152). Cada cérebro foi segmentado em regiões corticais e subcorticais utilizando o atlas anatómico Harvard-Oxford de 111 regiões. Foi gerada a matriz de CF para cada indivíduo recorrendo ao cálculo do coeficiente de correlação de Pearson entre as séries temporais extraídas de cada região. O conjunto das matrizes de CF foi dividido em conjuntos de desenvolvimento (80%) e teste (20%) para que, após o desenvolvimento do modelo de diagnóstico, a sua capacidade de generalização pudesse ser avaliada. Em seguida, os dados foram estruturados em formato de grafo. Os nós representaram individuos e foram representados pelas matrizes de CF vetorizadas. As arestas entre os sujeitos representavam as relações entre eles e foram baseadas na similariedade de idade, sexo, local de aquisição das imagens de RMf e na correlação entre as respetivas matrizes de CF. As arestas que ligavam sujeitos com pouca similaridade foram removidas. Após a preparação dos dados, a RNG foi desenvolvida e otimizada. A rede neural de grafos construída é composta por quatro camadas de graph attention network (GAT) seguidas por um classificador com duas camadas totalmente conectadas. Nas camadas GAT foram incorporadas skip connections para evitar o problema frequente em RNGs de oversmoothing. Como hiperparâmetros a otimizar foram escolhidos: a função de ativação, o número de filtros de cada camada GAT, a taxa de aprendizagem, a taxa de dropout, o número de épocas de treino, e o parâmetro L2 de regularização. A otimização foi efetuada através da validação cruzada com 10 folds no conjunto de dados de desenvolvimento. Da otimização de hiperparâmetros, foi selecionado o modelo que apresentou os melhores valores de média de cada métrica. O modelo com melhor desempenho incluiu a função de ativação PReLU, 64 filtros em cada camada GAT, uma taxa de aprendizadem de 0,0001, uma taxa de dropout de 0,4 e o parâmetro L2 igual a 5,0×10−2 . Foi necessário desenvolver um critério de early stopping para regularizar mais o modelo e, particularmente, diminuir os efeitos de flutuações significativas no valor de accuracy de validação do modelo, que foram encontradas durante o treino. Para verificar como o modelo desenvolvido se comparava a outros modelos atuais da literatura que usam RNGs para a classificação de PEA, o modelo foi comparado com dois modelos conhecidos, comparação essa que ocorreu recorrendo à aprendizagem transdutiva para uma comparação justa. Desta comparação, notou-se que as flutuações encontradas nos valores da accuracy de validação durante o treino também ocorriam em ambos os modelos de comparação. Em geral, o modelo desenvolvido apresentou resultados mais estáveis e melhor desempenho. Em seguida, o modelo com o conjunto de hiperparâmetros que obteve a melhor performance foi treinado no conjunto de desenvolvimento e avaliado no conjunto de teste independente num contexto de aprendizagem indutiva. O modelo provou ser menos generalizável do que o ideal, notando-se principalmente uma dificuldade em classificar indivíduos com autismo. Este é, de facto, um problema comum a vários modelos de classificação de PEA na literatura que usam o ABIDE, e está associado à heterogeneidade inerente à doença e ao conjunto de dados do ABIDE, que inclui dados de vários locais com diferentes protocolos de aquisição, o que dificulta que o modelo capte toda a variablidade dos dados. Para além disso, considerando que a dimensionalidade das características dos nós é demasiado elevada relativamente ao número de dados, hipotetizou-se que o modelo está a sofrer do fenómeno de curse of dimensionality. Este fenómeno explica as flutuações presentes no valor da accuracy de validação e a menor capacidade de generalização. Para tentar interpretar as classificações efetuadas pelo modelo no conjunto de dados independente, recorreu-se ao GNNExplainer, um método de IAE criado especificamente para atuar em RNGs, baseado na perturbação das características dos dados para identificar as características mais relevantes para a classificação feita pela RNG. Com o GNNExplainer, foram identificadas as conexões funcionais entre regiões cerebrais com maior relevância para o diagnóstico da PEA. De forma a verificar o impacto destas para os diagnósticos feitos pelo modelo, foram efetuados estudos de ablação, nos quais se removeram as conexões funcionais mais importantes. Estes estudos, para além de mostrarem a relevância das conexões identificadas, permitiram verificar a existência de características redundantes, o que não é surpresa num caso de elevada dimensionalidade das características dos dados. As regiões cerebrais identificadas e as suas conexões funcionais enfatizam os papéis do processamento visual, particularmente do reconhecimento facial, e do processamento linguístico e autorreferencial na PEA. As disrupções encontradas são frequentemente relatadas na literatura e contribuem para os sintomas principais da PEA, estando especificamente associadas com as dificuldades na comunicação social. No entanto, apenas uma das dez conexões identificadas resistiu à análise estatística entre a amostra de indivíduos com PEA e os controlos e se mostrou significativa - a subconectividade entre o córtex fusiforme occipital temporal esquerdo e o planum polare esquerdo na PEA, que poderá estar associada ao reconhecimento e nomeação de objetos e faces de pessoas. Os resultados desta dissertação revelam o potencial das RNGs para o diagnóstico da PEA. Apesar do modelo não ter superado a performance reportada por outros estudos que utilizam modelos de aprendizagem profunda na literatura, conseguiu superar dois dos modelos de classificação que usam RNGs para a classificação de PEA com o ABIDE, que foram treinados nas mesmas condições que o modelo desenvolvido. Inclusive, permitiu identificar outra causa possível para a dificuldade em criar modelos ótimos de diagnóstico para PEA usando este tipo de abordagem, para além da heterogeneidade da doença e da base de dados - a elevada dimensionalidade das características dos dados. Por outro lado, explorou um método de IAE na RNG desenvolvida, com resultados concordantes com a literatura relativa às disfunções de conexões funcionais encontradas associadas à PEA. Assim, os objetivos delineados para esta dissertação foram cumpridos, e este trabalho poderá contribuir para a superação dos problemas patentes no desenvolvimento de modelos de inteligência artificial de diagnóstico da PEA.
Autores principais:Lopes, Henrique Vicente
Assunto:Rede Neural de Grafos Inteligência Artificial Explicável Perturbação do Espetro do Autismo Conectividade Funcional Aprendizagem Profunda Teses de mestrado - 2024
Ano:2024
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:A Perturbação do Espetro do Autismo (PEA) abrange um grupo clinicamente diverso de distúrbios do neurodesenvolvimento, caracterizados por traços comportamentais que afetam a comunicação e a interação social, bem como comportamentos e interesses restritivos e repetitivos. O termo "espetro" reflete a ampla gama de severidade nas dimensões cognitivas e comportamentais entre os indivíduos diagnosticados. As causas e mecanismos exatos da PEA permanecem pouco claros, sendo considerada um distúrbio complexo influenciado por fatores genéticos e ambientais e as suas interações. As estimativas de prevalência da PEA situam-se entre 1% e 1,5% da população em geral. Considerando a falta de biomarcadores clinicamente relevantes, o diagnóstico da PEA ainda se baseia na apresentação comportamental, o que faz com que a taxa de deteção atual seja inferior à sua prevalência real. Esta lacuna destaca a necessidade de investigar os mecanismos neuronais subjacentes à PEA e desenvolver métodos de diagnóstico mais objetivos. A PEA é altamente heterogénea em termos de etiologia, fenótipo e desenvolvimento, dificultando que modelos de aprendizagem profunda desenvolvidos obtenham bons resultados na tarefa de diagnóstico, pois estes recorrem apenas a informação individual sobre cada sujeito, sem considerar a informação relacional entre os sujeitos. Recentemente, as Redes Neurais de Grafos (RNGs) surgiram como uma abordagem promissora para enfrentar essa heterogeneidade. As RNGs podem operar em grafos onde cada nó representa um sujeito e cada aresta representa a relação entre dois sujeitos com base em informações complementares, como a idade ou o sexo. Esta abordagem tem potencial para contribuir para uma melhor compreensão e diagnóstico da PEA. Alguns estudos têm proposto RNGs para o diagnóstico da PEA com este tipo de abordagem. Contudo, a maioria utiliza um tipo de contexto de aprendizagem chamado de aprendizagem transdutiva, no qual a RNG é treinada e testada no mesmo grafo, não apresentando capacidade de generalização para novos dados. Por outro lado, num contexto médico é preponderante que as classificações realizadas pelo modelo sejam interpretáveis. Por conseguinte, métodos de inteligência artificial explicável (IAE) têm sido desenvolvidos especificamente para aumentar a transparência das decisões feitas por redes neurais de grafos. Deste modo, nesta dissertação, o objetivo centrou-se em explorar o potencial das RNGs para diagnosticar PEA, ao desenvolver uma RNG num contexto de aprendizagem indutiva em que o modelo é capaz de generalizar para dados independentes do grafo de treino, enquanto se investigam as alterações de conectividade funcional (CF) associadas à doença através de um método de IAE. Para atingir estes objetivos, foram usados dados de ressonância magnética funcional (RMf) em estado de repouso de 871 sujeitos (403 com PEA e 468 com desenvolvimento típico). Estas imagens são provenientes da base de dados ABIDE e já tinham sido previamente processadas no âmbito do Preprocessed Connectomes Project (PCP). A abordagem de pré-processamento incluiu: correção temporal, correção de movimento, normalização da intensidade do voxel e remoção de ruído dos dados, através da regressão de potenciais efeitos perturbadores (como movimento da cabeça, respiração e pulsação cardíaca). Incluiu também filtragem com um filtro passa-banda (0,01 - 0,1 Hz) e os dados foram alinhados com o cérebro padrão Montreal Neurological Institute 152 (MNI152). Cada cérebro foi segmentado em regiões corticais e subcorticais utilizando o atlas anatómico Harvard-Oxford de 111 regiões. Foi gerada a matriz de CF para cada indivíduo recorrendo ao cálculo do coeficiente de correlação de Pearson entre as séries temporais extraídas de cada região. O conjunto das matrizes de CF foi dividido em conjuntos de desenvolvimento (80%) e teste (20%) para que, após o desenvolvimento do modelo de diagnóstico, a sua capacidade de generalização pudesse ser avaliada. Em seguida, os dados foram estruturados em formato de grafo. Os nós representaram individuos e foram representados pelas matrizes de CF vetorizadas. As arestas entre os sujeitos representavam as relações entre eles e foram baseadas na similariedade de idade, sexo, local de aquisição das imagens de RMf e na correlação entre as respetivas matrizes de CF. As arestas que ligavam sujeitos com pouca similaridade foram removidas. Após a preparação dos dados, a RNG foi desenvolvida e otimizada. A rede neural de grafos construída é composta por quatro camadas de graph attention network (GAT) seguidas por um classificador com duas camadas totalmente conectadas. Nas camadas GAT foram incorporadas skip connections para evitar o problema frequente em RNGs de oversmoothing. Como hiperparâmetros a otimizar foram escolhidos: a função de ativação, o número de filtros de cada camada GAT, a taxa de aprendizagem, a taxa de dropout, o número de épocas de treino, e o parâmetro L2 de regularização. A otimização foi efetuada através da validação cruzada com 10 folds no conjunto de dados de desenvolvimento. Da otimização de hiperparâmetros, foi selecionado o modelo que apresentou os melhores valores de média de cada métrica. O modelo com melhor desempenho incluiu a função de ativação PReLU, 64 filtros em cada camada GAT, uma taxa de aprendizadem de 0,0001, uma taxa de dropout de 0,4 e o parâmetro L2 igual a 5,0×10−2 . Foi necessário desenvolver um critério de early stopping para regularizar mais o modelo e, particularmente, diminuir os efeitos de flutuações significativas no valor de accuracy de validação do modelo, que foram encontradas durante o treino. Para verificar como o modelo desenvolvido se comparava a outros modelos atuais da literatura que usam RNGs para a classificação de PEA, o modelo foi comparado com dois modelos conhecidos, comparação essa que ocorreu recorrendo à aprendizagem transdutiva para uma comparação justa. Desta comparação, notou-se que as flutuações encontradas nos valores da accuracy de validação durante o treino também ocorriam em ambos os modelos de comparação. Em geral, o modelo desenvolvido apresentou resultados mais estáveis e melhor desempenho. Em seguida, o modelo com o conjunto de hiperparâmetros que obteve a melhor performance foi treinado no conjunto de desenvolvimento e avaliado no conjunto de teste independente num contexto de aprendizagem indutiva. O modelo provou ser menos generalizável do que o ideal, notando-se principalmente uma dificuldade em classificar indivíduos com autismo. Este é, de facto, um problema comum a vários modelos de classificação de PEA na literatura que usam o ABIDE, e está associado à heterogeneidade inerente à doença e ao conjunto de dados do ABIDE, que inclui dados de vários locais com diferentes protocolos de aquisição, o que dificulta que o modelo capte toda a variablidade dos dados. Para além disso, considerando que a dimensionalidade das características dos nós é demasiado elevada relativamente ao número de dados, hipotetizou-se que o modelo está a sofrer do fenómeno de curse of dimensionality. Este fenómeno explica as flutuações presentes no valor da accuracy de validação e a menor capacidade de generalização. Para tentar interpretar as classificações efetuadas pelo modelo no conjunto de dados independente, recorreu-se ao GNNExplainer, um método de IAE criado especificamente para atuar em RNGs, baseado na perturbação das características dos dados para identificar as características mais relevantes para a classificação feita pela RNG. Com o GNNExplainer, foram identificadas as conexões funcionais entre regiões cerebrais com maior relevância para o diagnóstico da PEA. De forma a verificar o impacto destas para os diagnósticos feitos pelo modelo, foram efetuados estudos de ablação, nos quais se removeram as conexões funcionais mais importantes. Estes estudos, para além de mostrarem a relevância das conexões identificadas, permitiram verificar a existência de características redundantes, o que não é surpresa num caso de elevada dimensionalidade das características dos dados. As regiões cerebrais identificadas e as suas conexões funcionais enfatizam os papéis do processamento visual, particularmente do reconhecimento facial, e do processamento linguístico e autorreferencial na PEA. As disrupções encontradas são frequentemente relatadas na literatura e contribuem para os sintomas principais da PEA, estando especificamente associadas com as dificuldades na comunicação social. No entanto, apenas uma das dez conexões identificadas resistiu à análise estatística entre a amostra de indivíduos com PEA e os controlos e se mostrou significativa - a subconectividade entre o córtex fusiforme occipital temporal esquerdo e o planum polare esquerdo na PEA, que poderá estar associada ao reconhecimento e nomeação de objetos e faces de pessoas. Os resultados desta dissertação revelam o potencial das RNGs para o diagnóstico da PEA. Apesar do modelo não ter superado a performance reportada por outros estudos que utilizam modelos de aprendizagem profunda na literatura, conseguiu superar dois dos modelos de classificação que usam RNGs para a classificação de PEA com o ABIDE, que foram treinados nas mesmas condições que o modelo desenvolvido. Inclusive, permitiu identificar outra causa possível para a dificuldade em criar modelos ótimos de diagnóstico para PEA usando este tipo de abordagem, para além da heterogeneidade da doença e da base de dados - a elevada dimensionalidade das características dos dados. Por outro lado, explorou um método de IAE na RNG desenvolvida, com resultados concordantes com a literatura relativa às disfunções de conexões funcionais encontradas associadas à PEA. Assim, os objetivos delineados para esta dissertação foram cumpridos, e este trabalho poderá contribuir para a superação dos problemas patentes no desenvolvimento de modelos de inteligência artificial de diagnóstico da PEA.