Publicação

Assessing brain functional connectivity in Parkinson’s disease using explainable Artificial Intelligence methods

Ver documento

Detalhes bibliográficos
Resumo:A doença de Parkinson (DP) é uma patologia neurogenerativa caracterizada pela perda de neurónios dopaminérgicos, em particular nos gânglios da base, e acumulação da proteína α-sinucleína. A DP é caracterizada por quatro sinais cardinais motores: tremores, bradicinesia, rigidez muscular e instabilidade postural. A doença é também manifestada por sintomas não motores como perda do olfato, doenças neuropsiquiátricas como depressão e ansiedade, e distúrbios do sono. Esta doença progressiva não tem cura, sendo que os tratamentos procuram a melhoria da qualidade de vida dos pacientes atenuando os sintomas. Relativamente ao diagnóstico, este é ainda principalmente baseado na análise da apresentação clínica dos sintomas. Entidades como a Sociedade de Doenças do Movimento apresentam uma série de critérios clínicos para aferir o diagnóstico da DP. Não existindo qualquer exame de imagiologia ou teste analítico que confirme um diagnóstico, as técnicas de neuroimagem surgem como ferramentas complementares com o fim de detetar alterações neuroquímicas relacionadas com a DP. O exame imagiológico mais comum é o DatScan, um tipo de aquisição de tomografia computorizada de emissão de fotão único que visa a deteção do transportador de dopamina, um biomarcador da degeneração dos neurónios dopaminérgicos. Dada a precisão e confiança insuficiente nos critérios clínicos de diagnóstico, bem como a falta de consistência do DaTScan, métodos de neuroimagem alternativos têm sido considerados para averiguar alterações cerebrais funcionais relacionadas com a DP, como por exemplo, a ressonância magnética (RM). Em particular, o fluxo sanguíneo cerebral e a conectividade do cérebro são analisadas através de RM funcional (RMf), uma técnica de RM que determina a atividade cerebral, em repouso ou perante uma tarefa, através da deteção de alterações no fluxo sanguíneo. Deste modo, vários estudos têm apontado como uma potencial e inovadora abordagem a utilização de aprendizagem profunda (AP) para auxiliar e automatizar o diagnóstico de doenças neurológicas como a doença de Parkinson, baseando em dados de neuroimagem como a RMf. Não obstante, estas investigações ao nível da DP, AP e RMf não incluem, até ao momento e à luz do nosso conhecimento, estudos em larga escala: os números de sujeitos são ainda consideravelmente reduzidos, na ordem das dezenas. Ademais, os modelos de AP apresentam uma natureza de "caixa negra", ou seja, não é possível aferir de que forma o algoritmo chegou às decisões que levaram à classificação efetuada. Assim, a inteligência artificial explicável (IAE), um conjunto de métodos que pretende explicar e interpretar as decisões tomadas por modelos de inteligência artificial, surge como uma ferramenta apropriada para ultrapassar a falta de transparência dos modelos de AP. Posto isto, o trabalho que surge no âmbito desta dissertação tem como objetivo o desenvolvimento de métodos para estudar e detetar alterações ao nível da conectividade funcional (CF) do cérebro relacionadas com a DP, recorrendo a um modelo de classificação baseado na arquitetura de redes neuronais convolucionais (RNC), e a métodos de IAE. Adicionalmente, pretende-se identificar potenciais biomarcadores funcionais da DP. Para este fim, utilizaram-se aquisições de RMf do conjunto de dados do PPMI, que inclui 120 scans de doentes com DP, e 22 de controlos saudáveis. Como este conjunto apresentava um desequilíbrio devido ao reduzido número de dados de controlos, recorreu-se ao conjunto de dados ADNI para recolher mais 131 scans de controlos. Este ajustamento foi efetuado considerando que a diferença entre os parâmetros de aquisição de RMf entre os dois consórcios, em particular o tempo de repetição, não leva a alterações significativas na avaliação da CF. Os dados de RMf foram pré-processados de acordo com uma sequência de métodos que incluíram: realinhamento funcional e distorção, correção temporal, identificação de outliers, segmentação e normalização, e atenuação funcional. Foi ainda removido ruído dos dados, através da regressão de potenciais efeitos perturbadores e da aplicação de um filtro passa-banda entre os 0,008 Hz e os 0,09 Hz. Os dados foram segmentados de acordo com um atlas que inclui 14 redes neuronais de repouso. A conetividade funcional de cada sujeito foi aferida através do cálculo das matrizes de CF, que correspondem a matrizes de correlação entre as 14 redes funcionais de repouso. Para tal, foi aplicado o cálculo do coeficiente de correlação de Pearson e a transformada de Fisher. As matrizes de conetividade foram inseridas numa RNC denominada de ExtendedConnectomeCNN, uma rede inspirada na ConnectomeCNN. Esta é composta por três camadas convolucionais e uma camada totalmente conectada. O tamanho da janela dos filtros é de 3 por 3 e o passo igual a 2. O número de filtros diminui ao longo das camadas convolucionais, de 256 para 128, e para 64. Em termos de parâmetros de treino, foram selecionados um número de épocas igual a 200 e um tamanho de grupo igual a 16. Como hiperparâmetros a otimizar, foram selecionados: a taxa de dropout, a taxa de aprendizagem, e a presença de uma camada de normalização em lote em cada camada convolucional. O processo de otimização dos hiperparâmetros foi efetuado através de validação cruzada com 10 folds (ou subconjuntos). Neste processo foi utilizado o conjunto de desenvolvimento dos dados, que corresponde a 90% do conjunto total das matrizes de CF. Da otimização de hiperparâmetros, foi selecionado o conjunto de hiperparâmetros que apresentou a melhor performance, isto é, com valores de médias das métricas de avaliação satisfatórios e balanceados. O conjunto com melhor performance apresentava uma taxa de dropout de 0,1 nas camadas convolucionais e de 0,4 na camada totalmente conectada, uma taxa de aprendizagem de 0,00001, e não tinha inseridas camadas de normalização em lote. Destacamse os valores de exatidão de treino, 0,8814, de exatidão de validação, 0,7760, e de área sob a curva de característica de operação do receptor (AUC ROC) de 0,7496. Estes valores refletem modelos generalizáveis que detetam tanto as classes positiva (DP) como negativa (controlo). Foi, de seguida, desenvolvido um modelo final com os melhores hiperparâmetros, treinado no conjunto de desenvolvimento e testado no conjunto de teste reservado à parte. Foram obtidas: uma extaidão de treino de 0,8776, exatidão de teste de 0,8214, e uma AUC ROC de 0,8230. Logo, o modelo construído apresenta valores de performance satisfatórios e balanceados, e potencial de interpretabilidade, o que permite a aplicação de métodos de IAE. Ao modelo final foram aplicados três métodos de IAE: propagação de relevância camada a camada (do inglês LRP, layer-wise relevance propagation), rede de deconvolução, e retropropagação direcionada. Para cada método foi calculada a área de curva de perturbação do mais relevante primeiro, ou AOPC do inglês area over the MoRF perturbation curve, que avalia o quão relevantes são as explicações fornecidas pelos métodos de IAE. Considerando que o método LRP produziu mapas de explicação mais específicos e não dispersos, e que apresentou ainda valores de AOPC maiores e melhor distribuídos, considerou-se esse método como o que melhor explica a classificação de DP. A partir das explicações fornecidas pelo método LRP foram extraídas as redes funcionais de repouso que mais relevância têm na classificação de DP. Não foram identificadas quaisquer alterações referentes à rede dos gânglios da base, apesar de tal ser esperado. No entanto, identificaram-se como potenciais biomarcadores funcionais da DP as redes de modo padrão dorsal, de modo padrão ventral, e de saliência posterior, essencialmente envolvidas em manifestações não-motoras da doença. Considerando que (1) o pré-processamento dos dados de RMf seguiu métodos adequados e produziu resultados satisfatórios, (2) o modelo de RNC para classificação de DP demonstrou ser suficientemente generalizável, com métricas de avaliação satisfatórias e equilibradas, e (3) a análise de IAE aparenta ser fidedigna e concordante com a literatura referente às alterações de redes funcionais de repouso perante a DP, conclui-se que a abordagem tomada para o estudo da CF relacionada com a DP utilizando métodos de IAE foi bem sucedida. Assim, os objetivos da dissertação foram cumpridos, com a expetativa de que este estudo resultará num progresso no desenvolvimento de técnicas inovadoras de diagnóstico de DP assistido por métodos de inteligência artificial.
Autores principais:Pires, Leonor Maria de Oliveira
Assunto:Inteligência artificial explicável Doença de Parkinson Conectividade funcional Redes funcionais de repouso Redes neuronais convolucionais Teses de mestrado - 2023
Ano:2023
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:A doença de Parkinson (DP) é uma patologia neurogenerativa caracterizada pela perda de neurónios dopaminérgicos, em particular nos gânglios da base, e acumulação da proteína α-sinucleína. A DP é caracterizada por quatro sinais cardinais motores: tremores, bradicinesia, rigidez muscular e instabilidade postural. A doença é também manifestada por sintomas não motores como perda do olfato, doenças neuropsiquiátricas como depressão e ansiedade, e distúrbios do sono. Esta doença progressiva não tem cura, sendo que os tratamentos procuram a melhoria da qualidade de vida dos pacientes atenuando os sintomas. Relativamente ao diagnóstico, este é ainda principalmente baseado na análise da apresentação clínica dos sintomas. Entidades como a Sociedade de Doenças do Movimento apresentam uma série de critérios clínicos para aferir o diagnóstico da DP. Não existindo qualquer exame de imagiologia ou teste analítico que confirme um diagnóstico, as técnicas de neuroimagem surgem como ferramentas complementares com o fim de detetar alterações neuroquímicas relacionadas com a DP. O exame imagiológico mais comum é o DatScan, um tipo de aquisição de tomografia computorizada de emissão de fotão único que visa a deteção do transportador de dopamina, um biomarcador da degeneração dos neurónios dopaminérgicos. Dada a precisão e confiança insuficiente nos critérios clínicos de diagnóstico, bem como a falta de consistência do DaTScan, métodos de neuroimagem alternativos têm sido considerados para averiguar alterações cerebrais funcionais relacionadas com a DP, como por exemplo, a ressonância magnética (RM). Em particular, o fluxo sanguíneo cerebral e a conectividade do cérebro são analisadas através de RM funcional (RMf), uma técnica de RM que determina a atividade cerebral, em repouso ou perante uma tarefa, através da deteção de alterações no fluxo sanguíneo. Deste modo, vários estudos têm apontado como uma potencial e inovadora abordagem a utilização de aprendizagem profunda (AP) para auxiliar e automatizar o diagnóstico de doenças neurológicas como a doença de Parkinson, baseando em dados de neuroimagem como a RMf. Não obstante, estas investigações ao nível da DP, AP e RMf não incluem, até ao momento e à luz do nosso conhecimento, estudos em larga escala: os números de sujeitos são ainda consideravelmente reduzidos, na ordem das dezenas. Ademais, os modelos de AP apresentam uma natureza de "caixa negra", ou seja, não é possível aferir de que forma o algoritmo chegou às decisões que levaram à classificação efetuada. Assim, a inteligência artificial explicável (IAE), um conjunto de métodos que pretende explicar e interpretar as decisões tomadas por modelos de inteligência artificial, surge como uma ferramenta apropriada para ultrapassar a falta de transparência dos modelos de AP. Posto isto, o trabalho que surge no âmbito desta dissertação tem como objetivo o desenvolvimento de métodos para estudar e detetar alterações ao nível da conectividade funcional (CF) do cérebro relacionadas com a DP, recorrendo a um modelo de classificação baseado na arquitetura de redes neuronais convolucionais (RNC), e a métodos de IAE. Adicionalmente, pretende-se identificar potenciais biomarcadores funcionais da DP. Para este fim, utilizaram-se aquisições de RMf do conjunto de dados do PPMI, que inclui 120 scans de doentes com DP, e 22 de controlos saudáveis. Como este conjunto apresentava um desequilíbrio devido ao reduzido número de dados de controlos, recorreu-se ao conjunto de dados ADNI para recolher mais 131 scans de controlos. Este ajustamento foi efetuado considerando que a diferença entre os parâmetros de aquisição de RMf entre os dois consórcios, em particular o tempo de repetição, não leva a alterações significativas na avaliação da CF. Os dados de RMf foram pré-processados de acordo com uma sequência de métodos que incluíram: realinhamento funcional e distorção, correção temporal, identificação de outliers, segmentação e normalização, e atenuação funcional. Foi ainda removido ruído dos dados, através da regressão de potenciais efeitos perturbadores e da aplicação de um filtro passa-banda entre os 0,008 Hz e os 0,09 Hz. Os dados foram segmentados de acordo com um atlas que inclui 14 redes neuronais de repouso. A conetividade funcional de cada sujeito foi aferida através do cálculo das matrizes de CF, que correspondem a matrizes de correlação entre as 14 redes funcionais de repouso. Para tal, foi aplicado o cálculo do coeficiente de correlação de Pearson e a transformada de Fisher. As matrizes de conetividade foram inseridas numa RNC denominada de ExtendedConnectomeCNN, uma rede inspirada na ConnectomeCNN. Esta é composta por três camadas convolucionais e uma camada totalmente conectada. O tamanho da janela dos filtros é de 3 por 3 e o passo igual a 2. O número de filtros diminui ao longo das camadas convolucionais, de 256 para 128, e para 64. Em termos de parâmetros de treino, foram selecionados um número de épocas igual a 200 e um tamanho de grupo igual a 16. Como hiperparâmetros a otimizar, foram selecionados: a taxa de dropout, a taxa de aprendizagem, e a presença de uma camada de normalização em lote em cada camada convolucional. O processo de otimização dos hiperparâmetros foi efetuado através de validação cruzada com 10 folds (ou subconjuntos). Neste processo foi utilizado o conjunto de desenvolvimento dos dados, que corresponde a 90% do conjunto total das matrizes de CF. Da otimização de hiperparâmetros, foi selecionado o conjunto de hiperparâmetros que apresentou a melhor performance, isto é, com valores de médias das métricas de avaliação satisfatórios e balanceados. O conjunto com melhor performance apresentava uma taxa de dropout de 0,1 nas camadas convolucionais e de 0,4 na camada totalmente conectada, uma taxa de aprendizagem de 0,00001, e não tinha inseridas camadas de normalização em lote. Destacamse os valores de exatidão de treino, 0,8814, de exatidão de validação, 0,7760, e de área sob a curva de característica de operação do receptor (AUC ROC) de 0,7496. Estes valores refletem modelos generalizáveis que detetam tanto as classes positiva (DP) como negativa (controlo). Foi, de seguida, desenvolvido um modelo final com os melhores hiperparâmetros, treinado no conjunto de desenvolvimento e testado no conjunto de teste reservado à parte. Foram obtidas: uma extaidão de treino de 0,8776, exatidão de teste de 0,8214, e uma AUC ROC de 0,8230. Logo, o modelo construído apresenta valores de performance satisfatórios e balanceados, e potencial de interpretabilidade, o que permite a aplicação de métodos de IAE. Ao modelo final foram aplicados três métodos de IAE: propagação de relevância camada a camada (do inglês LRP, layer-wise relevance propagation), rede de deconvolução, e retropropagação direcionada. Para cada método foi calculada a área de curva de perturbação do mais relevante primeiro, ou AOPC do inglês area over the MoRF perturbation curve, que avalia o quão relevantes são as explicações fornecidas pelos métodos de IAE. Considerando que o método LRP produziu mapas de explicação mais específicos e não dispersos, e que apresentou ainda valores de AOPC maiores e melhor distribuídos, considerou-se esse método como o que melhor explica a classificação de DP. A partir das explicações fornecidas pelo método LRP foram extraídas as redes funcionais de repouso que mais relevância têm na classificação de DP. Não foram identificadas quaisquer alterações referentes à rede dos gânglios da base, apesar de tal ser esperado. No entanto, identificaram-se como potenciais biomarcadores funcionais da DP as redes de modo padrão dorsal, de modo padrão ventral, e de saliência posterior, essencialmente envolvidas em manifestações não-motoras da doença. Considerando que (1) o pré-processamento dos dados de RMf seguiu métodos adequados e produziu resultados satisfatórios, (2) o modelo de RNC para classificação de DP demonstrou ser suficientemente generalizável, com métricas de avaliação satisfatórias e equilibradas, e (3) a análise de IAE aparenta ser fidedigna e concordante com a literatura referente às alterações de redes funcionais de repouso perante a DP, conclui-se que a abordagem tomada para o estudo da CF relacionada com a DP utilizando métodos de IAE foi bem sucedida. Assim, os objetivos da dissertação foram cumpridos, com a expetativa de que este estudo resultará num progresso no desenvolvimento de técnicas inovadoras de diagnóstico de DP assistido por métodos de inteligência artificial.