Publicação

Determinação das características radiómicas informativas e o seu impacto em modelos de apoio à decisão clínica aplicada à ressonância magnética da próstata

Detalhes bibliográficos
Resumo:	Descritores de propriedades são parâmetros quantitativos extraídos de imagens médicas, os quais têm-se demonstrado promissores no desenvolvimento de modelos preditivos de machine learning (ML) aplicados ao apoio à decisão clínica. Contudo, a reprodutibilidade dos descritores, a elevada dimensionalidade dos dados, a seleção de recursos robustos e a generalização dos modelos constituem desafios metodológicos relevantes. Este estudo avaliou o impacto de diferentes metodologias de seleção de descritores radiómicos na construção de modelos de ML para a classificação de lesões prostáticas. Para tal, foi utilizado o dataset PROSTATEx, disponibilizado pela base de dados The Cancer Imaging Archive, composto por exames retrospetivos de multiparametric magnetic resonance imaging (mpMRI), em sequência T2, constituído por 204 sujeitos e 299 lesões segmentadas. Foram extraídos descritores de primeira-ordem, textura e forma, obtidos a partir da imagem original e de imagens derivadas de filtros. Consideraram-se dois conjuntos de dados: original e randomizado (obtido pela randomização da intensidade dos píxeis). As análises estatísticas incluíram: correlação Spearman e coeficiente de correlação intraclasse (ICC). Combinação dos resultados obtidos, através de operações de interseção e união, e análise univariada, para identificar descritores com maior significância com a variável a prever. Posteriormente, foram desenvolvidos quatro modelos de ML, cada um baseado numa das metodologias de seleção de descritores, comparados através de métricas de desempenho. Os resultados mostraram que a correlação Spearman identificou 1009 descritores não redundantes tendo sido eliminados 386, enquanto o ICC considerou 789 descritores informativos, com eliminação de 620. A união dos conjuntos resultou em 1154 descritores, enquanto a interseção obteve 650. Relativamente à análise univariada, nenhum descritor foi estatisticamente significativo. Este estudo demonstra que a aplicação de métodos de seleção de descritores informativos pode contribuir para melhorar o desempenho dos modelos de ML no contexto da classificação de lesões prostáticas.
Autores principais:	Costa, Andreia Pinto
Assunto:	Radiómica Métodos seleção de variáveis modelos de machine learning Radiomics Feature selection methods Machine learning models
Ano:	2025
País:	Portugal
Tipo de documento:	dissertação de mestrado
Tipo de acesso:	acesso aberto
Instituição associada:	Instituto Politécnico de Lisboa
Idioma:	português
Origem:	Repositório Científico do Instituto Politécnico de Lisboa

Descrição
Resumo:	Descritores de propriedades são parâmetros quantitativos extraídos de imagens médicas, os quais têm-se demonstrado promissores no desenvolvimento de modelos preditivos de machine learning (ML) aplicados ao apoio à decisão clínica. Contudo, a reprodutibilidade dos descritores, a elevada dimensionalidade dos dados, a seleção de recursos robustos e a generalização dos modelos constituem desafios metodológicos relevantes. Este estudo avaliou o impacto de diferentes metodologias de seleção de descritores radiómicos na construção de modelos de ML para a classificação de lesões prostáticas. Para tal, foi utilizado o dataset PROSTATEx, disponibilizado pela base de dados The Cancer Imaging Archive, composto por exames retrospetivos de multiparametric magnetic resonance imaging (mpMRI), em sequência T2, constituído por 204 sujeitos e 299 lesões segmentadas. Foram extraídos descritores de primeira-ordem, textura e forma, obtidos a partir da imagem original e de imagens derivadas de filtros. Consideraram-se dois conjuntos de dados: original e randomizado (obtido pela randomização da intensidade dos píxeis). As análises estatísticas incluíram: correlação Spearman e coeficiente de correlação intraclasse (ICC). Combinação dos resultados obtidos, através de operações de interseção e união, e análise univariada, para identificar descritores com maior significância com a variável a prever. Posteriormente, foram desenvolvidos quatro modelos de ML, cada um baseado numa das metodologias de seleção de descritores, comparados através de métricas de desempenho. Os resultados mostraram que a correlação Spearman identificou 1009 descritores não redundantes tendo sido eliminados 386, enquanto o ICC considerou 789 descritores informativos, com eliminação de 620. A união dos conjuntos resultou em 1154 descritores, enquanto a interseção obteve 650. Relativamente à análise univariada, nenhum descritor foi estatisticamente significativo. Este estudo demonstra que a aplicação de métodos de seleção de descritores informativos pode contribuir para melhorar o desempenho dos modelos de ML no contexto da classificação de lesões prostáticas.