Publicação
Determinação das características radiómicas informativas e o seu impacto em modelos de apoio à decisão clínica aplicada à ressonância magnética da próstata
| Resumo: | Descritores de propriedades são parâmetros quantitativos extraídos de imagens médicas, os quais têm-se demonstrado promissores no desenvolvimento de modelos preditivos de machine learning (ML) aplicados ao apoio à decisão clínica. Contudo, a reprodutibilidade dos descritores, a elevada dimensionalidade dos dados, a seleção de recursos robustos e a generalização dos modelos constituem desafios metodológicos relevantes. Este estudo avaliou o impacto de diferentes metodologias de seleção de descritores radiómicos na construção de modelos de ML para a classificação de lesões prostáticas. Para tal, foi utilizado o dataset PROSTATEx, disponibilizado pela base de dados The Cancer Imaging Archive, composto por exames retrospetivos de multiparametric magnetic resonance imaging (mpMRI), em sequência T2, constituído por 204 sujeitos e 299 lesões segmentadas. Foram extraídos descritores de primeira-ordem, textura e forma, obtidos a partir da imagem original e de imagens derivadas de filtros. Consideraram-se dois conjuntos de dados: original e randomizado (obtido pela randomização da intensidade dos píxeis). As análises estatísticas incluíram: correlação Spearman e coeficiente de correlação intraclasse (ICC). Combinação dos resultados obtidos, através de operações de interseção e união, e análise univariada, para identificar descritores com maior significância com a variável a prever. Posteriormente, foram desenvolvidos quatro modelos de ML, cada um baseado numa das metodologias de seleção de descritores, comparados através de métricas de desempenho. Os resultados mostraram que a correlação Spearman identificou 1009 descritores não redundantes tendo sido eliminados 386, enquanto o ICC considerou 789 descritores informativos, com eliminação de 620. A união dos conjuntos resultou em 1154 descritores, enquanto a interseção obteve 650. Relativamente à análise univariada, nenhum descritor foi estatisticamente significativo. Este estudo demonstra que a aplicação de métodos de seleção de descritores informativos pode contribuir para melhorar o desempenho dos modelos de ML no contexto da classificação de lesões prostáticas. |
|---|---|
| Autores principais: | Costa, Andreia Pinto |
| Assunto: | Radiómica Métodos seleção de variáveis modelos de machine learning Radiomics Feature selection methods Machine learning models |
| Ano: | 2025 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Instituto Politécnico de Lisboa |
| Idioma: | português |
| Origem: | Repositório Científico do Instituto Politécnico de Lisboa |
| Resumo: | Descritores de propriedades são parâmetros quantitativos extraídos de imagens médicas, os quais têm-se demonstrado promissores no desenvolvimento de modelos preditivos de machine learning (ML) aplicados ao apoio à decisão clínica. Contudo, a reprodutibilidade dos descritores, a elevada dimensionalidade dos dados, a seleção de recursos robustos e a generalização dos modelos constituem desafios metodológicos relevantes. Este estudo avaliou o impacto de diferentes metodologias de seleção de descritores radiómicos na construção de modelos de ML para a classificação de lesões prostáticas. Para tal, foi utilizado o dataset PROSTATEx, disponibilizado pela base de dados The Cancer Imaging Archive, composto por exames retrospetivos de multiparametric magnetic resonance imaging (mpMRI), em sequência T2, constituído por 204 sujeitos e 299 lesões segmentadas. Foram extraídos descritores de primeira-ordem, textura e forma, obtidos a partir da imagem original e de imagens derivadas de filtros. Consideraram-se dois conjuntos de dados: original e randomizado (obtido pela randomização da intensidade dos píxeis). As análises estatísticas incluíram: correlação Spearman e coeficiente de correlação intraclasse (ICC). Combinação dos resultados obtidos, através de operações de interseção e união, e análise univariada, para identificar descritores com maior significância com a variável a prever. Posteriormente, foram desenvolvidos quatro modelos de ML, cada um baseado numa das metodologias de seleção de descritores, comparados através de métricas de desempenho. Os resultados mostraram que a correlação Spearman identificou 1009 descritores não redundantes tendo sido eliminados 386, enquanto o ICC considerou 789 descritores informativos, com eliminação de 620. A união dos conjuntos resultou em 1154 descritores, enquanto a interseção obteve 650. Relativamente à análise univariada, nenhum descritor foi estatisticamente significativo. Este estudo demonstra que a aplicação de métodos de seleção de descritores informativos pode contribuir para melhorar o desempenho dos modelos de ML no contexto da classificação de lesões prostáticas. |
|---|