Publicação

Prostate cancer biochemical recurrence prediction after radical prostatectomy using machine learning analysis of histopathology

Ver documento

Detalhes bibliográficos
Resumo:O cancro de próstata é o segundo tipo de cancro com maior prevalência nos homens, em todo o mundo. A deteção inicial desta doença ocorre, geralmente, durante exames e consultas de rotina, quando níveis aumentados do antigénio prostático específico e/ou um exame retal anormal são descobertos. Contudo, apenas a avaliação histopatológica, inicialmente baseada em amostras extraídas através de uma biópsia, é capaz de fornecer um diagnóstico definitivo, permitindo não só orientar o tratamento do doente, assim como o processo de tomada de decisão associado. Após esta avaliação inicial, se o doente for diagnosticado com cancro da próstata localizado, ou seja, um tumor confinado à próstata, o tratamento mais adotado é a prostatectomia radical. Este último é o tratamento padrão utilizado quando se pretende uma terapia com curativa. A vantagem da técnica de prostatectomia radical é que, toda a próstata, onde o tumor se encontra confinado, é removida cirurgicamente, auxiliando na redução do risco de metástases. A posterior análise da peça prostática permite ao patologista avaliar diversas características tumorais, determinantes no prognóstico do doente. Para este fim, o microscópio tem sido a principal ferramenta utilizada, uma vez que proporciona imagens ao vivo com uma ótima resolução. No entanto, desde a introdução do primeiro sistema automatizado de digitalização de lâminas em imagens de alta resolução, o interesse da comunidade de anatomia patológica em explorar este tipo de métodos para diferentes aplicações tem crescido exponencialmente. O potencial desta nova área não é, todavia, a simples transferência de uma imagem da lâmina de vidro para um monitor, nem tão pouco a flexibilidade de distribuição e modificação da própria imagem digital, mas sim, a possibilidade de aprimorar a avaliação do patologista com informações e inteligência que não podem ser detetados pela análise humana. Por conseguinte, a implementação de algoritmos de aprendizagem automática capazes de executar tarefas como deteção, classificação e segmentação de imagens digitais histopatológicas é, finalmente, possível. Estes métodos de análise automatizada permitem explorar todo o panorama morfológico do tumor e dos seus elementos mais invasivos presentes, capturando, por exemplo, a orientação nuclear, a textura, a forma e a arquitetura. A complexidade e densidade inerente a este tipo de imagens, oferecem uma abundância de informação, ideal para estimular e promover o desenvolvimento de algoritmos baseados em deep learning. No que diz respeito ao cancro da próstata, os algoritmos desenvolvidos visam apoiar as avaliações efetuados pelos patologistas, nomeadamente, estadiamento e classificação, sendo, portanto, focados no sistema de classificação utilizada para a próstata - o Gleason score. Contudo, problemáticas alternativas podem também beneficiar da aplicação destas t´técnicas, nomeadamente métodos capazes de distinguir imagens que apenas contêm tecido benigno de imagens em que tumor esteja presente. Por outro lado, modelos capazes de prever a recidiva bioquímica de cancro da próstata permitiriam aos médicos modificar estratégias de tratamento e pós-tratamento, a fim de equilibrar benefícios e efeitos adversos de um terapia específica. A previsão de recidiva permite, também, que os pacientes escolham com responsabilidade os diferentes tratamentos e estratégias que lhes são propostos pelos médicos, possibilitando, em última análise, uma maior sua satisfação após o tratamento. Desta forma, com o objetivo de explorar os referidos problemas, a presente dissertação apresenta procedimentos de recolha, processamento e anotação de dados, que permitiram a criação de uma base digital de dados histológicos anotados da próstata. Com base nestes dados dois modelos distintos de deep learning, especificamente Convolutional Neural Networks foram desenvolvidos. O modelo I propõe a identificação de cancro da próstata e diferenciação entre tumor e tecido benigno. O modelo II pretende prever a condição de recidiva bioquímica do cancro de próstata, para um período de tempo posterior `a cirurgia em dois anos. Relativamente ao desenvolvimento da base de dados, 200 casos de cancro da próstata, tratados através de prostatectomia radical, foram selecionados. As lâminas correspondentes à lesão índice, ou seja, à lesão principal, foram identificadas e, apenas estas foram incluídas na amostra final. A adoção desta abordagem deveu-se ao facto de que cada peça origina entre 15-45 lâminas, sendo que a maioria não contém tumor. Por outro lado, dado o período de tempo para a realização de todo este projeto, seria inviável a utilização de todas as lâminas. Assim, as lâminas selecionadas foram digitalizadas e processadas. Uma t´técnica de normalização de contraste foi aplicada, de forma a uniformizar as cores das diferentes imagens digitais, evitando uma elevada variabilidade de contraste e cor que advém da utilização de diferentes protocolos de cor, bem como da própria digitalização da lâmina. As imagens histológicas digitalizadas e normalizadas foram posteriormente divididas em imagens mais pequenas, isto é, subimagens, uma vez que desta forma existe uma otimização da extração de características por parte dos algoritmos. Estas subimagens foram individualmente visualizadas e anotadas, originando um total de cerca de 160,000 subimagens, correspondentes aos 200 casos diferentes selecionados. Para o desenvolvimento do modelo de classificação do cancro de próstata, a arquitetura Inception v3 foi implementada e treinada utilizando as subimagens da base de dados. Este modelo foi capaz de identificar três classes distintas: negativa (tecido benigno), positiva (tecido maligno) e neoplasia intraepitelial da próstata, esta última, embora com menor precisão dada a quantidade reduzida de exemplos pertencentes a esta classe. Um valor de 93 % de precisão foi obtido, o que corresponde a valores equiparados ao estado da arte para este tipo de técnicas. Este valor, contudo, demonstra ainda potencial para otimização e melhoria, uma vez que as diferentes classes dos dados utilizados seguiam uma distribuição não equilibrada. A inclusão de mais casos clínicos e a aplicação de técnicas de aumento de dados, podem ser facilmente realizadas, o que culminará num modelo com ainda melhor precisão de classificação. Relativamente ao modelo referente à previsão de recidiva bioquímica, a mesma arquitetura foi utilizada, mas neste caso, treinada apenas com base nas subimagens positivas, isto ´e, as subimagens contendo tecido maligno da próstata. Os resultados obtidos revelaram que este modelo não tem a capacidade de extrair informação relevante correlacionada com o objetivo do estudo, e portanto, não consegue distinguir com sucesso casos não recorrentes de casos recorrentes, produzindo apenas uma precisão de 60 %. Contudo, apesar do referido modelo falhar na execução do objetivo estipulado, é fundamental notar que a tarefa de predição de recidiva bioquímica é de complexidade elevada, não sendo possível aos patologistas, através da observação das imagens histológicas, retirar nenhuma conclusão que diretamente se correlacione com esta condição. Diferentes abordagens, como por exemplo, o aumento da quantidade de dados utilizados, a introdução no modelo de características clínicas relevantes no prognóstico da doença poderão apresentar melhorias substanciais, no que diz respeito à capacidade preditiva deste modelo. Concluindo, a capacidade de algoritmos de deep learning para extrair informação relevante de imagens digitais da histopatologia da próstata foi demonstrada através do presente estudo. O desenvolvimento e o criação de uma base de dados anotados, fornece a base fundamental para o desenvolvimento de modelos adicionais, onde diversas questões podem ser exploradas. O desenvolvimento de uma interface que permita implementar o modelo de deteção de cancro da próstata desenvolvido é também uma possibilidade, uma vez que fornece eficiência e consistência, beneficiando a prática da patologia clinica.
Autores principais:Seabra, Carolina Alexandra Carrapiço
Assunto:Cancro da Próstata Recidiva Bioquímica Patologia Digital Deep Learning Teses de mestrado - 2019
Ano:2019
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:O cancro de próstata é o segundo tipo de cancro com maior prevalência nos homens, em todo o mundo. A deteção inicial desta doença ocorre, geralmente, durante exames e consultas de rotina, quando níveis aumentados do antigénio prostático específico e/ou um exame retal anormal são descobertos. Contudo, apenas a avaliação histopatológica, inicialmente baseada em amostras extraídas através de uma biópsia, é capaz de fornecer um diagnóstico definitivo, permitindo não só orientar o tratamento do doente, assim como o processo de tomada de decisão associado. Após esta avaliação inicial, se o doente for diagnosticado com cancro da próstata localizado, ou seja, um tumor confinado à próstata, o tratamento mais adotado é a prostatectomia radical. Este último é o tratamento padrão utilizado quando se pretende uma terapia com curativa. A vantagem da técnica de prostatectomia radical é que, toda a próstata, onde o tumor se encontra confinado, é removida cirurgicamente, auxiliando na redução do risco de metástases. A posterior análise da peça prostática permite ao patologista avaliar diversas características tumorais, determinantes no prognóstico do doente. Para este fim, o microscópio tem sido a principal ferramenta utilizada, uma vez que proporciona imagens ao vivo com uma ótima resolução. No entanto, desde a introdução do primeiro sistema automatizado de digitalização de lâminas em imagens de alta resolução, o interesse da comunidade de anatomia patológica em explorar este tipo de métodos para diferentes aplicações tem crescido exponencialmente. O potencial desta nova área não é, todavia, a simples transferência de uma imagem da lâmina de vidro para um monitor, nem tão pouco a flexibilidade de distribuição e modificação da própria imagem digital, mas sim, a possibilidade de aprimorar a avaliação do patologista com informações e inteligência que não podem ser detetados pela análise humana. Por conseguinte, a implementação de algoritmos de aprendizagem automática capazes de executar tarefas como deteção, classificação e segmentação de imagens digitais histopatológicas é, finalmente, possível. Estes métodos de análise automatizada permitem explorar todo o panorama morfológico do tumor e dos seus elementos mais invasivos presentes, capturando, por exemplo, a orientação nuclear, a textura, a forma e a arquitetura. A complexidade e densidade inerente a este tipo de imagens, oferecem uma abundância de informação, ideal para estimular e promover o desenvolvimento de algoritmos baseados em deep learning. No que diz respeito ao cancro da próstata, os algoritmos desenvolvidos visam apoiar as avaliações efetuados pelos patologistas, nomeadamente, estadiamento e classificação, sendo, portanto, focados no sistema de classificação utilizada para a próstata - o Gleason score. Contudo, problemáticas alternativas podem também beneficiar da aplicação destas t´técnicas, nomeadamente métodos capazes de distinguir imagens que apenas contêm tecido benigno de imagens em que tumor esteja presente. Por outro lado, modelos capazes de prever a recidiva bioquímica de cancro da próstata permitiriam aos médicos modificar estratégias de tratamento e pós-tratamento, a fim de equilibrar benefícios e efeitos adversos de um terapia específica. A previsão de recidiva permite, também, que os pacientes escolham com responsabilidade os diferentes tratamentos e estratégias que lhes são propostos pelos médicos, possibilitando, em última análise, uma maior sua satisfação após o tratamento. Desta forma, com o objetivo de explorar os referidos problemas, a presente dissertação apresenta procedimentos de recolha, processamento e anotação de dados, que permitiram a criação de uma base digital de dados histológicos anotados da próstata. Com base nestes dados dois modelos distintos de deep learning, especificamente Convolutional Neural Networks foram desenvolvidos. O modelo I propõe a identificação de cancro da próstata e diferenciação entre tumor e tecido benigno. O modelo II pretende prever a condição de recidiva bioquímica do cancro de próstata, para um período de tempo posterior `a cirurgia em dois anos. Relativamente ao desenvolvimento da base de dados, 200 casos de cancro da próstata, tratados através de prostatectomia radical, foram selecionados. As lâminas correspondentes à lesão índice, ou seja, à lesão principal, foram identificadas e, apenas estas foram incluídas na amostra final. A adoção desta abordagem deveu-se ao facto de que cada peça origina entre 15-45 lâminas, sendo que a maioria não contém tumor. Por outro lado, dado o período de tempo para a realização de todo este projeto, seria inviável a utilização de todas as lâminas. Assim, as lâminas selecionadas foram digitalizadas e processadas. Uma t´técnica de normalização de contraste foi aplicada, de forma a uniformizar as cores das diferentes imagens digitais, evitando uma elevada variabilidade de contraste e cor que advém da utilização de diferentes protocolos de cor, bem como da própria digitalização da lâmina. As imagens histológicas digitalizadas e normalizadas foram posteriormente divididas em imagens mais pequenas, isto é, subimagens, uma vez que desta forma existe uma otimização da extração de características por parte dos algoritmos. Estas subimagens foram individualmente visualizadas e anotadas, originando um total de cerca de 160,000 subimagens, correspondentes aos 200 casos diferentes selecionados. Para o desenvolvimento do modelo de classificação do cancro de próstata, a arquitetura Inception v3 foi implementada e treinada utilizando as subimagens da base de dados. Este modelo foi capaz de identificar três classes distintas: negativa (tecido benigno), positiva (tecido maligno) e neoplasia intraepitelial da próstata, esta última, embora com menor precisão dada a quantidade reduzida de exemplos pertencentes a esta classe. Um valor de 93 % de precisão foi obtido, o que corresponde a valores equiparados ao estado da arte para este tipo de técnicas. Este valor, contudo, demonstra ainda potencial para otimização e melhoria, uma vez que as diferentes classes dos dados utilizados seguiam uma distribuição não equilibrada. A inclusão de mais casos clínicos e a aplicação de técnicas de aumento de dados, podem ser facilmente realizadas, o que culminará num modelo com ainda melhor precisão de classificação. Relativamente ao modelo referente à previsão de recidiva bioquímica, a mesma arquitetura foi utilizada, mas neste caso, treinada apenas com base nas subimagens positivas, isto ´e, as subimagens contendo tecido maligno da próstata. Os resultados obtidos revelaram que este modelo não tem a capacidade de extrair informação relevante correlacionada com o objetivo do estudo, e portanto, não consegue distinguir com sucesso casos não recorrentes de casos recorrentes, produzindo apenas uma precisão de 60 %. Contudo, apesar do referido modelo falhar na execução do objetivo estipulado, é fundamental notar que a tarefa de predição de recidiva bioquímica é de complexidade elevada, não sendo possível aos patologistas, através da observação das imagens histológicas, retirar nenhuma conclusão que diretamente se correlacione com esta condição. Diferentes abordagens, como por exemplo, o aumento da quantidade de dados utilizados, a introdução no modelo de características clínicas relevantes no prognóstico da doença poderão apresentar melhorias substanciais, no que diz respeito à capacidade preditiva deste modelo. Concluindo, a capacidade de algoritmos de deep learning para extrair informação relevante de imagens digitais da histopatologia da próstata foi demonstrada através do presente estudo. O desenvolvimento e o criação de uma base de dados anotados, fornece a base fundamental para o desenvolvimento de modelos adicionais, onde diversas questões podem ser exploradas. O desenvolvimento de uma interface que permita implementar o modelo de deteção de cancro da próstata desenvolvido é também uma possibilidade, uma vez que fornece eficiência e consistência, beneficiando a prática da patologia clinica.