Publicação

Identificação de delirium em contexto hospitalar através de algoritmos de machine learning

Detalhes bibliográficos
Resumo:	O aumento da esperança média de vida embora seja um indicador da melhoria da qualidade de vida, está também associado a um acréscimo de doenças crónicas. Em virtude das múltiplas alterações fisiológicas que caracterizam o indivíduo idoso é de esperar que este grupo etário seja particularmente vulnerável aos efeitos adversos da hospitalização. Pequenas alterações causadas pela mudança do estado de doença podem promover estados de confusão e desorientação nestes indivíduos. O delirium é uma manifestação comum de disfunção neuropsiquiátrica aguda grave, muito prevalente em ambiente hospitalar, que devido à sua variabilidade de apresentação clínica é frequentemente subdiagnosticado e negligenciado. Neste contexto, surgiu o tema desta dissertação, cujo objetivo se centrou no desenvolvimento de um modelo capaz de prever a ocorrência ou não de delirium. Para tal, foi usada a linguagem Python e uma base de dados recolhida num hospital português entre 2014 e 2016. O modelo desenvolvido foi implementado numa aplicação web, disponível através da seguinte hiperligação: https://share.streamlit.io/natawild/appdelirium/main/AppDelirium.py. Foram testados algoritmos de machine learning (ML), nomeadamente os algoritmos Random Forest (RF) e regressão logística (RL). A modelação iniciou-se com uma limpeza da base de dados, eliminando as variáveis e registos que não possuíam informações relevantes para a previsão de delirium. De seguida, executou-se uma transformação de dados que incluiu um agrupamento de medicamentos por grupo farmacológico e uma transformação dos dados categóricos. A seleção de variáveis foi realizada através do método wrapper, no qual foram testados os métodos Sequential Feature Selector (SFS), Recursive Feature Elimination (RFE) e Select From Model (SFM). Dos modelos estudados, verificou-se o algoritmo de classificação RL com o método de seleção de variáveis SFM foi o que apresentou melhores resultados nas métricas de avaliação do modelo. Obtendo-se como resultados um modelo com 36 variáveis, a área abaixo da curva ROC (AUC-ROC) de 0,833 e a área abaixo da curva precision-recall (AUC-PR) de 0,582. Conclui-se que a idade, os antipsicóticos e a glicose demonstraram-se mais relevantes para a previsão do delirium. E, embora o modelo de previsão ainda possa ser melhorado, apresenta-se como ferramenta interessante para o auxílio de diagnóstico de delirium em ambiente hospitalar.
Autores principais:	Figueiredo, Célia Natália Lemos
Assunto:	Delirium Machine learning Random forest Regressão logística Logistic regression Engenharia e Tecnologia
Ano:	2022
País:	Portugal
Tipo de documento:	dissertação de mestrado
Tipo de acesso:	acesso aberto
Instituição associada:	Universidade do Minho
Idioma:	português
Origem:	RepositóriUM - Universidade do Minho

Descrição
Resumo:	O aumento da esperança média de vida embora seja um indicador da melhoria da qualidade de vida, está também associado a um acréscimo de doenças crónicas. Em virtude das múltiplas alterações fisiológicas que caracterizam o indivíduo idoso é de esperar que este grupo etário seja particularmente vulnerável aos efeitos adversos da hospitalização. Pequenas alterações causadas pela mudança do estado de doença podem promover estados de confusão e desorientação nestes indivíduos. O delirium é uma manifestação comum de disfunção neuropsiquiátrica aguda grave, muito prevalente em ambiente hospitalar, que devido à sua variabilidade de apresentação clínica é frequentemente subdiagnosticado e negligenciado. Neste contexto, surgiu o tema desta dissertação, cujo objetivo se centrou no desenvolvimento de um modelo capaz de prever a ocorrência ou não de delirium. Para tal, foi usada a linguagem Python e uma base de dados recolhida num hospital português entre 2014 e 2016. O modelo desenvolvido foi implementado numa aplicação web, disponível através da seguinte hiperligação: https://share.streamlit.io/natawild/appdelirium/main/AppDelirium.py. Foram testados algoritmos de machine learning (ML), nomeadamente os algoritmos Random Forest (RF) e regressão logística (RL). A modelação iniciou-se com uma limpeza da base de dados, eliminando as variáveis e registos que não possuíam informações relevantes para a previsão de delirium. De seguida, executou-se uma transformação de dados que incluiu um agrupamento de medicamentos por grupo farmacológico e uma transformação dos dados categóricos. A seleção de variáveis foi realizada através do método wrapper, no qual foram testados os métodos Sequential Feature Selector (SFS), Recursive Feature Elimination (RFE) e Select From Model (SFM). Dos modelos estudados, verificou-se o algoritmo de classificação RL com o método de seleção de variáveis SFM foi o que apresentou melhores resultados nas métricas de avaliação do modelo. Obtendo-se como resultados um modelo com 36 variáveis, a área abaixo da curva ROC (AUC-ROC) de 0,833 e a área abaixo da curva precision-recall (AUC-PR) de 0,582. Conclui-se que a idade, os antipsicóticos e a glicose demonstraram-se mais relevantes para a previsão do delirium. E, embora o modelo de previsão ainda possa ser melhorado, apresenta-se como ferramenta interessante para o auxílio de diagnóstico de delirium em ambiente hospitalar.