Publicação

Development of a recommender system based on life and health sciences literature

Ver documento

Detalhes bibliográficos
Resumo:Os sistemas de recomendação têm evoluído rapidamente e transformado o nosso diaa-dia ao usar grandes quantidades de informação para obter recomendações personalizadas em áreas como música, filmes ou vendas online. No entanto, nas ciências da vida e da saúde, apesar da necessidade de novas formas de explorar a crescente quantidade de informação digital, há um obstáculo que tem impedido esta evolução: a privacidade dos dados. É preciso ter acesso às preferências dos utilizadores para testar e evoluir os sistemas de recomendação em saúde. O objetivo deste trabalho é criar um conjunto de dados de acesso aberto com preferências de utilizadores obtidas implicitamente a partir de literatura das ciências da vida e da saúde, e testá-lo utilizando sistemas de recomendação de filtragem colaborativa. Utilizando a metodologia LIBRETTI, criámos um conjunto de dados (DisRM) a partir de artigos científicos do PubMed. O DisRM está no formato <utilizador, item, classificação> onde os utilizadores são autores de artigos e os itens são doenças, tendo um total de 2 309 190 classificações. Foram criados dois conjuntos de dados adicionais, DisRM10 e DisRM20, que incluem apenas os utilizadores que têm um número de classificações igual ou superior a 10 e 20, respetivamente. Ao aplicar um algoritmo de filtragem colaborativa k-vizinhos mais próximos baseado em memória aos conjuntos de dados DisRM10 e DisRM20, o objetivo era otimizar o recall e o ganho cumulativo com desconto normalizado (nDCG) para garantir que a maioria dos itens relevantes eram recomendados e apareciam primeiro na lista de recomendações. Os melhores resultados de recomendações foram alcançados utilizando a medida de similaridade PIP, obtendo um recall de 0.81 e um nDCG de 0.87 para o DisRM10. Comparando o DisRM com outros conjuntos de dados padronizados, este obteve resultados semelhantes ou melhores o que valida a qualidade do nosso conjunto de dados.
Autores principais:Cunha, Maria Teresa Hipólito da
Assunto:Sistemas de Recomendação Saúde Conjunto de dados Preferências Implícitas Filtragem Colaborativa Teses de mestrado - 2023
Ano:2023
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
_version_ 1866811285437415424
author Cunha, Maria Teresa Hipólito da
author_facet Cunha, Maria Teresa Hipólito da
author_role author
contributor_name_str_mv Barros, Márcia Cristina Afonso
Repositório Científico de Acesso Aberto da ULisboa
country_str PT
creators_json_txt [{\"Person.name\":\"Cunha, Maria Teresa Hipólito da\"}]
datacite.contributors.contributor.contributorName.fl_str_mv Barros, Márcia Cristina Afonso
Repositório Científico de Acesso Aberto da ULisboa
datacite.creators.creator.creatorName.fl_str_mv Cunha, Maria Teresa Hipólito da
datacite.date.Accepted.fl_str_mv 2023-01-01T00:00:00Z
datacite.date.available.fl_str_mv 2023-05-26T16:48:19Z
datacite.date.embargoed.fl_str_mv 2023-05-26T16:48:19Z
datacite.rights.fl_str_mv http://purl.org/coar/access_right/c_abf2
datacite.subjects.subject.fl_str_mv Sistemas de Recomendação
Saúde
Conjunto de dados
Preferências Implícitas
Filtragem Colaborativa
Teses de mestrado - 2023
datacite.titles.title.fl_str_mv Development of a recommender system based on life and health sciences literature
dc.contributor.none.fl_str_mv Barros, Márcia Cristina Afonso
Repositório Científico de Acesso Aberto da ULisboa
dc.creator.none.fl_str_mv Cunha, Maria Teresa Hipólito da
dc.date.Accepted.fl_str_mv 2023-01-01T00:00:00Z
dc.date.available.fl_str_mv 2023-05-26T16:48:19Z
dc.date.embargoed.fl_str_mv 2023-05-26T16:48:19Z
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv http://hdl.handle.net/10451/57642
dc.language.none.fl_str_mv eng
dc.rights.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.subject.none.fl_str_mv Sistemas de Recomendação
Saúde
Conjunto de dados
Preferências Implícitas
Filtragem Colaborativa
Teses de mestrado - 2023
dc.title.fl_str_mv Development of a recommender system based on life and health sciences literature
dc.type.none.fl_str_mv http://purl.org/coar/resource_type/c_bdcc
description Os sistemas de recomendação têm evoluído rapidamente e transformado o nosso diaa-dia ao usar grandes quantidades de informação para obter recomendações personalizadas em áreas como música, filmes ou vendas online. No entanto, nas ciências da vida e da saúde, apesar da necessidade de novas formas de explorar a crescente quantidade de informação digital, há um obstáculo que tem impedido esta evolução: a privacidade dos dados. É preciso ter acesso às preferências dos utilizadores para testar e evoluir os sistemas de recomendação em saúde. O objetivo deste trabalho é criar um conjunto de dados de acesso aberto com preferências de utilizadores obtidas implicitamente a partir de literatura das ciências da vida e da saúde, e testá-lo utilizando sistemas de recomendação de filtragem colaborativa. Utilizando a metodologia LIBRETTI, criámos um conjunto de dados (DisRM) a partir de artigos científicos do PubMed. O DisRM está no formato <utilizador, item, classificação> onde os utilizadores são autores de artigos e os itens são doenças, tendo um total de 2 309 190 classificações. Foram criados dois conjuntos de dados adicionais, DisRM10 e DisRM20, que incluem apenas os utilizadores que têm um número de classificações igual ou superior a 10 e 20, respetivamente. Ao aplicar um algoritmo de filtragem colaborativa k-vizinhos mais próximos baseado em memória aos conjuntos de dados DisRM10 e DisRM20, o objetivo era otimizar o recall e o ganho cumulativo com desconto normalizado (nDCG) para garantir que a maioria dos itens relevantes eram recomendados e apareciam primeiro na lista de recomendações. Os melhores resultados de recomendações foram alcançados utilizando a medida de similaridade PIP, obtendo um recall de 0.81 e um nDCG de 0.87 para o DisRM10. Comparando o DisRM com outros conjuntos de dados padronizados, este obteve resultados semelhantes ou melhores o que valida a qualidade do nosso conjunto de dados.
dirty 0
eu_rights_str_mv openAccess
format masterThesis
fulltext.url.fl_str_mv https://repositorio.ulisboa.pt/bitstreams/cfbeecf8-e279-4172-90ca-3f7defcfafc1/download
funding.funder.alternateName_str_mv FCT
funding.funder.identifier_str_mv http://doi.org/10.13039/501100001871
funding.funder.name_str_mv Fundação para a Ciência e a Tecnologia
funding.name_str_mv 6817 - DCRRNI ID
id ul_698d0a415f87bf2f5bf2bf310d9b835c
identifier.url.fl_str_mv http://hdl.handle.net/10451/57642
instacron_str ul
institution Universidade de Lisboa
instname_str Universidade de Lisboa
language eng
network_acronym_str ul
network_name_str Repositório da Universidade de Lisboa
oai_identifier_str oai:repositorio.ulisboa.pt:10451/57642
organization_str_mv urn:organizationAcronym:ul
person_str_mv Cunha, Maria Teresa Hipólito da
publishDate 2023
reponame_str Repositório da Universidade de Lisboa
repository_id_str urn:repositoryAcronym:ul
service_str_mv urn:repositoryAcronym:ul
spelling engpt_PTOs sistemas de recomendação têm evoluído rapidamente e transformado o nosso diaa-dia ao usar grandes quantidades de informação para obter recomendações personalizadas em áreas como música, filmes ou vendas online. No entanto, nas ciências da vida e da saúde, apesar da necessidade de novas formas de explorar a crescente quantidade de informação digital, há um obstáculo que tem impedido esta evolução: a privacidade dos dados. É preciso ter acesso às preferências dos utilizadores para testar e evoluir os sistemas de recomendação em saúde. O objetivo deste trabalho é criar um conjunto de dados de acesso aberto com preferências de utilizadores obtidas implicitamente a partir de literatura das ciências da vida e da saúde, e testá-lo utilizando sistemas de recomendação de filtragem colaborativa. Utilizando a metodologia LIBRETTI, criámos um conjunto de dados (DisRM) a partir de artigos científicos do PubMed. O DisRM está no formato <utilizador, item, classificação> onde os utilizadores são autores de artigos e os itens são doenças, tendo um total de 2 309 190 classificações. Foram criados dois conjuntos de dados adicionais, DisRM10 e DisRM20, que incluem apenas os utilizadores que têm um número de classificações igual ou superior a 10 e 20, respetivamente. Ao aplicar um algoritmo de filtragem colaborativa k-vizinhos mais próximos baseado em memória aos conjuntos de dados DisRM10 e DisRM20, o objetivo era otimizar o recall e o ganho cumulativo com desconto normalizado (nDCG) para garantir que a maioria dos itens relevantes eram recomendados e apareciam primeiro na lista de recomendações. Os melhores resultados de recomendações foram alcançados utilizando a medida de similaridade PIP, obtendo um recall de 0.81 e um nDCG de 0.87 para o DisRM10. Comparando o DisRM com outros conjuntos de dados padronizados, este obteve resultados semelhantes ou melhores o que valida a qualidade do nosso conjunto de dados.application/pdfpt_PTDevelopment of a recommender system based on life and health sciences literatureCunha, Maria Teresa Hipólito daBarros, Márcia Cristina AfonsoHostingInstitutionOrganizationalRepositório Científico de Acesso Aberto da ULisboae-mailmailto:repositorio@reitoria.ulisboa.ptrepositorio@reitoria.ulisboa.ptURNurn:tid:2034917262023-05-26T16:48:19Z202320222023-01-01T00:00:00ZHandlehttp://hdl.handle.net/10451/57642http://purl.org/coar/access_right/c_abf2open accessSistemas de RecomendaçãoSaúdeConjunto de dadosPreferências ImplícitasFiltragem ColaborativaTeses de mestrado - 20232462041 bytesFundação para a Ciência e a TecnologiaLASIGE - Extreme Computing6817 - DCRRNI IDCrossref Funder IDhttp://doi.org/10.13039/501100001871literaturehttp://purl.org/coar/resource_type/c_bdccmaster thesishttp://purl.org/coar/access_right/c_abf2application/pdffulltexthttps://repositorio.ulisboa.pt/bitstreams/cfbeecf8-e279-4172-90ca-3f7defcfafc1/download
spellingShingle Development of a recommender system based on life and health sciences literature
Cunha, Maria Teresa Hipólito da
Sistemas de Recomendação
Saúde
Conjunto de dados
Preferências Implícitas
Filtragem Colaborativa
Teses de mestrado - 2023
status SINGLETON
subject.fl_str_mv Sistemas de Recomendação
Saúde
Conjunto de dados
Preferências Implícitas
Filtragem Colaborativa
Teses de mestrado - 2023
title Development of a recommender system based on life and health sciences literature
title_full Development of a recommender system based on life and health sciences literature
title_fullStr Development of a recommender system based on life and health sciences literature
title_full_unstemmed Development of a recommender system based on life and health sciences literature
title_short Development of a recommender system based on life and health sciences literature
title_sort Development of a recommender system based on life and health sciences literature
topic Sistemas de Recomendação
Saúde
Conjunto de dados
Preferências Implícitas
Filtragem Colaborativa
Teses de mestrado - 2023
topic_facet Sistemas de Recomendação
Saúde
Conjunto de dados
Preferências Implícitas
Filtragem Colaborativa
Teses de mestrado - 2023
url http://hdl.handle.net/10451/57642
visible 1