Publicação
Development of a recommender system based on life and health sciences literature
| Resumo: | Os sistemas de recomendação têm evoluído rapidamente e transformado o nosso diaa-dia ao usar grandes quantidades de informação para obter recomendações personalizadas em áreas como música, filmes ou vendas online. No entanto, nas ciências da vida e da saúde, apesar da necessidade de novas formas de explorar a crescente quantidade de informação digital, há um obstáculo que tem impedido esta evolução: a privacidade dos dados. É preciso ter acesso às preferências dos utilizadores para testar e evoluir os sistemas de recomendação em saúde. O objetivo deste trabalho é criar um conjunto de dados de acesso aberto com preferências de utilizadores obtidas implicitamente a partir de literatura das ciências da vida e da saúde, e testá-lo utilizando sistemas de recomendação de filtragem colaborativa. Utilizando a metodologia LIBRETTI, criámos um conjunto de dados (DisRM) a partir de artigos científicos do PubMed. O DisRM está no formato <utilizador, item, classificação> onde os utilizadores são autores de artigos e os itens são doenças, tendo um total de 2 309 190 classificações. Foram criados dois conjuntos de dados adicionais, DisRM10 e DisRM20, que incluem apenas os utilizadores que têm um número de classificações igual ou superior a 10 e 20, respetivamente. Ao aplicar um algoritmo de filtragem colaborativa k-vizinhos mais próximos baseado em memória aos conjuntos de dados DisRM10 e DisRM20, o objetivo era otimizar o recall e o ganho cumulativo com desconto normalizado (nDCG) para garantir que a maioria dos itens relevantes eram recomendados e apareciam primeiro na lista de recomendações. Os melhores resultados de recomendações foram alcançados utilizando a medida de similaridade PIP, obtendo um recall de 0.81 e um nDCG de 0.87 para o DisRM10. Comparando o DisRM com outros conjuntos de dados padronizados, este obteve resultados semelhantes ou melhores o que valida a qualidade do nosso conjunto de dados. |
|---|---|
| Autores principais: | Cunha, Maria Teresa Hipólito da |
| Assunto: | Sistemas de Recomendação Saúde Conjunto de dados Preferências Implícitas Filtragem Colaborativa Teses de mestrado - 2023 |
| Ano: | 2023 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade de Lisboa |
| Idioma: | inglês |
| Origem: | Repositório da Universidade de Lisboa |
| _version_ | 1866811285437415424 |
|---|---|
| author | Cunha, Maria Teresa Hipólito da |
| author_facet | Cunha, Maria Teresa Hipólito da |
| author_role | author |
| contributor_name_str_mv | Barros, Márcia Cristina Afonso Repositório Científico de Acesso Aberto da ULisboa |
| country_str | PT |
| creators_json_txt | [{\"Person.name\":\"Cunha, Maria Teresa Hipólito da\"}] |
| datacite.contributors.contributor.contributorName.fl_str_mv | Barros, Márcia Cristina Afonso Repositório Científico de Acesso Aberto da ULisboa |
| datacite.creators.creator.creatorName.fl_str_mv | Cunha, Maria Teresa Hipólito da |
| datacite.date.Accepted.fl_str_mv | 2023-01-01T00:00:00Z |
| datacite.date.available.fl_str_mv | 2023-05-26T16:48:19Z |
| datacite.date.embargoed.fl_str_mv | 2023-05-26T16:48:19Z |
| datacite.rights.fl_str_mv | http://purl.org/coar/access_right/c_abf2 |
| datacite.subjects.subject.fl_str_mv | Sistemas de Recomendação Saúde Conjunto de dados Preferências Implícitas Filtragem Colaborativa Teses de mestrado - 2023 |
| datacite.titles.title.fl_str_mv | Development of a recommender system based on life and health sciences literature |
| dc.contributor.none.fl_str_mv | Barros, Márcia Cristina Afonso Repositório Científico de Acesso Aberto da ULisboa |
| dc.creator.none.fl_str_mv | Cunha, Maria Teresa Hipólito da |
| dc.date.Accepted.fl_str_mv | 2023-01-01T00:00:00Z |
| dc.date.available.fl_str_mv | 2023-05-26T16:48:19Z |
| dc.date.embargoed.fl_str_mv | 2023-05-26T16:48:19Z |
| dc.format.none.fl_str_mv | application/pdf |
| dc.identifier.none.fl_str_mv | http://hdl.handle.net/10451/57642 |
| dc.language.none.fl_str_mv | eng |
| dc.rights.none.fl_str_mv | http://purl.org/coar/access_right/c_abf2 |
| dc.subject.none.fl_str_mv | Sistemas de Recomendação Saúde Conjunto de dados Preferências Implícitas Filtragem Colaborativa Teses de mestrado - 2023 |
| dc.title.fl_str_mv | Development of a recommender system based on life and health sciences literature |
| dc.type.none.fl_str_mv | http://purl.org/coar/resource_type/c_bdcc |
| description | Os sistemas de recomendação têm evoluído rapidamente e transformado o nosso diaa-dia ao usar grandes quantidades de informação para obter recomendações personalizadas em áreas como música, filmes ou vendas online. No entanto, nas ciências da vida e da saúde, apesar da necessidade de novas formas de explorar a crescente quantidade de informação digital, há um obstáculo que tem impedido esta evolução: a privacidade dos dados. É preciso ter acesso às preferências dos utilizadores para testar e evoluir os sistemas de recomendação em saúde. O objetivo deste trabalho é criar um conjunto de dados de acesso aberto com preferências de utilizadores obtidas implicitamente a partir de literatura das ciências da vida e da saúde, e testá-lo utilizando sistemas de recomendação de filtragem colaborativa. Utilizando a metodologia LIBRETTI, criámos um conjunto de dados (DisRM) a partir de artigos científicos do PubMed. O DisRM está no formato <utilizador, item, classificação> onde os utilizadores são autores de artigos e os itens são doenças, tendo um total de 2 309 190 classificações. Foram criados dois conjuntos de dados adicionais, DisRM10 e DisRM20, que incluem apenas os utilizadores que têm um número de classificações igual ou superior a 10 e 20, respetivamente. Ao aplicar um algoritmo de filtragem colaborativa k-vizinhos mais próximos baseado em memória aos conjuntos de dados DisRM10 e DisRM20, o objetivo era otimizar o recall e o ganho cumulativo com desconto normalizado (nDCG) para garantir que a maioria dos itens relevantes eram recomendados e apareciam primeiro na lista de recomendações. Os melhores resultados de recomendações foram alcançados utilizando a medida de similaridade PIP, obtendo um recall de 0.81 e um nDCG de 0.87 para o DisRM10. Comparando o DisRM com outros conjuntos de dados padronizados, este obteve resultados semelhantes ou melhores o que valida a qualidade do nosso conjunto de dados. |
| dirty | 0 |
| eu_rights_str_mv | openAccess |
| format | masterThesis |
| fulltext.url.fl_str_mv | https://repositorio.ulisboa.pt/bitstreams/cfbeecf8-e279-4172-90ca-3f7defcfafc1/download |
| funding.funder.alternateName_str_mv | FCT |
| funding.funder.identifier_str_mv | http://doi.org/10.13039/501100001871 |
| funding.funder.name_str_mv | Fundação para a Ciência e a Tecnologia |
| funding.name_str_mv | 6817 - DCRRNI ID |
| id | ul_698d0a415f87bf2f5bf2bf310d9b835c |
| identifier.url.fl_str_mv | http://hdl.handle.net/10451/57642 |
| instacron_str | ul |
| institution | Universidade de Lisboa |
| instname_str | Universidade de Lisboa |
| language | eng |
| network_acronym_str | ul |
| network_name_str | Repositório da Universidade de Lisboa |
| oai_identifier_str | oai:repositorio.ulisboa.pt:10451/57642 |
| organization_str_mv | urn:organizationAcronym:ul |
| person_str_mv | Cunha, Maria Teresa Hipólito da |
| publishDate | 2023 |
| reponame_str | Repositório da Universidade de Lisboa |
| repository_id_str | urn:repositoryAcronym:ul |
| service_str_mv | urn:repositoryAcronym:ul |
| spelling | engpt_PTOs sistemas de recomendação têm evoluído rapidamente e transformado o nosso diaa-dia ao usar grandes quantidades de informação para obter recomendações personalizadas em áreas como música, filmes ou vendas online. No entanto, nas ciências da vida e da saúde, apesar da necessidade de novas formas de explorar a crescente quantidade de informação digital, há um obstáculo que tem impedido esta evolução: a privacidade dos dados. É preciso ter acesso às preferências dos utilizadores para testar e evoluir os sistemas de recomendação em saúde. O objetivo deste trabalho é criar um conjunto de dados de acesso aberto com preferências de utilizadores obtidas implicitamente a partir de literatura das ciências da vida e da saúde, e testá-lo utilizando sistemas de recomendação de filtragem colaborativa. Utilizando a metodologia LIBRETTI, criámos um conjunto de dados (DisRM) a partir de artigos científicos do PubMed. O DisRM está no formato <utilizador, item, classificação> onde os utilizadores são autores de artigos e os itens são doenças, tendo um total de 2 309 190 classificações. Foram criados dois conjuntos de dados adicionais, DisRM10 e DisRM20, que incluem apenas os utilizadores que têm um número de classificações igual ou superior a 10 e 20, respetivamente. Ao aplicar um algoritmo de filtragem colaborativa k-vizinhos mais próximos baseado em memória aos conjuntos de dados DisRM10 e DisRM20, o objetivo era otimizar o recall e o ganho cumulativo com desconto normalizado (nDCG) para garantir que a maioria dos itens relevantes eram recomendados e apareciam primeiro na lista de recomendações. Os melhores resultados de recomendações foram alcançados utilizando a medida de similaridade PIP, obtendo um recall de 0.81 e um nDCG de 0.87 para o DisRM10. Comparando o DisRM com outros conjuntos de dados padronizados, este obteve resultados semelhantes ou melhores o que valida a qualidade do nosso conjunto de dados.application/pdfpt_PTDevelopment of a recommender system based on life and health sciences literatureCunha, Maria Teresa Hipólito daBarros, Márcia Cristina AfonsoHostingInstitutionOrganizationalRepositório Científico de Acesso Aberto da ULisboae-mailmailto:repositorio@reitoria.ulisboa.ptrepositorio@reitoria.ulisboa.ptURNurn:tid:2034917262023-05-26T16:48:19Z202320222023-01-01T00:00:00ZHandlehttp://hdl.handle.net/10451/57642http://purl.org/coar/access_right/c_abf2open accessSistemas de RecomendaçãoSaúdeConjunto de dadosPreferências ImplícitasFiltragem ColaborativaTeses de mestrado - 20232462041 bytesFundação para a Ciência e a TecnologiaLASIGE - Extreme Computing6817 - DCRRNI IDCrossref Funder IDhttp://doi.org/10.13039/501100001871literaturehttp://purl.org/coar/resource_type/c_bdccmaster thesishttp://purl.org/coar/access_right/c_abf2application/pdffulltexthttps://repositorio.ulisboa.pt/bitstreams/cfbeecf8-e279-4172-90ca-3f7defcfafc1/download |
| spellingShingle | Development of a recommender system based on life and health sciences literature Cunha, Maria Teresa Hipólito da Sistemas de Recomendação Saúde Conjunto de dados Preferências Implícitas Filtragem Colaborativa Teses de mestrado - 2023 |
| status | SINGLETON |
| subject.fl_str_mv | Sistemas de Recomendação Saúde Conjunto de dados Preferências Implícitas Filtragem Colaborativa Teses de mestrado - 2023 |
| title | Development of a recommender system based on life and health sciences literature |
| title_full | Development of a recommender system based on life and health sciences literature |
| title_fullStr | Development of a recommender system based on life and health sciences literature |
| title_full_unstemmed | Development of a recommender system based on life and health sciences literature |
| title_short | Development of a recommender system based on life and health sciences literature |
| title_sort | Development of a recommender system based on life and health sciences literature |
| topic | Sistemas de Recomendação Saúde Conjunto de dados Preferências Implícitas Filtragem Colaborativa Teses de mestrado - 2023 |
| topic_facet | Sistemas de Recomendação Saúde Conjunto de dados Preferências Implícitas Filtragem Colaborativa Teses de mestrado - 2023 |
| url | http://hdl.handle.net/10451/57642 |
| visible | 1 |