Document details

Filtragem Colaborativa Incremental para recomendações automáticas na Web

Author(s): Miranda, Ana Catarina de Pinho cv logo 1

Date: 2010

Persistent ID: http://hdl.handle.net/10216/20592

Origin: Repositório Aberto da Universidade do Porto

Subject(s): INFORMÁTICA; Porto


Description
The use of collaborative filtering recommenders on the Web is typically done in environments where data is constantly flowing and new customers and products are emerging. In this work, it is proposed an incremental version of item-based Collaborative Filtering for implicit binary ratings. It is compared with a non-incremental one, as well as with an incremental user-based approach. It is also study the use of techniques for working with sparse matrices on these algorithms. All the versions are implemented in R and are empirically evaluated on five different datasets with various number of users and/or items. It is observed that the measure of Recall used tend to improve when we continuously add information to the recommender model and that the time spent for recommendation does not degrade. Time for updating the similarity matrix (necessary to the recommendation) is relatively low and motivates the use of the item-based incremental approach. Análise de Dados e Sistemas de Apoio à Decisão Master in Data Analysis and Decision Support Systems O uso de Sistemas de Recomendação por Filtragem Colaborativa na Web é normalmente feito em ambientes onde os dados estão constantemente a alterar-se e a surgirem novos clientes e produtos. Neste trabalho, propõe-se uma versão incremental dos Sistemas de Recomendação por Filtragem Colaborativa baseados nos itens para dados implícitos (binários). Esta é comparada com uma versão não-incremental, bem como com uma abordagem incremental mas baseada nos utilizadores. Pretende-se também estudar o uso de técnicas de trabalho com matrizes esparsas nestes algoritmos. Todas as versões são implementadas em R e são avaliadas empiricamente em cinco conjuntos de dados diferentes onde se faz variar o número de utilizadores e/ou itens. Observa-se que a medida de Recall estudada tende a melhorar quando se adiciona continuamente informação ao modelo de recomendação e que o tempo gasto para a recomendação não se degrada. O tempo gasto na actualização da matriz de semelhança (necessária à recomendação) é relativamente baixo e motiva a utilização da abordagem incremental baseada nos itens.
Document Type Master Thesis
Language Portuguese
delicious logo  facebook logo  linkedin logo  twitter logo 
degois logo
mendeley logo

Related documents