Document details

Online probabilistic theory revision from examples : a proPPR approach

Author(s): Guimarães, Victor Augusto Lopes

Date: 2020

Persistent ID: http://hdl.handle.net/11422/13080

Origin: Oasisbr

Subject(s): CNPQ::ENGENHARIAS; online learning; statistical relational learning; theory revision from examples; inductive logic programming; mining data streams


Description

Submitted by Moreno Barros (moreno@ct.ufrj.br) on 2020-09-22T22:17:16Z No. of bitstreams: 1 VictorAugustoLopesGuimaraes.pdf: 4874105 bytes, checksum: 239182b71371050810cc6f9cbc1ac4ec (MD5)

Made available in DSpace on 2020-09-22T22:17:16Z (GMT). No. of bitstreams: 1 VictorAugustoLopesGuimaraes.pdf: 4874105 bytes, checksum: 239182b71371050810cc6f9cbc1ac4ec (MD5) Previous issue date: 2018-03

A manipulação de fluxos de dados relacionais estruturados se tornou uma tarefa crucial, dada a disponibilidade de conteúdo produzido por sensores e pela Internet, como redes sociais e grafos de conhecimento. Esta tarefa é ainda mais desafiadora em um ambiente relacional do que em ambientes que lidam com exemplos i.i.d., dado que não podemos garantir que os exemplos são independentes. Além disso, a maioria dos métodos de aprendizado relacional ainda são projetados para aprender apenas a partir de conjuntos fechados de dados, não considerando modelos aprendidos em iterações anteriores de exemplos. Neste trabalho, nós propomos OSLR, um algoritmo de aprendizado relacional incremental que é capaz de lidar com fluxos de dados contínuos de exemplos, a medida em que eles chegam. Nós aplicamos técnica de revisão de teoria para aproveitar o conhecimento preliminar como ponto de partida, buscando onde o mesmo deve ser modificado para considerar novos exemplos e aplicando automaticamente essas modificações. Nós nos baseamos na teoria estatística do limitante de Hoeding para decidir se o modelo, de fato, deve ser atualizado, de acordo com novos exemplos. Nosso sistema foi construído sobre a linguagem estatística relacional ProPPR, para descrever os modelos induzidos, visando considerar a incerteza inerente de dados reais. Resultados experimentais em bases de co-autoria e redes sociais mostram o potencial da abordagem proposta comparada com outros métodos de aprendizado relacional.

Handling relational data streams has become a crucial task, given the availability of pervasive sensors and Internet-produced content, such as social networks and knowledge graphs. In a relational environment, this is a particularly challenging task, since one cannot assure that the streams of examples are independent along the iterations. Thus, most relational machine learning methods are still designed to learn only from closed batches of data, not considering the models acquired in previous iterations of incoming examples. In this work, we propose OSLR, an online relational learning algorithm that can handle continuous, open-ended streams of relational examples as they arrive. We employ techniques from theory revision to take advantage of the already acquired knowledge as a starting point, find where it should be modified to cope with the new examples, and automatically update it. We rely on the Hoeding’s bound statistical theory to decide if the model must in fact be updated accordingly to the new examples. Our system is built upon ProPPR statistical relational language to describe the induced models, aiming at contemplating the uncertainty inherent to real data. Experimental results in entity co-reference and social networks datasets show the potential of the proposed approach compared to other relational learners

Document Type Master thesis
Language English
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents

No related documents