Publicação

Preservação da Web através de replicação distribuida em larga escala

Detalhes bibliográficos
Resumo:	A Web e a maior fonte de informação alguma vez construída. A tendência verifidada nos últimos anos indica que a popularidade da Web vai continuar a aumentar no futuro, assim como a quantidade de informação que nela e exclusivamente publicada. No entanto, a informação publicada na Web está disponível durante um período de tempo muito curto, ndo o qual, por regra se perde para sempre. Surge assim o interesse na criação de arquivos da Web que permitam preservar esta informação para gerações vindouras. Para preservarem a informação os arquivos da Web requerem sistemas com elevada capacidade de armazenamento. Tradicionalmente, o armazenamento da informa ção e feito de uma forma centralizada. Contudo, esta aproximação e susceptível a perda de informação, caso ocorram falhas no sistema de armazenamento central. O trabalho apresentado nesta tese enquadra-se no projecto de Arquivo da Web Portuguesa1, em curso na Fundação para a Computação Cientifica Nacional2. Este trabalho tem como objectivo a criação de um sistema de replicação distribuído que permita tolerar falhas nos sistemas de armazenamento de arquivos da Web, através da replicação dos conteúdos arquivados por computadores espalhados pela Internet.
Autores principais:	Nogueira, André Ricardo Lopes
Assunto:	Formato ARC Bibliotecas digitais Preservação digital Arquivos da Web Sistemas distribuídos
Ano:	2008
País:	Portugal
Tipo de documento:	dissertação de mestrado
Tipo de acesso:	acesso restrito
Instituição associada:	Universidade de Lisboa
Idioma:	português
Origem:	Repositório da Universidade de Lisboa

Descrição
Resumo:	A Web e a maior fonte de informação alguma vez construída. A tendência verifidada nos últimos anos indica que a popularidade da Web vai continuar a aumentar no futuro, assim como a quantidade de informação que nela e exclusivamente publicada. No entanto, a informação publicada na Web está disponível durante um período de tempo muito curto, ndo o qual, por regra se perde para sempre. Surge assim o interesse na criação de arquivos da Web que permitam preservar esta informação para gerações vindouras. Para preservarem a informação os arquivos da Web requerem sistemas com elevada capacidade de armazenamento. Tradicionalmente, o armazenamento da informa ção e feito de uma forma centralizada. Contudo, esta aproximação e susceptível a perda de informação, caso ocorram falhas no sistema de armazenamento central. O trabalho apresentado nesta tese enquadra-se no projecto de Arquivo da Web Portuguesa1, em curso na Fundação para a Computação Cientifica Nacional2. Este trabalho tem como objectivo a criação de um sistema de replicação distribuído que permita tolerar falhas nos sistemas de armazenamento de arquivos da Web, através da replicação dos conteúdos arquivados por computadores espalhados pela Internet.