Publicação
Preservação da Web através de replicação distribuida em larga escala
| Resumo: | A Web e a maior fonte de informação alguma vez construída. A tendência verifidada nos últimos anos indica que a popularidade da Web vai continuar a aumentar no futuro, assim como a quantidade de informação que nela e exclusivamente publicada. No entanto, a informação publicada na Web está disponível durante um período de tempo muito curto, ndo o qual, por regra se perde para sempre. Surge assim o interesse na criação de arquivos da Web que permitam preservar esta informação para gerações vindouras. Para preservarem a informação os arquivos da Web requerem sistemas com elevada capacidade de armazenamento. Tradicionalmente, o armazenamento da informa ção e feito de uma forma centralizada. Contudo, esta aproximação e susceptível a perda de informação, caso ocorram falhas no sistema de armazenamento central. O trabalho apresentado nesta tese enquadra-se no projecto de Arquivo da Web Portuguesa1, em curso na Fundação para a Computação Cientifica Nacional2. Este trabalho tem como objectivo a criação de um sistema de replicação distribuído que permita tolerar falhas nos sistemas de armazenamento de arquivos da Web, através da replicação dos conteúdos arquivados por computadores espalhados pela Internet. |
|---|---|
| Autores principais: | Nogueira, André Ricardo Lopes |
| Assunto: | Formato ARC Bibliotecas digitais Preservação digital Arquivos da Web Sistemas distribuídos |
| Ano: | 2008 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso restrito |
| Instituição associada: | Universidade de Lisboa |
| Idioma: | português |
| Origem: | Repositório da Universidade de Lisboa |
| Resumo: | A Web e a maior fonte de informação alguma vez construída. A tendência verifidada nos últimos anos indica que a popularidade da Web vai continuar a aumentar no futuro, assim como a quantidade de informação que nela e exclusivamente publicada. No entanto, a informação publicada na Web está disponível durante um período de tempo muito curto, ndo o qual, por regra se perde para sempre. Surge assim o interesse na criação de arquivos da Web que permitam preservar esta informação para gerações vindouras. Para preservarem a informação os arquivos da Web requerem sistemas com elevada capacidade de armazenamento. Tradicionalmente, o armazenamento da informa ção e feito de uma forma centralizada. Contudo, esta aproximação e susceptível a perda de informação, caso ocorram falhas no sistema de armazenamento central. O trabalho apresentado nesta tese enquadra-se no projecto de Arquivo da Web Portuguesa1, em curso na Fundação para a Computação Cientifica Nacional2. Este trabalho tem como objectivo a criação de um sistema de replicação distribuído que permita tolerar falhas nos sistemas de armazenamento de arquivos da Web, através da replicação dos conteúdos arquivados por computadores espalhados pela Internet. |
|---|