Publicação
Coerência probabilística em sistemas chave - valor escaláveis
| Resumo: | A escalabilidade é uma das características de maior relevância para os sistemas de armazenamento de dados. Com o crescimento exponencial de volume de dados e número de utilizadores, um sistema não escalável é um sistema praticamente inutilizável nos dias de hoje, porque não consegue lidar com tanta informação concorrente. Para acompanhar este crescimento, novos tipos de sistemas foram introduzidos, capazes de atingir alta escalabilidade. No entanto, relaxam a coerência dos dados evitando assim protocolos de coordenação. Estas abordagens tipicamente lidam melhor com churn e faltas, contudo, como relaxam a coerência, impedem um modelo mais simples e intuitivo para o cliente, obrigando-o a preocupações como o nível de concorrência no sistema para atenuar esta falta de consistência. Considerando o DataFlasks, um sistema de armazenamento de dados descentralizado, é uma destas abordagens que é capaz de lidar com o dinamismo do sistema, contudo, não impõe níveis de consistência forte no sistema. Por outro lado com o EpTO, um protocolo de ordem total probabilístico, consegue-se oferecer garantias mais fortes de coerência de dados e oferecer um modelo rico e simples para o cliente. Ambos são baseados em protocolos epidémicos com o intuito de oferecer garantias de escalabilidade e robustez ao sistema. Dado estas propriedades e condições para atingir as mesmas, seria interessante encontrar um compromisso que oferecesse o melhor entre os dois mundos, escalabilidade e robustez do sistema, e escalabilidade e coerência de dados do protocolo. Esta dissertação avança um passo nesse sentido, e implementa um sistema capaz de oferecer essas propriedades. Por fim, é proposto uma avaliação deste novo protótipo, de maneira a verificar uma compatibilidade entre coerência de dados e desempenho. |
|---|---|
| Autores principais: | Ribeiro, José Luís Enes |
| Ano: | 2017 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso restrito |
| Instituição associada: | Universidade do Minho |
| Idioma: | português |
| Origem: | RepositóriUM - Universidade do Minho |
| Resumo: | A escalabilidade é uma das características de maior relevância para os sistemas de armazenamento de dados. Com o crescimento exponencial de volume de dados e número de utilizadores, um sistema não escalável é um sistema praticamente inutilizável nos dias de hoje, porque não consegue lidar com tanta informação concorrente. Para acompanhar este crescimento, novos tipos de sistemas foram introduzidos, capazes de atingir alta escalabilidade. No entanto, relaxam a coerência dos dados evitando assim protocolos de coordenação. Estas abordagens tipicamente lidam melhor com churn e faltas, contudo, como relaxam a coerência, impedem um modelo mais simples e intuitivo para o cliente, obrigando-o a preocupações como o nível de concorrência no sistema para atenuar esta falta de consistência. Considerando o DataFlasks, um sistema de armazenamento de dados descentralizado, é uma destas abordagens que é capaz de lidar com o dinamismo do sistema, contudo, não impõe níveis de consistência forte no sistema. Por outro lado com o EpTO, um protocolo de ordem total probabilístico, consegue-se oferecer garantias mais fortes de coerência de dados e oferecer um modelo rico e simples para o cliente. Ambos são baseados em protocolos epidémicos com o intuito de oferecer garantias de escalabilidade e robustez ao sistema. Dado estas propriedades e condições para atingir as mesmas, seria interessante encontrar um compromisso que oferecesse o melhor entre os dois mundos, escalabilidade e robustez do sistema, e escalabilidade e coerência de dados do protocolo. Esta dissertação avança um passo nesse sentido, e implementa um sistema capaz de oferecer essas propriedades. Por fim, é proposto uma avaliação deste novo protótipo, de maneira a verificar uma compatibilidade entre coerência de dados e desempenho. |
|---|