Publicação

Uma arquitetura moderna de dados: um caso de teste

Ver documento

Detalhes bibliográficos
Resumo:Atualmente os dados são vistos como tendo tipos e origens distintas. Os tipos de dados podem ser estruturados, semiestruturados e não estruturados. As origens dos dados podem ser diversas como Enterprise Resource Planning (ERP), Customer Relationship Management (CRM), Supply Chain Management (SCM), folhas de cálculo, documentos de texto, redes sociais, imagens, vídeos, sensores entre outros. Esta diversidade de dados exige uma arquitetura moderna que permita a recolha dos dados de várias origens e tipos, viabilizando igualmente a extração, transformação e limpeza dos mesmos através do processo de Extract, Transform and Load (ETL), bem como o armazenamento e integração dos dados para posteriores análises. Esta arquitetura deve ser suportada por um ambiente de Cloud Computing, garantindo assim a sua atualidade, ubiquidade e fácil acesso pelos utilizadores. Este artigo propõe-se desenvolver uma arquitetura e implementar uma solução que será validade através de um caso de teste com dados da área da saúde.
Autores principais:Martins, César Silva
Outros Autores:Simões, Paulo; Sá, Jorge Vaz de Oliveira e
Assunto:Big Data Cloud Computing Cloud Computing Systems Architecture Big Data Analytics Technologies for Big Data Ciências Naturais::Ciências da Computação e da Informação
Ano:2014
País:Portugal
Tipo de documento:comunicação em conferência
Tipo de acesso:acesso aberto
Instituição associada:Universidade do Minho
Idioma:português
Origem:RepositóriUM - Universidade do Minho
Descrição
Resumo:Atualmente os dados são vistos como tendo tipos e origens distintas. Os tipos de dados podem ser estruturados, semiestruturados e não estruturados. As origens dos dados podem ser diversas como Enterprise Resource Planning (ERP), Customer Relationship Management (CRM), Supply Chain Management (SCM), folhas de cálculo, documentos de texto, redes sociais, imagens, vídeos, sensores entre outros. Esta diversidade de dados exige uma arquitetura moderna que permita a recolha dos dados de várias origens e tipos, viabilizando igualmente a extração, transformação e limpeza dos mesmos através do processo de Extract, Transform and Load (ETL), bem como o armazenamento e integração dos dados para posteriores análises. Esta arquitetura deve ser suportada por um ambiente de Cloud Computing, garantindo assim a sua atualidade, ubiquidade e fácil acesso pelos utilizadores. Este artigo propõe-se desenvolver uma arquitetura e implementar uma solução que será validade através de um caso de teste com dados da área da saúde.