Document details

Selecção de hiper-cubos com base em padrões de exploração OLAP

Author(s): Rocha, Daniel

Date: 2011

Persistent ID: http://hdl.handle.net/1822/27921

Origin: RepositóriUM - Universidade do Minho

Subject(s): 681.3:658.0; 658.0:681.3


Description

Dissertação de mestrado em Engenharia de Informática

Na literatura do domínio do processamento analítico de dados facilmente se podem encontrar métodos e soluções que respondem ao problema de seleção de vistas multidimensionais no processo de implementação de um cubo OLAP. Uma forma que se evidencia como sendo extremamente vantajosa, é a de fazer a seleção baseada em critérios que se apoiem essencialmente nos conteúdos que são consultados sobre o cubo de dados ao longo das sessões de consulta OLAP. As principais vantagens que advêm desta monitorização, está relacionada com a possibilidade de efetuar correspondências rigorosas com a informação em que os agentes de decisão mais se apoiam para efetuar as suas tomadas de decisão. Ao ser feita a identificação da informação que se evidencia como sendo a mais relevante, ou pelo menos a mais frequentemente consultada, várias ilações se podem retirar, como, por exemplo, a definição de perfis de utilização, a expressão de preferências, a identificação de metodologias de trabalho, ou então a definição de processos que procurem construir cubos iceberg com forte probabilidade de explorações futuras sobre o cubo. Este último aspeto constitui, basicamente, o trabalho desta dissertação. Ao se efetuar a materialização dos conteúdos mais pesquisados no servidor OLAP, obtém-se um melhor desempenho ao nível do servidor, uma vez que o preparamos antecipadamente com os dados que mais vezes são solicitados, reduzindo assim o número de vezes que seria necessário recorrer ao data warehouse para retornar os resultados pretendidos por uma dada query multidimensional. Em termos gerais, neste trabalho de dissertação, desenvolveu-se um estudo detalhado acerca das ideias e práticas que levam ao desenvolvimento de um dado método de seleção, que seja capaz de indicar de forma precisa as partes de um cubo que são mais utilizadas, sugerindo com base nessa informação uma nova estrutura para o cubo em questão que utilize menos recursos computacionais, nomeadamente espaço em disco e tempo de processamento.

In the literature, we can easily find methods and solutions that solve the problem of pick a set of multidimensional views in the implementation of a data cube process. One way that is shown to be extremely advantageous, is to make this selection based on criteria directly related with the contents that are searched on the data cube, along the OLAP query sessions. The main advantage that becomes with this monitoring process is the ability to make accurate matches with the information that decision-makers really are interested. With the identification of the information that is characterized as being the most researched, several conclusions and utilities can be made, such as setting profile users, find expressions of preferences, identify methods of work, or defining processes that build iceberg cubes with a strong probability of further explorations, subject that is discussed in this master thesis. Better performance can be developed in the server if we materialize only the most researched content on the OLAP server. The server is prepared with the data that is more times requested and then the number of times that is needed to exploit the data warehouse is reduced. In this master thesis is produced a study who combines ideas and practices that lead to the development of a selection method that makes a very precise indication of the contents to be selected, making a constant control of the multidimensional queries made on the data cube. Then we can identify which parts of the cube have the priority to be materialized. With this resolution, we can provide a more effective utilization for the community of users.

Document Type Master thesis
Language Portuguese
Advisor(s) Belo, Orlando
Contributor(s) Universidade do Minho
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents