Plataforma de BI dentro do SQL Server 2008 – prt 3

Fala galera, já vimos alguns conceitos super importantes sobre as tabelas que utilizamos no BI, hoje então vamos falar de mais alguns nomes que são bem comuns de se ouvir quando está implantando uma solução de Business Intelligence.

Vou falar das nomenclaturas de onde ficam armazenados os dados. Vale lembrar que as tabelas Relacionais alimentam as tabelas Fato que por sua vêz alimentam as Dimensões. As tabelas Fato e as Dimensões geram informações segmentadas que são armazenadas em bancos de dados (ou tabelas) que conceitualmente chamamos de DataMart. Os DataMarts (Mercado de Dados) são os repositórios segmentados por departamento, ou vertical, que fazem parte do DataWareHouse [DW] (Armazém de Dados). Existe uma briga muito grande para definir onde o DataMart entra em comparação ao DataWareHouse, alguns defentem a teoria do DataMart ser um sub-conjunto do DW que por sua vez é composto por vários DataMarts. Outro grupo não define o DataMart como um sub-conjunto do DW, eles definem como sendo dados menos importantes que tiveram sua origem como sendo o DW. Eu prefiro seguir a linha de raciocício numero 1.

Os DW (DataWareHouse) são os repositórios que armazenarão todas as informações processadas através das tabelas Fato e das Dimensões. Quando um cubo OLAP vai coletar as informações para gerar os relatórios, é no DW que o cubo faz sua busca e mineração dos dados. Para assegurar que os dados estão sempre atualizados, algumas rotinas de ETL ficam de tempos em tempos consultando as bases de dados de origem e alimentando as tabelas Fato. Estas origem podem ser bancos do próprio SQL Server ou outros SGBD como Oracle ou DB2, e até arquivos de texto como XML ou DAT.

Resumindo, o DataMart é um banco de dados menor que o datawarehouse e possui informações agrupadas de um depto (Vendas, MKT, RH, etc) ou segmento (Produtos, Regiões, Satisfação dos Clientes, etc). Já o DW é o repositório principal e engloba todos os DataMarts que estão fazendo parte da solução de BI que está sendo implantada.

A parte de conceito inicial já está apresentada, lendo os 3 posts sobre BI, com certeza não ficará perdido em nenhuma reunião com o time de negócios da sua empresa (já com o time de TI você vai precisar ler os próximos posts. 😛 )

Sobre Diego Nogare 350 Artigos
Diego Nogare é Gerente Técnico de Engenharia de Machine Learning no Itaú-Unibanco. Também é professor em programas de pós graduação no Mackenzie e na FIAP, em São Paulo. Foi nomeado como Microsoft MVP por 11 anos seguidos, e hoje faz parte do programa Microsoft Regional Director.