Logo pt.removalsclassifieds.com

Diferença entre data warehouse e data marts (com tabela)

Índice:

Anonim

Quando se trata de plataformas nas quais construir sua pilha de análise de dados, as empresas têm várias opções. Um data warehouse centralizado, uma coleção de data marts mais especializados ou uma combinação dos dois podem ser considerados pelos gerentes de dados. Embora data warehouses e data marts sejam bastante semelhantes, eles atendem a propósitos bastante distintos, e uma organização pode empregar um ou ambos para certos casos de uso. Outra opção é um data lake, que não possui a estrutura baseada em esquema de um data warehouse ou data mart.

Data Warehousing vs Data Marts

A diferença entre um data warehouse e um data marts é que o primeiro é um banco de dados orientado a dados, enquanto o último é um banco de dados orientado a projetos. Outra distinção entre o data warehouse e o data mart é que o data warehouse tem um escopo amplo e o data mart tem um escopo estreito.

Um data warehouse, muitas vezes conhecido como uma única fonte da verdade, é um repositório que contém todos os dados atuais e históricos de uma organização de muitas fontes. É um componente importante de uma arquitetura de analítica de dados porque cria um ambiente adequado para suporte à decisão, análise, inteligência de negócios e mineração de dados.

Um subconjunto orientado para negócios de um data warehouse é um data mart. Um data mart é uma versão reduzida de um data warehouse que contém dados essenciais e exigidos por uma equipe específica ou um grupo limitado de usuários dentro de uma organização. O objetivo da utilização de um data mart é indexar dados e possibilitar pesquisas sobre determinadas áreas da empresa, bem como atender às demandas de um determinado grupo de usuários dentro da organização.

Tabela de comparação entre data warehouse e data marts

Parâmetros de comparação

Armazenamento de dados

Data Marts

Tipo de sistema Centralizado. Descentralizado.
Dados Formulário detalhado. Formulário resumido.
Desnormalização Ligeiramente desnormalizado Altamente desnormalizado
Modelo de dados Careca Debaixo para cima
Natureza Adaptável, orientado para a informação e duradouro. Restrito, orientado a projetos e tem uma vida útil limitada.

O que é data warehouse?

O Data Warehouse encontra-se na categoria de sistema de gerenciamento de banco de dados relacional, desenvolvido para atender aos requisitos dos sistemas de processamento de transações. É um termo amplo que se refere a qualquer armazenamento de dados centralizado que pode ser acessado para fins comerciais. É um banco de dados que rastreia os dados que podem ser usados ​​para tomar decisões.

É uma coleção de auxílios à tomada de decisão projetados para ajudar os trabalhadores do conhecimento (executivos, gerentes e analistas) a fazer julgamentos melhores e mais informados. Como resultado, o Data Warehousing fornece sistemas e ferramentas que permitem aos líderes da empresa organizar, interpretar e aplicar sistematicamente seus dados para fazer escolhas estratégicas. Vários bancos de dados podem ser armazenados em um data warehouse.

Os dados são organizados em tabelas e colunas dentro de cada banco de dados. Uma descrição dos dados é especificada em cada coluna, como número inteiro, campo de dados ou texto. Os esquemas, que podem ser considerados como pastas, podem ser usados ​​para organizar tabelas. Os dados são ingeridos e armazenados nas inúmeras tabelas do esquema. O esquema é usado por ferramentas de consulta para descobrir quais tabelas de dados examinar e analisar.

Os usuários podem utilizar o Datawarehouse para melhor analisar e melhorar o desempenho de sua organização. À medida que os sistemas de computador se tornaram mais complicados e necessários para gerenciar grandes volumes de dados, a necessidade de armazenamento de dados cresceu. O armazenamento de dados, por outro lado, não é um conceito novo.

O que é Data Marts?

Um data mart é um banco de dados orientado ao assunto que normalmente é um subconjunto particionado de um data warehouse maior. Um data mart freqüentemente contém um subconjunto de dados pertencentes a uma determinada unidade de negócios, como vendas, finanças ou marketing. Os data marts ajudam as empresas a funcionar com mais eficiência, fornecendo acesso a informações críticas em um data warehouse ou armazenamento de dados operacionais em dias, em vez de meses ou anos.

Um data mart é uma solução econômica para adquirir rapidamente insights significativos, uma vez que contém apenas dados relevantes para um determinado setor de negócios. Data marts dependentes, independentes e híbridos são as três categorias. Eles são classificados de acordo com sua relação com o data warehouse e as fontes de dados utilizadas para construir o sistema.

A partir de um data warehouse corporativo existente, um data mart dependente é formado. É um método de cima para baixo que começa armazenando todos os dados da empresa em um local centralizado e, em seguida, remove uma parte dos dados claramente definida quando necessário para análise. Um data mart independente é um sistema independente que se concentra em um assunto específico ou função de negócios e foi construído sem a ajuda de um data warehouse.

Os dados são recuperados de fontes de dados internas ou externas (ou ambas), processados ​​e, em seguida, depositados no repositório de data mart, onde são mantidos até que sejam necessários para análise de negócios. Um data mart híbrido coleta informações de um data warehouse atual, bem como de outros sistemas de origem operacional.

Principais diferenças entre data warehouse e data marts

  1. Os dados são armazenados em um data warehouse, que é um repositório único e centralizado. Já os data marts são armazenados na área do usuário de forma descentralizada.
  2. Um data warehouse é uma coleção de dados em sua forma mais completa. Um data mart, por outro lado, compreende dados resumidos e escolhidos.
  3. Os dados de um data warehouse são minimamente desnormalizados, mas os dados de um data mart são significativamente desnormalizados.
  4. Um método de cima para baixo é usado para construir um data warehouse. A estratégia ascendente é utilizada para construir um data mart, por outro lado.
  5. A essência de um data warehouse é adaptável, orientado para informações e duradouro. Um data mart, por outro lado, é restrito, orientado a projetos e tem uma vida útil limitada.

Conclusão

Resumindo, um data warehouse é um enorme banco de dados de armazenamento que pode se conectar a quase qualquer fonte de dados. Um data mart, por outro lado, é uma subseção de um data warehouse que tem menos capacidade de armazenamento e é projetado para responder às perguntas dos consumidores de dados sobre um determinado setor de negócios.

Os data warehouses oferecem uma perspectiva corporativa, um sistema de armazenamento único e centralizado, design intrínseco e independência de aplicativo, enquanto os data marts fornecem uma visão do departamento e armazenamento descentralizado. Como os data warehouses são tão grandes e complexos, há uma chance considerável de falha e dificuldades em estabelecê-los.

Por outro lado, o data mart é simples de construir e o risco de falha relacionado é baixo, mas o data mart pode se tornar fragmentado.

Referências

Diferença entre data warehouse e data marts (com tabela)