Estrutura de Arquivos
A compreensão correta dos modelos de arquivos é crucial para a implementação bem-sucedida de um sistema de BI. Esta documentação serve como um guia para compreender e implementar os modelos de arquivos ideais para otimizar as consultas e análises baseadas em NLP.
Para garantir uma implementação bem-sucedida, recomendamos que explore as seguintes seções:
Dicas Gerais: Aqui, destacamos melhores práticas essenciais e nuances comuns a serem consideradas ao preparar seus dados para análise
Arquivos Excel: Familiarize-se com as melhores práticas para estruturar seus arquivos Excel para integração com o Looqbox.
Exemplo de estruturas adequadas de dados: Entenda as estruturas recomendadas para uma implementação eficiente.
Exemplo de estruturas inadequadas de dados: Saiba quais modelos evitar e as razões para fazê-lo.
Ao seguir estas orientações, você estará preparado para uma experiência otimizada em nossa plataforma.
Dicas Gerais
Ao trabalhar com sistemas de BI, especialmente ao preparar seus dados para análise, há algumas melhores práticas a serem consideradas. Estas dicas gerais ajudarão a garantir uma integração eficiente e análises precisas:
Consistência: Mantenha uniformidade nos seus dados. Isso significa que os nomes dos campos e os formatos de dados devem ser consistentes em todos os modelos. Uma abordagem uniforme facilita a integração e a subsequente análise dos dados
Nomes consistentes facilitam a manutenção do Looqbox.
Granularidade: A granularidade dos dados refere-se ao nível de detalhe que os dados representam. Mantenha a granularidade dos dados em mente, pois isso determina diretamente as análises que você pode realizar. Por exemplo, se você deseja analisar vendas diárias, seu modelo precisa ter registros diários.
Quanto mais granular forem os dados inseridos, maior a capacidade de análise do usuário que realizar perguntas.
Ex: Dados de venda diários a nível de "Unidade" que contenham os campos "Cidade" e "Estado" permitem o usuário perguntar por "vendas por estado", e usar a funcionalidade de drilldown para navegar nos diferentes níveis de granularidade, como "venda por cidade" e "venda por unidade".
Atualizações: No mundo dos negócios, as coisas mudam rapidamente. Seus conjuntos de dados não são exceção. Eles podem precisar ser atualizados ou modificados regularmente para refletir as mudanças no cenário de negócios. Por isso, é vital planejar e estruturar seus modelos de maneira que permita atualizações fáceis no futuro, garantindo que os dados existentes não sejam comprometidos.
Sempre que possível, use uma coluna "Data" para categorizar o período das métricas apresentadas em sua tabela, mesmo que os valores sejam iguais para a tabela gerada em um determinado mês.
Isso possibilita que em meses subsequentes novas tabelas com a mesma estrutura sejam usadas para adicionar novos dados ao mesmo conjunto de informações. Leia mais em Adicionar Dados ao Arquivo Existente (Append).
Relações: Ao trabalhar com múltiplas tabelas ou conjuntos de dados, é comum que haja alguma forma de conexão ou relação entre eles. Essas relações são estabelecidas usando campos em comum, geralmente conhecidos como 'IDs'.
Tabelas distintas podem ser conectadas posteriormente ao configurar Respostas. Possibilitanto análises mais completas sobre os seus dados.
Arquivos Excel
O uso de arquivos Excel é comum devido à sua flexibilidade e capacidade de armazenamento de informações. Ao preparar seu arquivo Excel para carregar na nossa plataforma Looqbox, é importante seguir algumas diretrizes essenciais para garantir compatibilidade e eficácia.
Atente às dicas abaixo para garantir compartibilidade entre a sua planilha e o Looqbox.
Imagine o arquivo Excel como uma representação simples de uma tabela de base de dados. A organização deve ser clara, com linhas representando registros e colunas indicando campos ou atributos.
A planilha deve representar apenas uma tabela. Evite combinar múltiplos conjuntos de dados na mesma planilha. Cada conjunto de dados merece sua própria planilha/tabulação.
Gráficos, imagens, ícones e outros componentes visuais podem interferir no processo de carregamento e interpretação de dados. Mantenha sua planilha focada apenas em dados.
Ao preparar seu arquivo Excel para o Looqbox, pense em simplicidade e clareza. Transforme sua planilha em uma representação tabular clara, sem distrações visuais, garantindo um carregamento eficiente e uma análise precisa na nossa plataforma.
Exemplo de estruturas adequadas de dados
Tabela de Vendas
Formalmente conhecido como "Fato venda loja dia", a estrutura abaixo contém informações sobre vendas agregada por dia e por loja.
2023-07-01
1
6404
172
2023-07-02
1
2716
312
2023-07-03
1
7103
137
Coluna "Data" cresce em novas linhas, e pode facilmente ser associado com o vocabulário padrão Datas no looqbox.
Essa coluna é fundamental para filtrar e agrupar dados posteriormente durante consultas (veja mais detalhes em Atributos Temporais).
A tabela apresenta uma coluna ID_Loja, que pode ser usada posteriormente para conectar com uma Tabela Dimensão Loja.
Tabela de Lojas
Formalmente conhecido como "Dimensão loja", a estrutura abaixo contém informações sobre cada uma das lojas, sendo que cada loja é descrita por uma única linha.
1
Soberano
São Paulo
São Paulo
Elisabete Mônica
2
Cheiro Verde
Florianópolis
Santa Catarina
Justina Válter
3
Vendinha
Duque de Caxias
Rio de Janeiro
Maria Rubinho
Há uma linha para cada Loja distinta, com diversas colunas de atributos, que podem ser usados para agrupar ou filtrar dados posteriormente durante consultas (veja mais detalhes em Atributos Atemporais).
A tabela contém chave ID_LOJA, e pode ser usada para complementar o exemplo fato_venda_loja_dia.
"Tabelão de Vendas"
Estrutura de dados geralmente mantida em planilhas de excel, em que os dados de estão em uma única planilha.
Exemplo: Dados de vendas estão junto com os dados de atributos de cada unidade onde a venda foi realizada (como nome da loja, cidade, estado etc).
2023-07-01
PA
Belém
Precinho
420532
1055
2023-07-01
SP
São Paulo
Soberano
23787
630
2023-07-01
AC
Rio Branco
KiPreço
402404
1137
Dados crescem em linhas: Coluna "Data" cresce em novas linhas, e pode facilmente ser associado com o vocabulário padrão Datas no looqbox.
Um bom começo: Esse modelo é ideal para fazer testes rápidos, ou para cenários em que os dados são simples e podem sofrer ajustes manualmente.
Menor Flexibilidade: Mudanças estruturais ou a adição de novos atributos às lojas seriam mais desafiadoras, pois afetariam muitos registros no tabelão.
Redundância de Dados: Detalhes da loja seriam repetidos para cada entrada de venda, levando a um uso ineficiente do armazenamento e potencialmente a inconsistências. Esse problema é resolvido no modelo fato_venda_loja_dia + dimensao_loja.
Manutenção Desafiadora: Atualizar detalhes de uma loja, como o endereço, significaria fazer essa mudança em muitos registros, o que é demorado e arriscado.
Exemplo de estruturas inadequadas de dados
Tabelas com Datas distribuídas em colunas
Esse modelo já é uma visão analítica, e não é adequada para registro de dados. É possível criar esse tipo de visualização como tabela dinâmica/pivotada a partir de uma estrutura de dados normalizada, como descrito em Tabela de Vendas ou Tabelão de Vendas.
Exemplo: Uma tabela que tenta capturar vendas mensais de um produto, onde cada mês é uma coluna.
Precinho
1.000
1.100
1.200
Ponto Certo
2.500
2.250
2.400
Soberano
1.200
2.500
3.100
Esta estrutura é inflexível. Se quisermos adicionar dados para novos meses ou anos, teríamos que adicionar mais colunas. Além disso, realizar consultas para análises temporais, como vendas anuais ou comparações mensais, torna-se muito mais complicado e menos eficiente.
Tabelas sem padrão
Manter um padrão nas tabelas e nas colunas é crucial para garantir que os dados possam ser unificados e analisados corretamente. No entanto, não é incomum encontrarmos tabelas que divergem em termos de nomes e formatos de colunas, principalmente quando são mantidas por múltiplas equipes.
Exemplo: Duas tabelas fornecidas sobre vendas são criadas sem padrão tanto em nome de colunas, como na formatação das colunas.
Tabela Vendas_2023
01/03/2023
L-101
R$ 1.000
02/03/2023
L-102
R$ 1.200
03/03/2023
L-103
R$ 900
Tabela Transações_2023
01/03/2023
101
1.000,00
02/03/2023
102
1.200,00
03/03/2023
103
900,00
Divergência de nome de coluna:
A tabela
Vendas_2023utiliza um prefixo "L-" nolojaID,enquanto a tabelaTransações_2023apresenta o ID da loja sem prefixo.Em uma tabela, a coluna que representa a data da venda é nomeada "Data_venda", enquanto na outra é "dt_venda".
Isso irá ocasionar erros na importação dos dados no Looqbox.
Divergência de formatação de coluna: A tabela Vendas_2023 utiliza o formato de moeda com o símbolo "R$ ", enquanto a tabela Transações_2023 apresenta a formatação da moeda com vírgula para os centavos.
Isso irá ocasionar erros na importação dos dados no Looqbox.
Last updated
Was this helpful?