Estrutura de Arquivos

A compreensão correta dos modelos de arquivos é crucial para a implementação bem-sucedida de um sistema de BI. Esta documentação serve como um guia para compreender e implementar os modelos de arquivos ideais para otimizar as consultas e análises baseadas em NLP.

Para garantir uma implementação bem-sucedida, recomendamos que explore as seguintes seções:

Ao seguir estas orientações, você estará preparado para uma experiência otimizada em nossa plataforma.

Dicas Gerais

Ao trabalhar com sistemas de BI, especialmente ao preparar seus dados para análise, há algumas melhores práticas a serem consideradas. Estas dicas gerais ajudarão a garantir uma integração eficiente e análises precisas:

  1. Consistência: Mantenha uniformidade nos seus dados. Isso significa que os nomes dos campos e os formatos de dados devem ser consistentes em todos os modelos. Uma abordagem uniforme facilita a integração e a subsequente análise dos dados

  1. Granularidade: A granularidade dos dados refere-se ao nível de detalhe que os dados representam. Mantenha a granularidade dos dados em mente, pois isso determina diretamente as análises que você pode realizar. Por exemplo, se você deseja analisar vendas diárias, seu modelo precisa ter registros diários.

  1. Atualizações: No mundo dos negócios, as coisas mudam rapidamente. Seus conjuntos de dados não são exceção. Eles podem precisar ser atualizados ou modificados regularmente para refletir as mudanças no cenário de negócios. Por isso, é vital planejar e estruturar seus modelos de maneira que permita atualizações fáceis no futuro, garantindo que os dados existentes não sejam comprometidos.

  1. Relações: Ao trabalhar com múltiplas tabelas ou conjuntos de dados, é comum que haja alguma forma de conexão ou relação entre eles. Essas relações são estabelecidas usando campos em comum, geralmente conhecidos como 'IDs'.

Arquivos Excel

O uso de arquivos Excel é comum devido à sua flexibilidade e capacidade de armazenamento de informações. Ao preparar seu arquivo Excel para carregar na nossa plataforma Looqbox, é importante seguir algumas diretrizes essenciais para garantir compatibilidade e eficácia.

Atente às dicas abaixo para garantir compartibilidade entre a sua planilha e o Looqbox.

Apenas a primeira aba do seu arquivo será usada. Isso simplifica o processo de leitura e carregamento na plataforma. Se você tiver múltiplas abas com dados diferentes, considere criar arquivos separados para cada um.

Ao preparar seu arquivo Excel para o Looqbox, pense em simplicidade e clareza. Transforme sua planilha em uma representação tabular clara, sem distrações visuais, garantindo um carregamento eficiente e uma análise precisa na nossa plataforma.


Exemplo de estruturas adequadas de dados

Tabela de Vendas

Formalmente conhecido como "Fato venda loja dia", a estrutura abaixo contém informações sobre vendas agregada por dia e por loja.

Data
ID_Loja
Venda
Tickets

2023-07-01

1

6404

172

2023-07-02

1

2716

312

2023-07-03

1

7103

137

Exemplo de arquivo para teste - Dados de vendas por loja por dia, tabela fato.

Tabela de Lojas

Formalmente conhecido como "Dimensão loja", a estrutura abaixo contém informações sobre cada uma das lojas, sendo que cada loja é descrita por uma única linha.

ID_Loja
Loja
Cidade
Estado
Gerente

1

Soberano

São Paulo

São Paulo

Elisabete Mônica

2

Cheiro Verde

Florianópolis

Santa Catarina

Justina Válter

3

Vendinha

Duque de Caxias

Rio de Janeiro

Maria Rubinho

Exemplo de arquivo para teste - Dados lojas, tabela dimensão.

"Tabelão de Vendas"

Estrutura de dados geralmente mantida em planilhas de excel, em que os dados de estão em uma única planilha.

Exemplo: Dados de vendas estão junto com os dados de atributos de cada unidade onde a venda foi realizada (como nome da loja, cidade, estado etc).

Data
Estado
Cidade
Loja
Venda
Tickets

2023-07-01

PA

Belém

Precinho

420532

1055

2023-07-01

SP

São Paulo

Soberano

23787

630

2023-07-01

AC

Rio Branco

KiPreço

402404

1137

Exemplo de arquivo para teste - Dados de vendas por loja por dia, "tabelão".

Exemplo de estruturas inadequadas de dados

Tabelas com Datas distribuídas em colunas

Esse modelo já é uma visão analítica, e não é adequada para registro de dados. É possível criar esse tipo de visualização como tabela dinâmica/pivotada a partir de uma estrutura de dados normalizada, como descrito em Tabela de Vendas ou Tabelão de Vendas.

Exemplo: Uma tabela que tenta capturar vendas mensais de um produto, onde cada mês é uma coluna.

Loja
Janeiro
Fevereiro
Março
...

Precinho

1.000

1.100

1.200

Ponto Certo

2.500

2.250

2.400

Soberano

1.200

2.500

3.100

Datas devem estar em uma coluna "Data", e os valores devem crescer em linhas, não em colunas

Tabelas sem padrão

Manter um padrão nas tabelas e nas colunas é crucial para garantir que os dados possam ser unificados e analisados corretamente. No entanto, não é incomum encontrarmos tabelas que divergem em termos de nomes e formatos de colunas, principalmente quando são mantidas por múltiplas equipes.

Exemplo: Duas tabelas fornecidas sobre vendas são criadas sem padrão tanto em nome de colunas, como na formatação das colunas.

Tabela Vendas_2023

Data_venda
lojaID
Valor_vendido

01/03/2023

L-101

R$ 1.000

02/03/2023

L-102

R$ 1.200

03/03/2023

L-103

R$ 900

Tabela Transações_2023

dt_venda
IDloja
Venda_Total

01/03/2023

101

1.000,00

02/03/2023

102

1.200,00

03/03/2023

103

900,00

Padronização é chave: Ao tentar unificar dados por meio do upload no Looqbox, a ausência de um padrão pode causar incompatibilidades, gerar duplicidades ou mesmo impedir a importação dos dados.

Last updated

Was this helpful?