Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Modelagem de dados Instagram #5

Open
Amandlsp opened this issue Aug 28, 2024 · 13 comments
Open

Modelagem de dados Instagram #5

Amandlsp opened this issue Aug 28, 2024 · 13 comments
Assignees

Comments

@Amandlsp
Copy link

Amandlsp commented Aug 28, 2024

Precisamos definir qual modelagem de dados usaremos para os dados do Instagram!

  • Mapear todas as tabelas que serão usadas
  • Fazer um desenho estrutural e relacional

Recomendo o uso de ferrramentas como o Draw.io e o Excalidraw para facilitar! Leia tbm tópicos sobre modelagem de dados!

@Amandlsp Amandlsp transferred this issue from SouJunior/Ilimidados-Dashboards Oct 2, 2024
@Amandlsp Amandlsp changed the title Modelagem de dados Modelagem de dados Instagram Oct 4, 2024
@G1chesss
Copy link

G1chesss commented Oct 6, 2024

INFO_Intagram.pdf

Importei o PDF do que foi pedido depois da um toque pra ver se é isso? se nao conseguir abrir, deixei no drive no Raw_conteudo_instagram

@Amandlsp
Copy link
Author

Amandlsp commented Oct 8, 2024

@G1chesss boa tarde! Isso no pdf não é modelagem de dados! Vamos marcar uma horário para que a possa fazer juntos. Preciso que vc tenha um conhecimento detalhado do que tem nas planilhas e quais são as nossas planilhas de interesse que contenham os dados que vão responder as perguntas do pessoal de BI.

@G1chesss
Copy link

@Amandlsp só escrevi modelagem de dados que é o nome que esta nesse assunto entendeu, sei que isso nao é modelagem, fiz a cronograma do jeito que me falou. (depois podemos marcar uma reuniao pra entender melhor)
Mas vou começar essa semana fazer o catalogo talvez desmembre melhor as coisas.

@Amandlsp
Copy link
Author

@G1chesss sem problemas! Vamos só deixar cada coisa em seu lugar, para não ficar confuso e a gente conseguir seguir o fluxo! Vou voltar essa task para desenvolvimento e acredito que na apresentação sobre modelagem de dados vá ficar mais claro pra vcs!

@Amandlsp
Copy link
Author

Métricas principais:

  • Engajamento
  • Número de seguidores
  • Novas Visitas
  • Churn

@Amandlsp
Copy link
Author

@Moscarde Moscarde assigned Moscarde and unassigned G1chesss Nov 7, 2024
@Moscarde
Copy link

Fiz um rascunho da modelagem dos dados do instagram.
Deixei algumas anotações para revisão.
Inseri apenas tabelas que possam ser relevantes.

Pode ser acessado por esse link:
https://drive.google.com/file/d/1d4LjNgbfg1BDBbsNU9rNoXs7A8ORgEO7/view?usp=sharing

@Amandlsp
Copy link
Author

@Moscarde estou sem acesso se puder liberar para mim, por favor!

@Moscarde
Copy link

Não sabia que o acesso ficava pendente, mas já liberei.

@Amandlsp
Copy link
Author

@Moscarde Boa! É basicamente aquilo lá msm, agora só temos que ver como elas vão se relacionar para gerar valor!!

@Moscarde
Copy link

Moscarde commented Nov 28, 2024

Atualizações no Modelo

1. Adição da coluna extraction_date

  • Coluna extraction_date adicionada em tabelas onde faz sentido registrar a data de extração.

2. Inclusão de restrição de unicidade

  • Adicionada a característica UNIQUE em colunas cujos valores devem ser únicos, garantindo integridade nos dados.

@Moscarde
Copy link

Novas Atualizações

1. Mudança na nomenclatura das tabelas

  • Seguindo o modelo sugerido pelo head, adotamos um padrão para garantir maior organização.
  • Padrão de nomenclatura: {produto}_{nome do arquivo}_{nome da tabela}_{camada}
    • Exemplo: linkedin_seguidores_localidade_raw

2. Inclusão de coluna ID nas tabelas

  • Adicionada uma coluna ID com as propriedades AUTOINCREMENT e PRIMARY KEY em todas as tabelas que não possuíam identificadores únicos próprios.

@Moscarde
Copy link

Moscarde commented Dec 11, 2024

Novas Atualizações

1. Remoção da tabela instagram_audience_top_pages_raw

  • Extrair e distinguir os arquivos de Público(Filtrado) demandam uma complexidade maior tanto na etapa de extração quanto na de transformação e seu conteúdo tem pouco valor no momento.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
Archived in project
Status: Validação Senior
Development

No branches or pull requests

3 participants