Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Análise exploratória de dados #2

Open
5 tasks done
omadson opened this issue Jul 19, 2024 · 1 comment
Open
5 tasks done

Análise exploratória de dados #2

omadson opened this issue Jul 19, 2024 · 1 comment

Comments

@omadson
Copy link
Member

omadson commented Jul 19, 2024

A equipe deve entregar e apresentar uma análise exploratória dos dados (exploratory data analysis, EDA). Nesse ponto, o projeto terá finalizado a fase de entendimento dos dados na metodologia CRISP-DM. Desse modo, os pontos a serem observados na execução são:

  • Proposta do projeto: a equipe deve compreender completamente, de uma perspectiva de negócios, o que realmente deve ser feito no projeto, em seguida, modificar o arquivo README.md, contendo um resumo do projeto que será construído. Tente apresentar uma justificativa para o projeto. É desejável que também se insira um graphical abstract.
  • Coleta inicial de dados: a equipe deve apresentar um conjunto de dados "cru", no repositório do projeto, salvo na pasta data/raw/.
  • Criação do dicionário de dados: a equipe deve criar um arquivo (ou vários) de dicionário de dados, contendo informações referentes aos conjuntos de dados utilizados no projeto. Serão arquivos no formato CSV, que devem ser guardados na pasta data/external/;
  • Exploração de dados: a equipe deve criar um notebook de análise exploratória notebooks/01-exploratory_data_analysis.ipynb, contendo as seguintes seções de texto: Descrição dos dados, Perguntas de partida e hipóteses, Insights, de acordo com o conteúdo visto em aula;
  • Apresentação de resultados: a equipe deve produzir uma apresentação de slides de no máximo 5min para ser apresentada ao professor e o restante da turma.
KesavaS2 added a commit that referenced this issue Aug 3, 2024
@omadson
Copy link
Member Author

omadson commented Aug 5, 2024

Proposta do projeto (README.md)

  • Resumo do projeto
  • Nome do projeto
  • Nome dos colaboradores
  • Resumo gráfico
  • Logomarca
  • Adicionou outras informações

Coleta inicial de dados e criação do dicionário de dados

  • Adicionou o conjunto de dados na pasta data/raw/?
  • Criou e salvou o dicionário de dados na pasta data/external/?

Exploração de dados

Pontos positivos

  • Escreveu uma descrição dos dados?
  • Falou sobre dados faltantes?
  • Escreveu perguntas e partidas de hipóteses?
  • Utilizou mais que 3 tipos de gráficos?
  • Escreveu um sumário dos insights no final?
  • Criou gráficos que não foram vistos em aula?
  • Fez análise univariada?
  • Fez análise bivariada?
  • Fez análise multivariada?

Pontos negativos

  • Usou canal de cor sem necessidade?
  • Utilizou rótulos inclinados?
  • Utilizou gráfico de dispersão quando deveria ter utilizado gráfico de boxplot?
  • Não ordenou gráficos de barra quando deveria?

Comentários

  • Gente, gostei bastante da análise de vocês, realmente fizeram tudo que deveriam e não cometeram erros.
  • Gostei que utilizaram visualizações que não vimos em sala, como a para mostrar dados faltantes e as para mostrar correlação através de um gráfico de regressão.
  • Gostei também que, aparentemente, seguiram a paleta de cores do início ao fim.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant