Skip to content

Latest commit

 

History

History
19 lines (16 loc) · 936 Bytes

README.md

File metadata and controls

19 lines (16 loc) · 936 Bytes

DATA SCIENCE APLICADA PARA CLASSIFCAÇÃO DE POTABILIDADE DA ÁGUA

Segue em anexo um resumo do projeto no Youtube: AQUI

PRIMEIRO NOTEBOOK: analise_de_dados_water.ipynb

  • Análise bruta do dataset utilizado
  • Exploração de dados univariados (medidas de localidada, espalhamento, distribuição, gráficos, etc...)
  • Exploração de dados multivariados (matriz de covariância, de correlação, scatter plot)

SEGUNDO NOTEBOOK: storyTelling_water.ipynb

  • Story Telling da análise de dados feita
  • Explicação dos detalhes, mostrando o resultado da análise
  • Organização dos resultados da análise

TERCEIRO NOTEBOOK: modelsWater_water.ipynb

  • Pré-processamento e tratamento do dataset
  • Treinamento de 4 modelos de Machine Learning com GridSearch
  • Validação dos modelos
  • Feature importance dos modelos
  • Comparação de desempenho entre cada modelo treinado