Este repositório reúne todos os materiais e códigos do Bootcamp em Ciência de Dados do Atlântico Avanti, incluindo as atividades e o projeto individual feitos durante o curso. Ele serve como um recurso útil para revisar os conceitos e práticas aprendidos.
O conjunto de dados Titanic foi retirado da plataforma Kaggle, embora também esteja disponível em outras fontes. Amplamente utilizado para análises e projetos de aprendizado de máquina, ele fornece informações detalhadas sobre os passageiros do RMS Titanic, que afundou em 15 de abril de 1912 após colidir com um iceberg, resultando na perda de muitas vidas. O dataset inclui dados sobre embarque e sobrevivência dos passageiros, permitindo realizar análises e previsões sobre o evento. A variável principal é "Survived" e as variáveis usadas para prever são: Pclass, Sex, Age, SibSp, Parch, Fare, Embarked, Class, Who, Adult_male, Deck, Embark_town, Alive e Alone.
- Coleta do Conjunto de Dados
- Criação do Dicionário de Dados
- Análise Exploratória
- Análise Comparativa de Modelos
- Limpeza de dados
- Transformação de Dados
- Modelagem Preditiva
.
├── data/ # Diretório contendo todos os arquivos de dados
│ ├── external/ # Arquivos de dados de fontes externas
│ ├── interim/ # Arquivos de dados intermediários
│ ├── processed/ # Arquivos de dados processados
│ └── raw/ # Arquivos de dados originais, imutáveis
├── docs/ # Documentação gerada através da biblioteca mkdocs
├── models/ # Modelos treinados e serializados, predições ou resumos de modelos
├── notebooks/ # Diretório contendo todos os notebooks utilizados nos passos
├── references/ # Dicionários de dados, manuais e todo o material exploratório
├── src/ # Código fonte utilizado nesse projeto
│ ├── data/ # Classes e funções utilizadas para download e processamento de dados
│ ├── deployment/ # Classes e funções utilizadas para implantação do modelo
│ └── model/ # Classes e funções utilizadas para modelagem
├── app.py # Arquivo com o código da aplicação do streamlit
├── Procfile # Arquivo de configuração do heroku
├── pyproject.toml # Arquivo de dependências para reprodução do projeto
├── poetry.lock # Arquivo com sub-dependências do projeto principal
├── README.md # Informações gerais do projeto
└── tasks.py # Arquivo com funções para criação de tarefas utilizadas pelo invoke