“Coragem nem sempre ruge. Às vezes, a coragem é a voz calma no final do dia, sussurrando: 'Tentarei novamente amanhã'. ”Mary Anne Radmacher
Nosso objetivo é construir um modelo de Machine Learning que seja capaz de fazer previsões sobre a taxa média de ocupação de casas na região de Boston, EUA, por proprietários. A variável a ser prevista é um valor numérico que representa a mediana da taxa de ocupação das casas em Boston. Para cada casa temos diversas variáveis explanatórias.
Dicionário de dados:
- CRIM: per capita crime rate by town
- ZN: proportion of residential land zoned for lots over 25,000 sq.ft.
- INDUS: proportion of non-retail business acres per town
- CHAS: Charles River dummy variable (= 1 if tract bounds river; 0 otherwise)
- NOX: nitric oxides concentration (parts per 10 million)
- RM: average number of rooms per dwelling
- AGE: proportion of owner-occupied units built prior to 1940
- DIS: weighted distances to five Boston employment centres
- RAD: index of accessibility to radial highways
- TAX: full-value property-tax rate per 10,000
- PTRATIO: pupil-teacher ratio by town
- B: 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town
- LSTAT: % lower status of the population
- TARGET: Median value of owner-occupied homes in $1000's
Na entrega da sua análise responda:
Coeficientes Angular do modelo Coeficiente Linear do modelo Grafico dos pontos de dados com o modelo Grafico dos resíduos dos dados observados vs. dados previstos pelo modelo
Python e Pacotes para análise de dados.
Código limpo e comentado sāo requisitos do desafio.
Copie a URL do repositório com o desafio e envie pela plataforma: https://platform.apollopartners.com.br/
Acesse o FAQ ou abra uma issue nesse repositório que retornamos em breve.
Esse projeto está sob a licença MIT. Veja o arquivo LICENSE para mais detalhes.