“Seja sempre você mesmo, expresse-se, tenha fé em si mesmo. Não saia, procure uma personalidade de sucesso e a duplique.”Bruce Lee
Nosso objetivo é construir um modelo de Machine Learning que seja capaz de fazer previsões sobre a taxa média de ocupação de casas na região de Boston, EUA, por proprietários. A variável a ser prevista é um valor numérico que representa a mediana da taxa de ocupação das casas em Boston. Para cada casa temos diversas variáveis explanatórias. Sendo assim, podemos resolver este problema empregando Regressão Linear Simples ou Múltipla.
Dicionário de dados:
- CRIM: per capita crime rate by town
- ZN: proportion of residential land zoned for lots over 25,000 sq.ft.
- INDUS: proportion of non-retail business acres per town
- CHAS: Charles River dummy variable (= 1 if tract bounds river; 0 otherwise)
- NOX: nitric oxides concentration (parts per 10 million)
- RM: average number of rooms per dwelling
- AGE: proportion of owner-occupied units built prior to 1940
- DIS: weighted distances to five Boston employment centres
- RAD: index of accessibility to radial highways
- TAX: full-value property-tax rate per 10,000
- PTRATIO: pupil-teacher ratio by town
- B: 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town
- LSTAT: % lower status of the population
- TARGET: Median value of owner-occupied homes in $1000's
Na entrega da sua análise responda:
Coeficiente Angular do modelo Coeficiente Linear do modelo Grafico dos pontos de dados com o modelo Grafico dos resíduos dos dados observados vs. dados previstos pelo modelo
Python e Pacotes para análise de dados.
Código limpo e comentado sāo requisitos do desafio.
Copie a URL do repositório com o desafio e envie pela plataforma: https://platform.apollopartners.com.br/
Acesse o FAQ ou abra uma issue nesse repositório que retornamos em breve.
Esse projeto está sob a licença MIT. Veja o arquivo LICENSE para mais detalhes.