- Practicar el uso de APIs y peticiones HTTP.
- Automatizar procesos de exploración y limpieza usando
for loops
. - Proteger nuestro código contra errores usando
try except
.
- Haber realizado previamente la primer fase de limpieza de tu dataset
En este Postwork vamos a dejar descansar un poquito nuestro dataset. La única manera de entender a la perfección cómo utilizar APIs es usándolas. Y eso es lo que vamos a hacer. Vamos a elegir un API y construir un nuevo dataset utilizando peticiones HTTP y concatenaciones. Puede que sea un API que complemente tu dataset original (eso sería lo mejor de lo mejor), o puede simplemente que sea un API que ofrezca información que te parezca interesante. Los pasos a seguir son estos:
- Encuentra un API que quieras explorar. Puedes encontrar una lista enorme de APIs gratuitas aquí.
- Crea una cuenta si es necesario.
- Lee la documentación.
- Realiza algunas peticiones de prueba para entender la estructura de los datos (si quieres explorar un poco, puedes intentar haacer peticiones usando este software).
- Automatiza el proceso de realizar peticiones para obtener un dataset considerablemente grande.
- Explora y limpia tu dataset.
- Si has encontrado un dataset que complementa la información de tu dataset original (el que has estado trabajando durante todas las sesiones), ve si puedes unirlos en un solo
DataFrame
que incluya la información útil de ambos.
Extra: Puedes también explorar la posibilidad de automatizar algunos de los procesos de limpieza que has realizado con tu dataset. Si encuentras dónde podría ser útil y te animas a hacerlo, recuerda proteger tu código con estructuras
try except
para que la automatización no falle.