Minicurso reallizado durante a Semana de Tecnologia 2017 na Fatec Jundiaí
Nós participamos do curso Hackeando Dados Públicos usando Python com o Fernando Masanori, onde aprendemos técnicas muuuito legais e decidimos levar o nosso aprendizado para a Semana de Tecnologia da Fatec. Os exemplos utilizados continuarão disponíveis aqui.
A raspagem de dados (data scraping) é uma técnica computacional de coleta automatizada de dados. Durante o curso focaremos no web scraping, cuja finalidade consiste em extrair dados que podem ser visualizados em um navegador web.
-
Instalação do Python 3
-
Instalação das bibliotecas. A partir do terminal de comando execute:
pip install beautifulsoup4 requests numpy scipy matplotlib
❗ Estas recomendações são necessárias para quem optar por levar o próprio notebook. Pediremos ao Nathan pra deixar os computadores do laboratório já preparados no dia! 🎊
🔸 Para os scripts que usaremos durante o minicurso, a instalação do beautifulsoup4
é suficiente. numpy
, scipy
e matplotlib
serão utilizadas apenas em exemplos mais avançados que envolvem visualização de dados e não serão abordados durante a apresentação devido ao tempo.
Para garantir que a instalação foi realizada com sucesso, abra o console Python, faça a importação da biblioteca e chame pela classe BeautifulSoup
:
>>> from bs4 import BeautifulSoup
>>> BeautifulSoup
<class 'bs4.BeautifulSoup'>
- Ana Carolina Lopes (@anacls)
- Jennifer Martins (@jeemartins)
- Lidiane Taquehara (@lidimayra)
- Mikaeri Ohana (@miohana)