Skip to content

Latest commit

 

History

History
15 lines (14 loc) · 865 Bytes

README.md

File metadata and controls

15 lines (14 loc) · 865 Bytes

utilTools

开发、整理常用工具模块

一、获取可用的代理IP列表(proxyutil.py)

进行爬虫操作时,使用代理IP可以规避反爬首手段

1、从代理IP网站获取代理ip列表
2、过滤代理IP:用代理IP访问IP138网站,判断当前代理IP是否生效,5秒内连接成功的认为有效,其他无效
3、将可用的代理IP保存到列表中返回
4、进行其他爬虫操作时,可以使用列表中的代理IP

使用方法:

(n为从多少页代理ip中进行筛选,是一个int型数字,iptype代表想要获取的代理IP类型,支持HTTP和HTTPS):
proxyutil=Proxyutil(n,iptype="HTTPS")
available_ip=proxyutil.get_available_iplist()

返回的列表格式如:

[('115.46.97.161', '8123', '高匿', 'HTTP'),('106.56.102.161', '8070', '高匿', 'HTTP')]