开发、整理常用工具模块
1、从代理IP网站获取代理ip列表
2、过滤代理IP:用代理IP访问IP138网站,判断当前代理IP是否生效,5秒内连接成功的认为有效,其他无效
3、将可用的代理IP保存到列表中返回
4、进行其他爬虫操作时,可以使用列表中的代理IP
(n为从多少页代理ip中进行筛选,是一个int型数字,iptype代表想要获取的代理IP类型,支持HTTP和HTTPS):
proxyutil=Proxyutil(n,iptype="HTTPS")
available_ip=proxyutil.get_available_iplist()
[('115.46.97.161', '8123', '高匿', 'HTTP'),('106.56.102.161', '8070', '高匿', 'HTTP')]