______ ______ _
| ___ \_ | ___ \ | |
| |_/ / \__ __ __ _ __ _ | |_/ /___ ___ | |
| __/| _// _ \ \ \/ /| | | || __// _ \ / _ \ | |
| | | | | (_) | > < \ |_| || | | (_) | (_) || |___
\_| |_| \___/ /_/\_\ \__ |\_| \___/ \___/ \_____\
__ / /
/___ /
介绍文档
下载安装
- 下载源码:
git clone git@github.com:jhao104/proxy_pool.git
或者直接到https://github.com/jhao104/proxy_pool 下载zip文件
- 安装依赖:
cd proxy_pool
pip install -r requirements.txt
- 配置Config.ini:
# Config.ini 为项目配置文件
# 配置DB
type = SSDB # 如果使用SSDB或redis数据库,均配置为SSDB
host = localhost # db host
port = 8888 # db port
name = proxy # 默认配置
# 配置 ProxyGetter
freeProxyFirst = 1 # 这里是启动的抓取函数,可在ProxyGetter/getFreeProxy.py 扩展
freeProxySecond = 1
....
# 配置 HOST (api服务)
ip = 127.0.0.1 # 监听ip,0.0.0.0开启外网访问
port = 5010 # 监听端口
# 上面配置启动后,代理api地址为 http://127.0.0.1:5010
- 启动:
# 如果你的依赖已经安装完成并且具备运行条件,可以直接在Run下运行main.py
# 到Run目录下:
>>>python main.py
# 如果运行成功你应该看到有4个main.py进程
# 你也可以分别运行他们,
# 依次到Api下启动ProxyApi.py,Schedule下启动ProxyRefreshSchedule.py和ProxyValidSchedule.py即可.
使用
启动过几分钟后就能看到抓取到的代理IP,你可以直接到数据库中查看,推荐一个SSDB可视化工具。
也可以通过api访问http://127.0.0.1:5010 查看.
from https://github.com/jhao104/proxy_pool
No comments:
Post a Comment