提取IP
设置代理,进行验证
开始爬取
代理验证采用用户名密码的方式。这种验证很方便,简洁。
代码样例
先把代码贴出来,再一步一步按要求来。大家先copy过去,代码里需要注意以下三项皆为实际在快代理官网获得的参数。
proxy 代理参数
username, password 代理验证的用户名与密码
page_url 默认是快代理验证IP的测试网址,自己也可以改成其他的网址
以下代码为python3所写
"""快代理代理IP使用教程"""
import requests
import random
# 要访问的目标网页
page_url = "http://dev.kdlapi.com/testproxy"
# 代理IP参数,格式IP:端口
proxy = "49.7.96.227:16816"
# 用户名和密码(私密代理分配的)
username = ""
password = ""
# 代理IP的格式
proxies = {
"http": "http://%(user)s:%(pwd)s@%(proxy)s/" % {'user': username, 'pwd': password, 'proxy': proxy},
"https": "https://%(user)s:%(pwd)s@%(proxy)s/" % {'user': username, 'pwd': password, 'proxy': proxy
}}
# 添加header,模拟用户请求
headers = {
"Accept-Encoding": "Gzip", # 使用gzip压缩传输数据让访问更快
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.117 Safari/537.36"
}
# 发送request请求,打印响应code与body内容
r = requests.get(url=page_url, proxies=proxies, headers=headers)
print("response code",r.status_code)
print("response body
收起