python爬虫中伪装浏览器的方法

发布时间:2020-11-24 09:26:11 作者:小新
来源:亿速云 阅读:343

小编给大家分享一下python爬虫中伪装浏览器的方法,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

实现伪装浏览器须知:

我们如果想去获取某些内容,得先让自己和他们处于同类,这样才不会被攻击,才可以跟对手网站和平相处,接收到他们的信息。引入ProxyHandler组件,访问需要通过build_opener调用handler来实现。

实现代码如下:

from urllib.request import Request, build_opener
from fake_useragent import UserAgent
from urllib.request import ProxyHandler
url = "http://httpbin.org/get"
headers={
 "User-Agent": UserAgent().chrome
}
request = Request(url, headers=headers)
handler = ProxyHandler({"http" : "112.85.129.8:9999"})
opener = build_opener(handler)
response = opener.open(request)
print(response.read().decode())

测试结果

先运行程序看看目前没有用代理的时候IP的信息

python爬虫中伪装浏览器的方法

再看看利用了proxy之后产生的结果

python爬虫中伪装浏览器的方法

以上是“python爬虫中伪装浏览器的方法”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!

推荐阅读:
  1. Python反爬虫伪装浏览器进行爬虫
  2. 检测python爬虫时是否代理ip伪装成功的方法

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

python python爬虫 浏览器

上一篇:构建header在python爬虫中出错的解决方法

下一篇:python爬虫中如何处理弹出框问题

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》