requests模块使用

发布时间:2020-08-06 18:25:12 作者:Winter
来源:ITPUB博客 阅读:200

安装 requests


# 在命令行工具中使用
pip install requests
# 使用前需要导入
import requests

下面我们来看一下requests库的几种常用高级用法

会话对象

from requests import Session
s = Session()
# 会话拿到
r = s.get('http://www.baidu.com')
print(r)   # <Response [200]>
print(r.cookies)   #  <RequestsCookieJar[<Cookie BDORZ=27315 for .baidu.com/>]>
# 再次发起请求
r = s.get('https://www.csdn.net/')
print(r.text)

我们可以拿到一个名为 r 的 Response 对象,然后在这个对象中获取所有我们想要的信息,大家可以自己执行代码看看输出结果。


import requests
with requests.get('http://httpbin.org/get', stream=True) as r:
    print(r.text)

使用Prepared Request对象

from requests import Request, Session
s = Session()
# 获取Prepared Request对象
req = Request('GET', url,
    data=data,
    headers=header
)
prepped = req.prepare()
# do something with prepped.body
# do something with prepped.headers
resp = s.send(prepped,
    stream=stream,
    verify=verify,
    proxies=proxies,
    cert=cert,
    timeout=timeout
)
print(resp.status_code)

SSL 证书验证

import requests
import urllib3
urllib3.disable_warnings()
# verify默认参数就是true
ret = requests.get('https://github.com', verify=True)
print(ret.status_code)
# 也可以关闭verify, 但是会有警告
ret = requests.get('https://github.com', verify=False)
print(ret.status_code)

流式上传

with open('massive-body', 'rb') as f:
    requests.post('http://some.url/streamed', data=f)
与requests.post("http://httpbin.org/post", files=files)不一样

块编码请求

import requests
url = "http://DOMAIN/media/1.mp4"
# 这里设置stream=true的目的在于不会将内容全部储存在内存中,而是根据chunk_size的大小,去下载内容
ret = requests.get(url, stream=True)
with open('1.mp4', 'wb') as f:
    for block in ret.iter_content(chunk_size=1024):
        f.write(block)

POST 多个分块编码的文件

<input type="file" name="images" multiple="true" required="true"/>

然后把文件设到一个元组的列表中,其中元组结构为 (form_field_name, file_info):


import requests
url = 'http://httpbin.org/post'
multiple_files = [
        #  images是input的name属性
        ('images', ('foo.png', open('foo.png', 'rb'), 'image/png')),
        ('images', ('bar.png', open('bar.png', 'rb'), 'image/png'))]
r = requests.post(url, files=multiple_files)
print(r.text)

设置Proxy代理

import requests
#普通代理
proxies = {
   "http": "http://23.10.1.10:80",
   "https": "https://23.10.1.11:80",
}
# 往请求中设置代理(proxies)
r = requests.get("https://www.baidu.com", proxies=proxies)
print(r.status_code)
# 带有用户名和密码的代理, basic认证
proxies = {
   "http": "http://user:password@227.1.0.1:9999/",
}
r = requests.get("https://www.baidu.com", proxies=proxies)
print(r.status_code)
# 设置socks代理
proxies = {
   'http': 'socks5://127.0.0.1:1080',
   'https': 'socks5://127.0.0.1:1080'
}
r = requests.get("https://www.facebook.com", proxies=proxies)
print(r.status_code)

参考: https://www.9xkd.com/user/plan-view.html?id=3940257785

推荐阅读:
  1. (爬虫预热)01 Requests模块
  2. requests模块的导入

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

requests 使用 模块

上一篇:如何选择动态ip软件

下一篇:视频播放器Elmedia Player for Mac

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》