python3.7脚本---爬取网页图片

发布时间:2020-07-26 20:21:41 作者:头发太长l
来源:网络 阅读:1047
#!/usr/bin/python

import re
import urllib
import urllib.request   #python3中urlopen、urlritrieve都在request库里面了,所以要导入此库

def htmlGet(url):
        page = urllib.request.urlopen(url)
        html = page.read()
        return html

def imgGet(html):
        res = r'src="(https.*?\.jpg)"'
        imgre = re.compile(res)
        imglist = re.findall(imgre,html.decode("utf-8")) #html不加后面的会报错typeerror,因为编码格式的变化,这里需要指定一下
        x = 0
        for i in imglist:
                urllib.request.urlretrieve(i,"%s.jpg" % x)
                x+=1

html = htmlGet("http://***")
imgGet(html)
推荐阅读:
  1. python如何爬取图片
  2. 怎么利用Python爬取网页内容

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

linux python --

上一篇:MapReduce编写wordcount程序代码实现

下一篇:ThinkPHP学习笔记(五)模块化设计

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》