Python如何爬取微信读书实现读书免费自由

发布时间:2021-09-27 13:35:42 作者:小新
来源:亿速云 阅读:1684

这篇文章主要介绍了Python如何爬取微信读书实现读书免费自由,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

前情提要

不知道用微信读书的朋友多不多,这里顺便安利一下哈。

Python如何爬取微信读书实现读书免费自由

我目前看电子书的话基本都是在用微信读书,毕竟无限卡真香。

在微信读书上,不仅很多正版的Python书籍电子书可以直接看,还可以在阅读的同时看别人写的标注。

但是无限卡对于小说不太友好,只能阅读开头的章节,后面的章节就需要变相付费了。

Python如何爬取微信读书实现读书免费自由

虽然知道番茄小说,七猫小说这种都能免费看,但是实在不愿意为了一部小说再多下一个软件。

幸亏微信读书出了一个功能——可以自己上传书籍,支持支持txt、pdf、epub格式。

Python如何爬取微信读书实现读书免费自由

这就给了我一个想法,只需要将小说下载到本地,再导入到微信读书不就成了。

下载小说方法贼简单,用Python也行,搜搜专门打包好的下载器也成。不过我记得两年前刚学Python时自己练习写过笔趣阁的爬虫,这就翻出来用用。

爬取小说

原来代码是找到了,但是很尴尬,我爬取的那个网站404了。

不过目前笔趣阁遍地都是,也分不清到底谁是“正版”的?

Python如何爬取微信读书实现读书免费自由

还有个比较好的消息,很多家连网页模板都是一模一样,你的爬虫改改地址就能接着用了,这是妙啊。

于是乎,我又随便找了一家“笔趣阁”。

Python如何爬取微信读书实现读书免费自由

今天我们就以我吃西红柿近期完结的沧元图为例,可以看到在这个笔趣阁网站里,小说沧元图的网址url是

https://*********/html/2292/

Python如何爬取微信读书实现读书免费自由

同时,《沧元图》所有的章节也都罗列在本页面。

我觉得先爬取所有的章节名和对应的url网址,分别保存到列表中。然后再使用requests爬取,并依次写入txt文档中。

Python如何爬取微信读书实现读书免费自由

网页结构并不复杂,也没有反爬措施。大概20行代码即可下载

for i, j in zip(urls, names):
    res_text = requests.get(url, headers=header).text
    zj_html = etree.HTML(res_text)
    texts = zj_html.xpath('//*[@id="content"]/text()')
    texts2 = zj_html.xpath('//*[@id="content"]/*/text()')
    text = '\n'.join(texts).strip()+'\n'.join(texts2).strip()

    with open('novels_n.txt', 'a', encoding='utf8') as f:
        f.write(f'{j} \n {text} \n')
        print(f'{novels_n}/{j},正在下载...')

Python如何爬取微信读书实现读书免费自由

这样我们就爬取了小说《沧元图》,并将它保存成txt文档。

通过\n使得章节名都与正文分割开。

Python如何爬取微信读书实现读书免费自由

白嫖小说

下面的步骤就更简单了,只需要在微信读书的网页版中,点击【传书到手机】,上传刚刚爬取生成的《沧元图》。

Python如何爬取微信读书实现读书免费自由

导入成功。

Python如何爬取微信读书实现读书免费自由

单击【立即阅读】,享受一下劳动成果。

整体段落和文字都没什么问题。

Python如何爬取微信读书实现读书免费自由

再看一下章节目录,也是按照正常的目录进行排版的。

非常完美!

Python如何爬取微信读书实现读书免费自由

感谢你能够认真阅读完这篇文章,希望小编分享的“Python如何爬取微信读书实现读书免费自由”这篇文章对大家有帮助,同时也希望大家多多支持亿速云,关注亿速云行业资讯频道,更多相关知识等着你来学习!

推荐阅读:
  1. 数据库基本概念(读书笔记)--python
  2. 【读书自己】AWR相关设置

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

python

上一篇:如何理解Etsy

下一篇:怎么用C语言玩转结构体

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》