配置 BeautifulSoup

发布时间:2020-07-20 00:33:13 作者:菜鸟的征程
来源:网络 阅读:365

首先,安装Beautifulsoup

    pip  install  beautifulsoup4


然后初始化对象

    from  bs4  import  BeautifulSoup

    file = BeautifulSoup(open("index.html"))     #此处传入文件,红色部分为要传入的页面源码文件

    string = BeautifulSoup("<html>data</html>")  #此处红色部分传入一个字符串


可以通过 .标签名 向下深入, 如 : file.p.a.span


遍历:

    html 文件有标签,字符串等组成,遍历时可以同级遍历,也可以跨级遍历。

    同级遍历: .previous_sibling  

               .next_sibling


    跨级遍历:

               向父级遍历:

                    .parent

               向子级遍历:   

                    .contents   #以列表形式遍历,通过一个列表将结果展示出来

                    .children   #以生成器形式遍历,比较节省内存

    

推荐阅读:
  1. Python爬虫中BeautifulSoup库剖析
  2. 基于pycharm的beautifulsoup4库怎么用

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

import parent contents

上一篇:【分布式协调zookeeper】基础篇

下一篇:查看Linux内核版本和系统版本信息

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》