web爬虫中怎么用Selenium操作浏览器抓数据

发布时间:2021-12-18 10:48:54 作者:小新
来源:亿速云 阅读:199

小编给大家分享一下web爬虫中怎么用Selenium操作浏览器抓数据,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!

Selenium是一个基于Web的开源自动化工具。Python使用Selenium用于自动化测试。 特点是易于使用。Selenium可以将标准Python命令发送到不同的浏览器,尽管它们的浏览器设计有所不同。

使用Selenium自动打开谷歌浏览器然后访问地址http://econpy.pythonanywhere.com/ex/001.html,并将改页面中的购买者姓名和商品价格抓取下来打印,然后自动关闭浏览器的操作。

分析页面源代码可知 购买者姓名和商品价格的html代码信息如下:

web爬虫中怎么用Selenium操作浏览器抓数据

使用Selenium自动打开谷歌浏览器的时候需要下载谷歌的驱动程序,我的谷歌浏览器版本为74:

web爬虫中怎么用Selenium操作浏览器抓数据

所以我们访问驱动程序下载地址:

https://sites.google.com/a/chromium.org/chromedriver/downloads

进行下载:

web爬虫中怎么用Selenium操作浏览器抓数据

然后我们要使用Selenium 需要进行安装,这里使用pip install selenium。

接下来开始编码部分:

#导入包from selenium import webdriver#打开谷歌浏览器 并访问要抓取数据的地址#注意:驱动chromedriver.exe与改python文件在同一个目录driver = webdriver.Chrome('chromedriver.exe') driver.get("http://econpy.pythonanywhere.com/ex/001.html")# 使用xpath找到购买者和商品价格元素列表buyers = driver.find_elements_by_xpath('//div[@title="buyer-name"]')prices = driver.find_elements_by_xpath('//span[@class="item-price"]')
# 打印所有信息num_page_items = len(buyers)for i in range(num_page_items):    print(buyers[i].text + " : " + prices[i].text)
#完成任务后 关闭浏览器driver.close()

运行结果部分内容为:

Carson Busses : $29.95Earl E. Byrd : $8.37Patty Cakes : $15.26Derri Anne Connecticut : $19.25Moe Dess : $19.25Leda Doggslife : $13.99Dan Druff : $31.57Al Fresco : $8.49。。。。。。

我简单录制了一下运行过程,由于单手操作录制,画面抖动,大家对付观看一下,过程为:运行程序,自动打开谷歌浏览器,访问地址,抓取数据打印,关闭浏览器完成

看完了这篇文章,相信你对“web爬虫中怎么用Selenium操作浏览器抓数据”有了一定的了解,如果想了解更多相关知识,欢迎关注亿速云行业资讯频道,感谢各位的阅读!

推荐阅读:
  1. python利用selenium进行浏览器爬虫
  2. selenium+python中如何使用webdriver操作浏览器

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

web selenium

上一篇:selenium如何打开 IE11浏览器

下一篇:如何进行springboot配置templates直接访问的实现

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》