python爬虫怎么用scrapy获取影片

发布时间：2020-11-24 09:47:56 作者：小新
来源：亿速云阅读：185

这篇文章给大家分享的是有关python爬虫怎么用scrapy获取影片的内容。小编觉得挺实用的，因此分享给大家做个参考。一起跟随小编过来看看吧。

1. 创建项目

运行命令:

scrapy startproject myfrist（your_project_name）

python爬虫怎么用scrapy获取影片

注意：一般创建爬虫文件时，以网站域名命名

2 编写 spdier

在spiders目录中新建 daidu_spider.py 文件

2.1 注意

爬虫文件需要定义一个类，并继承scrapy.spiders.Spider

必须定义name，即爬虫名，如果没有name，会报错。因为源码中是这样定义的

2.2 编写内容

在这里可以告诉 scrapy 。要如何查找确切数据，这里必须要定义一些属性

name: 它定义了蜘蛛的唯一名称

allowed_domains: 它包含了蜘蛛抓取的基本URL；

start-urls: 蜘蛛开始爬行的URL列表；

parse(): 这是提取并解析刮下数据的方法；

下面的代码演示了蜘蛛代码的样子：

import scrapy
 
 
class DoubanSpider(scrapy.Spider):
    name = 'douban'
    allwed_url = 'douban.com'
    start_urls = [
        'https://movie.douban.com/top250/'
    ]
 
    def parse(self, response):
        movie_name = response.xpath("//div[@class='item']//a/span[1]/text()").extract()
        movie_core = response.xpath("//div[@class='star']/span[2]/text()").extract()
        yield {
            'movie_name':movie_name,
            'movie_core':movie_core
        }

感谢各位的阅读！关于python爬虫怎么用scrapy获取影片就分享到这里了，希望以上内容可以对大家有一定的帮助，让大家可以学到更多知识。如果觉得文章不错，可以把它分享出去让更多的人看到吧！

python爬虫怎么用scrapy获取影片

相关阅读