Scrapy框架可以通过设置DOWNLOAD_DELAY参数来控制下载延迟,即每次请求之间的时间间隔。您可以在settings.py文件中进行设置,示例如下:
DOWNLOAD_DELAY = 2 # 设置下载延迟为2秒
您还可以通过在Spider类中设置download_delay属性来实现相同的效果,示例如下:
class MySpider(scrapy.Spider):
name = 'my_spider'
start_urls = ['http://example.com']
download_delay = 2 # 设置下载延迟为2秒
def parse(self, response):
# 爬虫逻辑代码
设置下载延迟可以有效地降低对目标网站的访问频率,避免对服务器造成过大的压力,也可以模拟人类的浏览行为,减少被反爬虫机制封锁的风险。