要设置Scrapy的请求头,可以在Spider类中使用"custom_settings"属性来设置默认的请求头信息。以下是一个示例代码:
import scrapy
class MySpider(scrapy.Spider):
name = 'my_spider'
custom_settings = {
'DEFAULT_REQUEST_HEADERS': {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3',
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
'Accept-Language': 'en',
}
}
def start_requests(self):
# start making requests
在上面的代码中,我们使用了"custom_settings"属性来设置默认的请求头信息,包括User-Agent、Accept和Accept-Language等。这样在Spider类中的请求会自动带上这些请求头信息。