是的,Python 网页爬虫可以抓取视频。可以使用第三方库如 requests
和 BeautifulSoup
来下载和解析网页,然后使用 ffmpeg
等工具将视频保存到本地。
以下是一个简单的示例代码,展示如何使用 Python 抓取网页上的视频并保存到本地:
import requests
from bs4 import BeautifulSoup
import re
import os
import subprocess
def download_video(url, output_path):
response = requests.get(url)
with open(output_path, 'wb') as f:
f.write(response.content)
def extract_video_url(html):
soup = BeautifulSoup(html, 'html.parser')
video_tags = soup.find_all('video')
video_urls = []
for tag in video_tags:
source_tag = tag.find('source')
if source_tag:
video_url = source_tag.get('src')
if video_url:
video_urls.append(video_url)
return video_urls
def main():
url = 'https://example.com' # 替换为目标网页的 URL
output_directory = 'videos'
if not os.path.exists(output_directory):
os.makedirs(output_directory)
html = requests.get(url).text
video_urls = extract_video_url(html)
for i, video_url in enumerate(video_urls):
output_path = os.path.join(output_directory, f'video_{i}.mp4')
download_video(video_url, output_path)
print(f'Downloaded {video_url} to {output_path}')
if __name__ == '__main__':
main()
请注意,这个示例代码仅适用于简单的网页结构,并且假设视频 URL 直接包含在 <video>
标签的 src
属性中。对于更复杂的网页结构,可能需要进一步解析和提取视频 URL。此外,ffmpeg
需要安装在系统中,以便将视频文件保存到本地。