python如何爬取漂亮的图片作为壁纸

发布时间：2021-11-25 14:49:22 作者：iii
来源：亿速云阅读：163

# Python如何爬取漂亮的图片作为壁纸

## 引言

在数字化时代，个性化的电脑壁纸已成为许多人表达审美和个性的方式。手动下载图片效率低下，而利用Python编写爬虫程序可以快速获取大量高质量壁纸图片。本文将详细介绍如何使用Python从网络爬取图片并自动设置为壁纸的全过程。

## 一、准备工作

### 1.1 开发环境配置
- Python 3.8+
- 推荐IDE：PyCharm/VSCode
- 必要库安装：
  ```bash
  pip install requests beautifulsoup4 Pillow pywin32

1.2 目标网站分析

以免费壁纸网站Wallhaven为例： - 网站结构分析 - 图片URL规律识别 - robots.txt检查（需遵守爬虫协议）

二、基础爬虫实现

2.1 请求网页内容

import requests
from bs4 import BeautifulSoup

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
}

def get_html(url):
    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()
        return response.text
    except Exception as e:
        print(f"请求失败: {e}")
        return None

2.2 解析图片链接

def parse_images(html):
    soup = BeautifulSoup(html, 'html.parser')
    img_tags = soup.find_all('img', class_='preview')
    return [img['src'].replace('small', 'full') for img in img_tags]

三、高级功能实现

3.1 分页爬取

def crawl_multiple_pages(base_url, pages=3):
    all_images = []
    for page in range(1, pages+1):
        url = f"{base_url}?page={page}"
        html = get_html(url)
        all_images.extend(parse_images(html))
    return all_images

3.2 图片下载与保存

import os

def download_images(urls, save_dir='wallpapers'):
    if not os.path.exists(save_dir):
        os.makedirs(save_dir)
    
    for i, url in enumerate(urls):
        try:
            response = requests.get(url, stream=True)
            filepath = f"{save_dir}/wallpaper_{i+1}.jpg"
            with open(filepath, 'wb') as f:
                for chunk in response.iter_content(1024):
                    f.write(chunk)
            print(f"已下载: {filepath}")
        except Exception as e:
            print(f"下载失败 {url}: {e}")

四、图片后处理

4.1 自动筛选最佳尺寸

from PIL import Image

def filter_by_resolution(min_width=1920, min_height=1080):
    qualified = []
    for filename in os.listdir('wallpapers'):
        filepath = os.path.join('wallpapers', filename)
        with Image.open(filepath) as img:
            width, height = img.size
            if width >= min_width and height >= min_height:
                qualified.append(filepath)
    return qualified

4.2 图片质量优化

def optimize_image(filepath, quality=85):
    with Image.open(filepath) as img:
        img.save(filepath, 'JPEG', quality=quality)

五、自动设置壁纸

5.1 Windows系统实现

import ctypes
import random

def set_wallpaper_windows(image_path):
    ctypes.windll.user32.SystemParametersInfoW(20, 0, image_path, 3)
    print(f"已设置壁纸: {image_path}")

# 随机选择壁纸
def set_random_wallpaper():
    images = [f for f in os.listdir('wallpapers') if f.endswith('.jpg')]
    if images:
        chosen = random.choice(images)
        set_wallpaper_windows(os.path.abspath(f"wallpapers/{chosen}"))

5.2 macOS/Linux系统实现

# macOS示例
def set_wallpaper_macos(image_path):
    os.system(f"""
    osascript -e 'tell application "Finder" to set desktop picture to POSIX file "{image_path}"'
    """)

六、完整代码示例

import os
import requests
import random
from bs4 import BeautifulSoup
from PIL import Image
import ctypes

class WallpaperCrawler:
    def __init__(self):
        self.headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)'
        }
        
    def run(self, base_url, pages=3):
        # 爬取图片
        image_urls = self.crawl_multiple_pages(base_url, pages)
        
        # 下载图片
        self.download_images(image_urls)
        
        # 设置随机壁纸
        self.set_random_wallpaper()
    
    # 其他方法同上...
    
if __name__ == '__main__':
    crawler = WallpaperCrawler()
    crawler.run("https://wallhaven.cc/toplist")

七、注意事项

7.1 法律与道德考量

遵守网站robots.txt规则
控制请求频率（建议添加延迟）
仅用于个人用途，禁止商用

7.2 反爬虫策略应对

# 添加随机延迟
import time
import random

time.sleep(random.uniform(1, 3))

7.3 异常处理增强

def safe_request(url, max_retries=3):
    for _ in range(max_retries):
        try:
            response = requests.get(url, headers=headers, timeout=10)
            return response
        except Exception as e:
            print(f"请求失败: {e}")
            time.sleep(2)
    return None

八、扩展功能

8.1 定时自动更换

import schedule
import time

def job():
    print("正在自动更换壁纸...")
    crawler = WallpaperCrawler()
    crawler.run("https://wallhaven.cc/latest")

# 每天10点执行
schedule.every().day.at("10:00").do(job)

while True:
    schedule.run_pending()
    time.sleep(60)

8.2 图片分类存储

def organize_by_category():
    categories = {
        'nature': ['mountain', 'forest', 'ocean'],
        'anime': ['anime', 'cartoon']
    }
    
    for filename in os.listdir('wallpapers'):
        for category, keywords in categories.items():
            if any(kw in filename.lower() for kw in keywords):
                os.makedirs(f'wallpapers/{category}', exist_ok=True)
                os.rename(f'wallpapers/{filename}', f'wallpapers/{category}/{filename}')

九、性能优化建议

使用多线程加速下载：

from concurrent.futures import ThreadPoolExecutor

def download_all(urls):
    with ThreadPoolExecutor(max_workers=5) as executor:
        executor.map(download_image, urls)

实现断点续传功能
使用缓存避免重复下载

十、总结

本文详细介绍了使用Python爬取网络图片并设置为壁纸的完整流程，包括： - 基础爬虫实现 - 图片处理技术 - 系统壁纸设置 - 扩展功能开发

通过约150行核心代码，我们实现了一个功能完善的自动壁纸更换系统。读者可以根据实际需求进一步扩展功能，如： - 添加GUI界面 - 支持更多壁纸网站 - 开发图片筛选功能

提示：完整项目代码已托管在GitHub（示例仓库地址），包含更多高级功能和详细文档。

附录：常见问题解答

Q: 如何解决SSL证书验证错误？ A: 添加verify=False参数（仅限开发环境）或安装证书：

requests.get(url, verify="/path/to/certificate")

Q: 图片下载速度慢怎么办？ A: 1. 使用CDN加速 2. 启用多线程下载 3. 选择离你更近的服务器

Q: 如何爬取需要登录的网站？ A: 使用Session对象保持登录状态：

session = requests.Session()
session.post(login_url, data=credentials)
session.get(protected_url)

”`