QueryList 是一个 PHP 的网络爬虫库,它可以方便地从网页中提取所需的数据。要使用 QueryList,首先需要确保已经安装了它。你可以通过 Composer 安装 QueryList:
composer require overtrue/querylist
安装完成后,你可以开始使用 QueryList 进行网页数据的抓取。以下是一个简单的示例:
<?php
// 引入 QueryList 类
require_once 'vendor/autoload.php';
use QL\QueryList;
// 目标网页 URL
$url = 'https://example.com';
// 创建 QueryList 实例
$ql = QueryList::create($url);
// 使用 CSS 选择器提取数据
$title = $ql->find('title')->text(); // 提取网页标题
$links = $ql->find('a')->texts(); // 提取所有链接
// 使用正则表达式提取数据
$paragraphs = $ql->find('p')->regex('/\w+/')->texts(); // 提取所有段落文本
// 输出提取到的数据
echo "Title: {$title}\n";
echo "Links: " . implode(', ', $links) . "\n";
echo "Paragraphs: " . implode(', ', $paragraphs) . "\n";
在这个示例中,我们首先引入了 QueryList 类,然后创建了一个 QueryList 实例,指定了目标网页的 URL。接下来,我们使用 CSS 选择器和正则表达式从网页中提取了标题、链接和段落文本。最后,我们将提取到的数据输出到屏幕上。
QueryList 提供了许多其他功能,如过滤、映射、排序等,你可以查阅官方文档(https://www.overtrue.cn/querylist/ )以了解更多关于 QueryList 的使用方法。