Jsoup是一个开源的Java HTML解析器,可以通过选择器语法来提取和操作HTML文档。它提供了一种简单、方便的方式来解析HTML并提取其中的数据。
以下是Jsoup的一些常用用法:
Document doc = Jsoup.parse(html);
Document doc = Jsoup.connect(url).get();
Elements links = doc.select("a");
Element element = doc.selectFirst("#id");
Elements elements = doc.select(".class");
String href = link.attr("href");
String text = link.text();
for (Element link : links) {
// do something
}
link.attr("href", "newUrl");
link.text("newText");
Elements forms = doc.select("form");
for (Element form : forms) {
String action = form.attr("action");
// do something
}
除了上述常用用法,Jsoup还提供了强大的功能,如处理文档编码、处理HTML片段、处理文件上传等。可以通过查阅官方文档来了解更多详细用法:https://jsoup.org/