Java StringTokenizer 类本身并不能直接处理 HTML 标签,但你可以通过编写一个简单的函数来解析 HTML 标签并提取所需的内容。以下是一个示例函数,用于解析 HTML 标签并返回标签名称和内容:
import java.util.StringTokenizer;
public class HtmlParser {
public static void main(String[] args) {
String html = "<div><p>这是一个 <b>示例</b> HTML 文本。</p></div>";
StringTokenizer tokenizer = new StringTokenizer(html);
while (tokenizer.hasMoreTokens()) {
String token = tokenizer.nextToken();
if (isHtmlTag(token)) {
System.out.println("Tag: " + token);
} else {
System.out.println("Content: " + token);
}
}
}
public static boolean isHtmlTag(String token) {
return token.startsWith("<") && token.endsWith(">");
}
}
这个示例中的 isHtmlTag
函数用于检查给定的字符串是否是一个 HTML 标签。如果是,它将返回 true,否则返回 false。在 main
函数中,我们使用 StringTokenizer 类遍历 HTML 字符串,并使用 isHtmlTag
函数判断每个令牌是否是 HTML 标签。如果是标签,我们打印标签名称;否则,我们打印内容。
请注意,这个示例仅用于演示目的,实际应用中可能需要更复杂的解析器来处理嵌套标签和属性。在这种情况下,可以考虑使用 Java 的 Jsoup 库,它是一个功能强大的 HTML 解析库。