在Java的Matcher类中,分组捕获是一种非常有用的功能,可以让我们在正则表达式中捕获多个子串,并对每个子串进行处理。下面是一些在分组捕获中的技巧:
使用括号 () 来创建一个捕获组,在正则表达式中,括号中的内容会被捕获到一个组中,并可以通过Matcher的group方法来获取这个组的内容。
使用 | 来表示或操作符,可以在括号内部使用 | 来捕获多个可能的子串。
使用非捕获组 (?:) 来表示不捕获的组,即不会让该组的内容出现在group方法的结果中。
使用命名捕获组 (?
使用反向引用 \n 来引用前面捕获到的组,可以在正则表达式中通过\1、\2等来引用前面的捕获组。
下面是一个示例代码,演示了如何使用Matcher类进行分组捕获:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Main {
public static void main(String[] args) {
String text = "Hello, my email is john@example.com and my phone number is 123-456-7890";
Pattern pattern = Pattern.compile("([a-zA-Z0-9]+@[a-zA-Z0-9]+\\.[a-zA-Z0-9]+)|(\\d{3}-\\d{3}-\\d{4})");
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {
if (matcher.group(1) != null) {
System.out.println("Email: " + matcher.group(1));
}
if (matcher.group(2) != null) {
System.out.println("Phone: " + matcher.group(2));
}
}
}
}
在这个例子中,我们使用正则表达式来匹配邮箱地址和电话号码,并使用捕获组来分别捕获这两个子串。然后在循环中通过matcher.group方法来获取捕获组的内容,并输出到控制台。