要在正则表达式中实现分组捕获,可以使用小括号 () 来定义一个捕获组。捕获组可以在匹配成功时提取出特定的部分内容,以供后续处理或使用。
例如,假设我们想要匹配一个邮件地址,并分别捕获邮箱用户名和域名部分,可以使用如下的正则表达式:
import re
email = "example@example.com"
pattern = r'(\w+)@(\w+)\.com'
match = re.match(pattern, email)
if match:
username = match.group(1)
domain = match.group(2)
print("Username: ", username)
print("Domain: ", domain)
在上面的例子中,我们使用了两个捕获组来分别捕获邮箱用户名和域名部分。当正则表达式匹配成功后,我们可以使用 match.group(n)
方法来获取捕获组中的内容,其中 n 表示第几个捕获组。
另外,如果想要在正则表达式中使用捕获组的内容进行替换,可以使用 \1
, \2
等来引用捕获组的内容。例如,可以使用 re.sub()
方法来替换匹配的内容:
new_email = re.sub(pattern, r'\2@\1.com', email)
print("New Email: ", new_email)
这样就可以实现在替换中使用捕获组的内容。