Java正则环视和反向引用功能与用法详解

发布时间：2020-09-28 12:21:19 作者：Z小繁
来源：脚本之家阅读：239

本文实例讲述了Java正则环视和反向引用功能与用法。分享给大家供大家参考，具体如下：

环视

1、环视概念

环视，又称为零宽断言，简称断言。

环视强调位置（前面或后面），必须匹配环视表达式，才能匹配成功。

环视可认为是虚拟加入到它所在位置的附加判断条件，并不消耗正则的匹配字符。

2、环视基础表达式

(?=Expression) 顺序肯定环视，表示所在位置右侧能够匹配Expression
(?!Expression) 顺序否定环视，表示所在位置右侧不能匹配Expression
(?<=Expression) 逆序肯定环视，表示所在位置左侧能够匹配Expression
(?<!Expression) 逆序否定环视，表示所在位置左侧不能匹配Expression

Note：顺序（=）右侧匹配，逆序环视比顺序环视多了个<。

JavaScript中只支持顺序环视，不支持逆序环视。

Java中虽然顺序环视和逆序环视都支持，但是逆序环视只支持长度确定的表达式，逆序环视中量词只支持?，不支持其它长度不定的量词。

3、使用示例

3.1、顺序肯定环视(?=Expression)

3.1.1、匹配后缀结尾是“.txt”的不含后缀的文件名

【.+(?=\.txt)】

文本：

txtfile.txt
exefile.exe
inifile.ini

匹配结果：txtfile

3.1.2、匹配密码（必须包含字母（不区分大小写）、数字，6-16位）
【^(?=.*?[a-zA-Z])(?=.*?[0-9])[a-zA-Z0-9]{6,16}$】

(?=.*?[a-zA-Z]) 限定后面的字符中至少有一个字母，使用 (?=.*?[0-9]) 限定后面的字符中至少有一个数字，最后通过实际匹配正则 [a-zA-Z0-9]{6,16} 限定量词。

3.2、顺序否定环视(?!Expression)

3.2.1、匹配除<a></a>之外的标签

【<(?!/?a\b)[^<]+?>】

文本：<a><a1></a>zxiaofan<div>com</d>iv>cc

匹配结果：

3.2.2、匹配后缀结尾不是“.txt”的含后缀的文件名

【.+(?!\.txt)】表达式错误，因为.+没有指定位置且是贪婪匹配。（因此.+就能直接匹配txtfile.txt了）
【(.+)(?!\.txt)\.[^.]+$】

文本：

txtfile.txt
exefile.exe
inifile.ini

匹配结果：

exefile.exe
inifile.ini

3.3、逆序肯定环视(?<=Expression)

3.3.1、匹配指定标签之间的内容

【(?<=<div>)[^<]+(?=</div>)】

文本：<div>zxiaofan.com</div>

匹配结果：zxiaofan.com

3.3.2、获取指定参数的值

【(?<=name=).+】

文本：

name=zxiaofan
age=20
level=6

匹配结果：zxiaofan

3.4、逆序否定环视(?<!Expression)

3.4.1、获取非指定参数的值

【^[^=#]+=(?<!name=).+$】

文本：

name=zxiaofan
age=20
level=6
#sex=1

匹配结果：

age=20
level=6

4、综合示例

4.1、必须包含字母、数字、特殊字符

【^(?=.*?[a-zA-Z])(?=.*?\d)(?![a-zA-Z\d]+$).+$】

解释：^(?=.*?[a-zA-Z])限制必须有字母；(?=.*?\d)限制必须有数字；(?![a-zA-Z\d]+$)限制不能全为数字和字母。

4.2、匹配主域名（匹配顶级域名）

【(?<=(?:://\w{0,50}\.)?)(?:\w{0,50}\.)(?:com\.cn|net\.cn|org\.cn|com|net|org|cn|biz|info|cc|tv)】

文本：

vip.zxiaofan.com.cn
http://zxiaofan.com/123
www.zxiaofan.org.cn

匹配结果：

zxiaofan.com.cn
zxiaofan.com
zxiaofan.org.cn

Note：【?:】不捕获匹配的文本到自动命名的组，也不给此组分配组好。（去掉后不影响结果）
特殊域名：万网www.net.cn

4.3、匹配5连号手机号码

【1[34578]\d{3}(\d)(?!\1{1})(\d)\2{4}】

文本：

18328501111
18328511111
18328551111
18328111111

匹配结果：

18328511111

Note1：\1匹配第一组内容
Note2：(?!\1{1})过滤6连号的号码

反向引用

1、反向引用概念

捕获组：按照()子表达式划分成若干组；每出现一对()就是一个捕获组；引擎会对捕获组进行编号，编号规则是左括号(从左到右出现的顺序，从1开始编号。

捕获组命名：

(?<name>exp) 匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)；
(?:exp) 匹配exp,不捕获匹配的文本到自动命名的组，也不给此分组分配组号。

反向引用：

\1表示第一组（abc）；\2表示第二组；
\k<Word>：引用指定名字的组。

2、使用示例

2.1、匹配首尾相同的文件名

【([a-z]{3})[a-z]+\.\1{1}】

文本：

txtfile.txt
exefile.txt
fileini.ini

匹配结果：

txtfile.txt

Note：([a-z]{3})为第一组，\1{1}表示引用第一组一次（这里不能写成\1{3}）。

PS：这里再为大家提供2款非常方便的正则表达式工具供大家参考使用：

JavaScript正则表达式在线测试工具：
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具：
http://tools.jb51.net/regex/create_reg

更多关于java算法相关内容感兴趣的读者可查看本站专题：《Java正则表达式技巧大全》、《Java数据结构与算法教程》、《Java操作DOM节点技巧总结》、《Java文件与目录操作技巧汇总》和《Java缓存操作技巧汇总》

希望本文所述对大家java程序设计有所帮助。

Java正则环视和反向引用功能与用法详解

相关阅读