正则表达式常用规则有哪些

# 正则表达式常用规则有哪些正则表达式（Regular Expression）是用于匹配和处理文本的强大工具，广泛应用于编程、数据处理和文本编辑等领域。本文将详细介绍正则表达式的常用规则，帮助您快速掌握其核心用法。 ## 目录 1. [基本概念](#基本概念) 2. [字符匹配](#字符匹配) 3. [元字符](#元字符) 4. [量词](#量词) 5. [分组与捕获](#分组与捕获) 6. [边界匹配](#边界匹配) 7. [修饰符](#修饰符) 8. [常见应用场景](#常见应用场景) 9. [总结](#总结) --- ## 基本概念正则表达式是一种描述字符串模式的语法规则，通常用于： - **验证**：检查字符串是否符合特定格式（如邮箱、电话号码）。 - **搜索**：在文本中快速定位特定内容。 - **替换**：批量修改符合模式的文本。示例：`/^[a-z]+$/` 表示“由纯小写字母组成的字符串”。 --- ## 字符匹配 ### 1. 普通字符直接匹配字符本身： - `a` 匹配字母 "a"。 - `123` 匹配数字序列 "123"。 ### 2. 特殊字符需转义（使用 `\`）： - `\.` 匹配点号（`.`）。 - `\\` 匹配反斜杠（`\`）。 ### 3. 字符集合用 `[]` 定义匹配范围： - `[abc]`：匹配 "a"、"b" 或 "c"。 - `[a-z]`：匹配任意小写字母。 - `[^abc]`：匹配**非** "a"、"b"、"c" 的字符。 --- ## 元字符元字符是正则表达式中具有特殊含义的符号： | 元字符 | 说明 | |--------|---------------------| | `.` | 匹配除换行外的任意字符 | | `\d` | 匹配数字（等价于 `[0-9]`）| | `\w` | 匹配字母、数字或下划线 | | `\s` | 匹配空白字符（空格、制表符等）| | `\D` | 匹配非数字 | | `\W` | 匹配非单词字符 | | `\S` | 匹配非空白字符 | 示例：`\d{3}-\d{4}` 匹配如 "123-4567" 的电话号码格式。 --- ## 量词控制字符重复次数： | 量词 | 说明 | |--------|--------------------------| | `*` | 匹配 0 次或多次 | | `+` | 匹配 1 次或多次 | | `?` | 匹配 0 次或 1 次 | | `{n}` | 匹配恰好 n 次 | | `{n,}` | 匹配至少 n 次 | | `{n,m}`| 匹配 n 到 m 次 | 示例： - `a*`：匹配 "", "a", "aa", ... - `a{2,4}`：匹配 "aa", "aaa", "aaaa"。 --- ## 分组与捕获 ### 1. 分组 `()` 将多个字符视为一个整体： - `(ab)+` 匹配 "ab", "abab", 等。 ### 2. 非捕获分组 `(?:)` 分组但不捕获匹配内容： - `(?:ab)+` 匹配但不记录分组。 ### 3. 反向引用引用已捕获的分组： - `(\d)\1` 匹配重复数字（如 "11"、"22"）。 --- ## 边界匹配 | 符号 | 说明 | |-------|---------------------| | `^` | 匹配字符串开头 | | `$` | 匹配字符串结尾 | | `\b` | 匹配单词边界 | | `\B` | 匹配非单词边界 | 示例： - `^Hello` 匹配以 "Hello" 开头的字符串。 - `world$` 匹配以 "world" 结尾的字符串。 --- ## 修饰符修饰符改变匹配模式： | 修饰符 | 说明 | |--------|---------------------| | `i` | 忽略大小写 | | `g` | 全局匹配（查找所有） | | `m` | 多行模式（`^` 和 `$` 匹配每行）| 示例：`/abc/gi` 全局忽略大小写匹配 "abc"。 --- ## 常见应用场景 ### 1. 邮箱验证 ```regex /^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$/

总结

正则表达式的核心规则包括： 1. 字符匹配：普通字符、转义字符和字符集合。 2. 元字符：如 .、\d、\s 等快捷符号。 3. 量词：控制重复次数（*、+、{n,m}）。 4. 分组与捕获：() 和反向引用。 5. 边界匹配：^、$、\b。 6. 修饰符：i、g、m 等。

掌握这些规则后，您可以高效处理文本匹配、验证和替换任务。建议通过实际练习（如使用 Regex101）加深理解。

提示：复杂的正则表达式可能难以维护，必要时添加注释或拆分为多个简单表达式。 “`

注：本文为简化版，实际使用时需根据具体编程语言调整语法细节（如 JavaScript 中使用 /pattern/flags，Python 用 re 模块）。

2. URL 提取

3. 日期匹配（YYYY-MM-DD）

4. 替换HTML标签

总结

相关阅读