如何使用正则表达式查找相似单词

发布时间:2021-09-23 10:23:09 作者:小新
来源:亿速云 阅读:149

这篇文章将为大家详细讲解有关如何使用正则表达式查找相似单词,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

问题描述:

在这个实例中你要解决如下几个问题。

1、想要在一个字符串中找到所有的color和colour。

2、想要找到这3个以"at”结尾的单词中的任意一个:bat、cat或rat。

3、想要找到以phobia结尾的单词。

4、想要找的名字"Steven”的常见变形:Steve、Steven和Stephen。

5、想要匹配术语"regular expression”的所有常见形式。

解决方案:

下面按顺序列出用来解决这些问题的正则表达式。所有这些解决方案中都使用了不区分大小写的选项。

问题1:color和colour

\bcolou?r\b

正则选项:不区分大小写

正则流派:.NET、Java、JavaScript、PCRE、Perl、Python、Ruby

问题2:bat、cat或rat

\b[bcr]at\b

正则选项:不区分大小写

问题3:以"phobia"结尾的单词

\b\w*phobia\b

正则选项:不区分大小写

问题4:Steve、Steven和Stephen

\bSte(?:ven?|phen)\b

问题5:"regular expression”的变体

\breg(?:ular·expressions?|ex(?:ps?|e[sn])?)\b

正则选项:不区分大小写

正则流派:.NET、Java、JavaScript、PCRE、Perl、Python、Ruby

解析:

\b                            #判断一个单词边界位置

 reg                        #匹配"reg”

 (?:                         #分组但是不捕获

   ular\                    #        匹配"ular”

    expressions?        #       匹配"expression”或"expressions"

   |                           #  或者:

  ex                         #       匹配"ex”

  (?:                        #        分组但是不捕获

    ps?                     #            匹配"p”或"ps"

   |                           #       或者:

    e[sn]                   #            匹配"es”或"en"

  )?                          #         结束非捕获分组,整个分组为可选

 )                             # 非捕获分组的结束       

\b                            #判断一个单词边界位置

注:这5个正则表达式都使用了单词边界(<\b>)确保只会匹配整个单词。

关于“如何使用正则表达式查找相似单词”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

推荐阅读:
  1. elasticsearch 相似推荐
  2. Python倒排索引之查找包含某主题或单词的文件

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

正则表达式

上一篇:如何手动破解及使用Vista SP2正式版主题

下一篇:实用正则表达式有哪些

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》