正则表达式漫谈|电子爱好者

admin管理员组
文章数量:1579086

正则表达式漫谈

一个引子：

请教一个正则表达式怎么写，
只能是 a-z、A-Z、0-9、_、-、.
其中_ - . 不能出现在首尾
.最多只能出现一次

这是今天群里的一个老哥提的一个需求，白天的时候没写好，晚上的时候再请教了些大佬的意见，列出下面的三种实现方式

方式1

^[A-Za-z0-9]{1}[A-Za-z0-9_-]*?\\.?[A-Za-z0-9_-]*?[A-Za-z0-9]{1}$

这个做法大体是将首尾先固定：

^[A-Za-z0-9]{1}开头位置出现的字符只能是a-z、A-Z、0-9不能是_、-、. 其中^表示以什么字符开头
[A-Za-z0-9]{1}$结尾固定，$表示字符结尾标志
*表示一次或多次匹配前面的字符或子表达式
?表示零次或一次匹配前面的字符或子表达式
比较难处理的是.这个字符，至多一次，用\\.? 或者\\.{0,1}
注意字符的转义

方式2

^(?![^.]*?\\.[^.]*?\\.)[a-zA-Z][a-zA-Z\\d_\\.-]*?(?<!(\\.|-|_))

^(?![^.]*?\\.[^.]*?\\.) 是从开头的出现大于等于2个.的情形排除掉，其中

否定型顺序环视 (?![^.]*?\.[^.]*?\.)
?!是断言此位置的后面不能匹配该表达式
匹配不在下列列表中的一个单字符 [^.]*?
*? 量词 — 匹配零个到无穷次，尽可能少匹配，如果有必要，回溯匹配更多内容(懒惰模式)

?<!(\\.|-|_) 为后向后发，断言此位置的前面不能匹配该表达式
[a-zA-Z\\d_\\.-]*? 表需要的字符 *? 量词匹配零个到无穷次，尽可能少匹配，如果有必要，回溯匹配更多内容(懒惰模式) \d表示数字

方法3

^(?![\._-])[a-zA-Z0-9_-]*\.?[a-zA-Z0-9_-]*?(?<![\._-])$

此方法是也是我心目中的认为很好的写法，需要拆三段，来处理.多过2次的情况
``^(?![._-])`拿掉开头不匹配的几种情况

否定型顺序环视 (?![\._-])
断言表达式后面不匹配以下正则
匹配下列列表中的一个单字符 [\._-]
\. 按字面匹配 字符 .，(区分大小写)
_- 从列表 _- (区分大小写) 中匹配一个单字符

(?<![\._-])$拿掉结尾不匹配的几种情况

否定型逆序环视 (?<![\._-])
断言表达式前面不匹配以下正则
匹配下列列表中的一个单字符 [\._-]
\. 按字面匹配 字符 .，(区分大小写)
_- 从列表 _- (区分大小写) 中匹配一个单字符

\.? 是处理包含. 0 次或者1次的情况

? 量词 — 匹配零个到1次，尽可能多匹配，如果有必要，回溯匹配更少内容(贪婪)

*?量词 — 匹配零个到无穷次，尽可能少匹配，如果有必要，回溯匹配更多内容(懒惰模式)

测试效果

下面的正则是组内分享过的PPT，拿来润色了下

预热

分组

组是用括号划分的正则表达式，可以根据组的编号来引用某个组。组号为 0 表示整个表达式，组号 1 表示第一对括号扩起的组，以此类推。

1. ((A)(B(C)))
2. (A)
3. (B(C))
4. (C)

再比如 A(B©)D 有三个组：组 0 是 ABCD，组 1 是 BC，组 2 是 C，
可以根据有多少个左括号来来确定有多少个分组，括号里的表达式都称子表达式。

/***********************/
(\d{4})-(\d{2}-(\d{2}))
2021-03-05
/***********************/

零宽断言

Subject	Detail
(?=exp)	断言自身出现的位置后面能匹配表达式exp
(?<=exp)	断言自身出现的位置前面能匹配表达式exp
(?!exp)	断言此位置的后面不能匹配表达式exp
(?<!exp)	断言此位置的前面不能匹配表达式exp

情况1:(?=exp)

零宽度正预测先行断言表示匹配表达式前面的位置

先行断言的执行步骤是这样的先从要匹配的字符串中的最右端找到第一个 ing (也就是先行断言中的表达式)然后再匹配其前面的表达式，若无法匹配则继续查找第二个 ing 再匹配第二个 ing 前面的字符串，若能匹配则匹配，符合正则的贪婪性

/***********************/
(?<=<div>).*(?=</div>)
<div>www.github.com</div>
<div>www.baidu.com</div>
<div>www.google.com</div>
/***********************/

情况2:(?<=exp)

零宽度正回顾后发断言表示匹配表达式后面的位置

(?<=abc).* 可以匹配 abcdefg 中的 defg

后发断言跟先行断言恰恰相反它的执行步骤是这样的：先从要匹配的字符串中的最左端找到第一个abc(也就是先行断言中的表达式)然后再匹配其后面的表达式，若无法匹配则继续查找第二个 abc 再匹配第二个 abc 后面的字符串，若能匹配则匹配

/***********************/
(?<=anti-).*
anti-knock
anti-foreign
anti-war
anti-recall
/***********************/

/***********************/
(?<=cookie:).*
accept: text/plain, */*; q=0.01
accept-encoding: gzip, deflate, br
accept-language: zh-CN,zh;q=0.9
cookie: _ga=GA1.2.534134663.1589797467; Hm_lvt_a
/***********************/

/***********************/
(?<=src=\").*?(?=\")
<img src="/UploadFiles/image/20140304/20140304094318_2971.png" alt="" />
/***********************/

/***********************/
(?<=url\()[^\)]+
local('OpenSans-Light'),url(http://www.github.com) format('woff2');
/***********************/

情况3:(?!exp)

负向零宽先行断言

/***********************/
(?!.*\.min\.css$)\w+\.css
a.min.css
b.css
min.css
.min.css
/***********************/

情况4:(?<!exp)

匹配前面不是小写字母的11位数字

/***********************/
(?<![a-z])\d{11}
abcdef
13011223344
130112A23344
a13011223344
a13011223344
/***********************/

贪婪/懒惰/独占

Greedy：贪婪
　　匹配最长。在贪婪量词模式下，正则表达式会尽可能长地去匹配符合规则的字符串，且会回溯。

Reluctant ：非贪婪
　　匹配最短。在非贪婪量词模式下，正则表达式会匹配尽可能短的字符串。

Possessive ：独占
　　同贪婪一样匹配最长。不过在独占量词模式下，正则表达式尽可能长地去匹配字符串，一旦匹配不成功就会结束匹配而不会回溯。

贪婪模式即在X字符后面增加限定符号如：？、*、+、{n}、{n,}、{n,m}
懒惰模式是在带有限定符号:？、*、+、{n}、{n,}、{n,m}的后面，增加”?”，如：X??
独占模式也叫侵占模式，是在带有限定符号:？、*、+、{n}、{n,}、{n,m}的后面，增加”+”，如：X?+

Greedy：贪婪

首先 .* 匹配任何字符（在非 DOTALL 模式下不匹配 \n,\r,\a 一类字符），在 source 中第一个被匹配的

后面直至最后一个字符（也就是的 >）都符合 .* 的匹配规则，但是显然如果 .* 匹配到最后一个字符，那么没有剩余的字符去匹配正则表达式中还未匹配的
的，那么会引起 匹配失败。但是 失败后会回溯（这一点与独占量词不同，下面会讲到）。回溯后这段正则表达式将匹配到 source 中第一个
和第二个
以及之间的内容，如上面的输出所示。

Reluctant ：非贪婪

source 中第一个

匹配到之后到第一个
之间的字符都符合 .* 的匹配规则，同时如果继续匹配也符合这个规则，但是勉强模式下，它会尽可能短地匹配字符串，故第一个找到的字符串应该是
Ggicci’s Blog
，如上面输出所示。然后它会继续匹配剩余的字符串，找到第二个。

Possessive ：独占

这段正则表达式将不会在 source 找到任何匹配的内容，因为

匹配到后， .*+ 所能匹配的字符尽可能长地匹配下去，直到 source 的最后一个字符，这必将引起匹配失败，但是在独占模式下一旦匹配失败就不会回溯，故不存在像贪婪模式一样回溯之后找到之前的
的情况。

/***********************/
//贪婪
(?<=<h3>).*(?=</h3>)
<h3>abd</h3><h3>bcd</h3>
(?<=<h3>).*?(?=</h3>)
//懒惰
/***********************/

正则表达式的匹配模式
-IGNORECASE 忽略大小写模式：默认情况下正则表达式区分大小写
-SINGLELINE单行模式：整个文本看作一个字符串，只有一个开头，一个结尾。使.可以匹配包含换行符在内的任意字符
-MULTILINE 多行模式：每行都是一个字符串，都有开头和结尾。\A -->开始字符，\Z–>结束字符

实战场景

IDEA中查找接口

搜索系统的文件

替换文本中的指定字符

markdown格式的文本中，高亮英文字符

电子爱好者 - 最新技术资讯及电子产品介绍！

正则表达式漫谈

正则表达式漫谈

一个引子：

方式1

方式2

方法3

测试效果

预热

分组

零宽断言

情况1:(?=exp)

情况2:(?<=exp)

情况3:(?!exp)

情况4:(?<!exp)

贪婪/懒惰/独占

实战场景

推荐几个正则的工具/网站

更多相关文章

Java正则表达式 贪婪 勉强 匹配说明 greedy vs ( lazy | reluctant )

java 2正则表达式,Java正则表达式学习(2)

正则表达式学习指南(十一)----Quantifiers(Repetition)

Java正则表达式详解

正则表达式的学习

java正则表达式 -_Java正则表达式的解释说明

正则表达式的构造摘要(1)

Eclipse中查找替换所使用的正则表达式的定义

Java复习总结之正则表达式

使用java正则表达式的正确姿势

Day778.正则表达式问题 -Java 性能调优实战

Java中的正则表达式构造摘要

尚学堂-马士兵-专题-正则表达式

Java_正则表达式

阿里巴巴java性能调优实战：慎重使用正则表达式

java+正则表达+数字,认识Java正则表达式

Java中的正则表达式

java字符串正则分割字符串_java分割字符串和正则表达式 | 学步园

java正则表达式 教程_Java正则表达式实例教程

正则表达式在java中是如何使用的？

发表评论

推荐文章

win7安装硬盘后无法启动计算机,硬盘装Win7系统电脑后开机提示DISK BOOT FAILURE怎么办【图文】...

昨晚家里停网后，我写了一段代码破解了隔壁小姐姐的wifi密码...

电脑怎么设置时间自动关机？

win10 此计算机无法连接到家庭组,win10无法加入家庭组的解决方法

Windows装机必备基础软件，都在这里了

热门文章

考研英语 长难句训练day17

使用树莓派学习PostgreSQL

m4s格式转换mp3_mp4怎么转换成mp3格式？mp4转mp3的傻瓜式方法

猫耳FM音频转换成MP3格式

VMWare虚拟机的作用!Win10系统VMWare虚拟机无法连接网络!

UOS统信系统开机报You are in emergency mode报错无法正常进系统修复方案

开机虚拟机出现Welcome to emergency mode!的解决方案

CentOS7设置永久挂载硬盘出现Welcome to emergency mode?错误

u盘误操作格式化后如何恢复数据：全面指南

袋鼠下载IOS用的一款不限速下载工具支持极速下载，在线秒播

最新文章

一芯FC1178BC主控U盘量产修复指南

慧荣SMISM3280AB开卡量产工具适用于无法识别设备黑片U盘量产工具修复使用

u盘无法识别怎么办，u盘无法识别解决方法

linux 下u盘分区修复无法识别问题解决

定了，6大领域93个开源任务，阿里开源导师带你参与中科院开源之夏2022

识别到硬盘 计算机不显示盘符,笔者教你修复可以识别u盘但不显示盘符的问题...

agio U盘强制弹出导致的无法识别需格式化的问题的修复方案

U盘无法与计算机连接,U盘无法连接电脑

通过修复VMware软件解决虚拟机无法识别到U盘设备的问题

@mysql数据库面试手册

修复U盘【笔记】

Ubuntu及Debian下挂载U盘及exFat文件系统U盘无法挂载的解决

linux usb3.0无法识别u盘启动,Deepin 20系统能识别USB3.0：如果不能用请重启系统或重插几次...

为什么计算机无法读取u盘,电脑无法识别读取U盘怎么办？逐一排查解决问题

解决Ubuntu下U盘无法识别的问题

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

Java正则表达式贪婪勉强匹配说明 greedy vs ( lazy | reluctant )

java正则表达式教程_Java正则表达式实例教程

考研英语长难句训练day17

识别到硬盘计算机不显示盘符,笔者教你修复可以识别u盘但不显示盘符的问题...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载