Java语法之正定表达式的用法|电子爱好者

admin管理员组
文章数量:1579409

正则表达式

字符集

定义

默认情况下区分大小写。

字符类

自定义

定义规则
- 由 [] 组，只匹配一个，需要注意以下四个:
- ^ : 如果在第一个位置，表示取反的含义。
- - ：表示一个区间即范围
- ] : 最近一个位置为:结束，如果要表示普通的]请加 \
- \ : 转义
- . ：在字符类中不是代表任意的字符，代表自身 . 的含义。如果需要表示原有的含义，挪动位置或者加 \
示例
- [ae134] -> a e 1 3 4
- [(as)] ->a s ( )
- [a-z] ->小写字母
- [-]a-z[] -> -[] 及小写字母

默认|标准字符

定义规则
- \d digit[0-9] , [0123456789]
- \w word [A-Za-z0-9]
- \s space 空格，制表符，换行符
- . 多行模式（缺省）：除了换行符\r\n以外的任意一个字符， [^\n\r] ；单行模式：可以匹配
- 包含换行符在内的任意一个字符
- \D [\d][0123456789][^0-9]
- \W [^\w] 非字母，数字，即空白，标点符号及中文
- \S [^\s]
示例
- h[ea]llo –>hello hallo
- h(e|a)llo ->hello hallo
- [-\abc] -> - \ a b c
- \d\s ->一个数字和一个空白
- [\d\s] –> 数字或空白

量词

定义规则
- 匹配的过程中，需要指定次数
- - : 0个及以上
- - : 1个及以上
- ? : 0个或1个
- {n} : n次，非负数
- {n,} : 大于等于n
- {n,m} : 大于等于n小于等于m
示例
- co*ke –> 不限个数的 O
- co+ke –>至少一个 O
- co?ke ->1 个或零个 O
- co{0}ke ->0 个
- co{5,}ke –>5 次及以上
- co{5,8}ke –> 至少 5 次，最多 8 次
- [1-9]\d{3} –>大于等于 1000 小于等于 9999 的数
- [1-9]\d{2,4} –>大于等于 100 小于等于 99999 的数
- 1[34578]\d{9} : 匹配手机号
- <[a-zA-Z]+\d?> ->网页标签
- <[A-Za-z][A-Za-z0-9]*> ->网页标签

贪婪模式

定义规则
- 在匹配次数不定时如 *, {n,}, + 匹配字符越多越好，默认模式即”贪婪模式”
- 贪婪模式 greedy(匹配字符越多越好，可回溯)
- ? 懒惰模式 lazy reluctant (匹配字符越少越好，可回溯)
- - 独占模式 possessive(匹配字符越多越好,不可回溯) 用的较少 cokecolacoooooooooooooke
示例
- .*o –>贪婪模式
- .{2,}o–>贪婪模式
- .{2,}?o –>懒惰模式
- .{2,}+o –>独占模式，不可回溯没有匹配到内容。
- <.+?> ->找出标签不要标签内的内容。不是<.+>
- <[^>]+>->找出标签不要标签内的内容。不是<.+>
阻止贪婪模式的方式
- 1、量词后面使用 ?
- 2、使用取反

边界

定义规则

边界不占用宽度，只是一个界限
^ ：多行代表每行头单行代表整个字符串的开始
$ : 多行代表每行尾单行代表字符串的结尾
\b : 匹配前面或后面的不是\w
\B : 匹配前面或后面的是\w

示例

查找开头的 hello -> ^hello
找出独立的单词 world -> \bworld\b
查找结尾的 world -> world$

选择符与分组

选择符 |

| ->优先级低 ,满足匹配则停止，不会查找更优的方案
he|hello –>只匹配 he,不匹配 hello
hello|he->匹配 he 与 hello

分组

方向应用
- \ 内部默认缓存,从第一个左括号计算，编号为 1 开始。必须认识组编号，为 ( 的位置
- 示例
  - (")test\1 –> “第 1 个左括号中
  - ((")test)\2 –> “第 2 个左括号中
  - ((("))test)\3 –> “第 3 个左括号中
  - "’["’] -> 错误的找出合法的字符串"" 或’’
  - (["’])([^"’]+)\1 ->找出合法的字符串"" 或’’
非捕获组

常用类

组成

java.util.regex Pattern Matcher String
一般在查找、替换、分割、组的使用

Pattern

常用方法
- static Pattern compile(String regex) 将给定的正则表达式编译为模式。
- static Pattern compile(String regex, int flags) 将给定的正则表达式编译为具有给定标志的模式。
- Matcher matcher(CharSequence input) 创建一个匹配此模式的给定输入的匹配器。
- static boolean matches(String regex, CharSequence input) 编译给定的正则表达式并尝试将给定的输入与其匹配。

Matcher

常用方法
- boolean find() 尝试查找与模式匹配的输入序列的下一个子序列。
- boolean find(int start) 重置此匹配器，然后尝试从指定的索引处开始查找与模式匹配的输入序列的下一个子序列。
- String group() 返回上一个匹配项匹配的输入子序列。

字符串与正则

常用方法
- String[] split(String regex) 将此字符串拆分为给定 regular expression的匹配项。
- String[] split(String regex, int limit) 将此字符串拆分为给定 regular expression的匹配项。

附录

1. 校验数字的表达式

1 数字：^1*$
2 n位的数字：^\d{n}$
3 至少n位的数字：^\d{n,}$
4 m-n位的数字：^\d{m,n}$
5 零和非零开头的数字：^(0|[1-9][0-9]*)$
6 非零开头的最多带两位小数的数字：^([1-9][0-9]*)+(.[0-9]{1,2})?$
7 带1-2位小数的正数或负数：^(-)?\d+(.\d{1,2})?$
8 正数、负数、和小数：^(-|+)?\d+(.\d+)?$
9 有两位小数的正实数：^{2+(.[0-9]{2})?$}
10 有1~3位小数的正实数：^{3+(.[0-9]{1,3})?$}
11 非零的正整数：^{4\d*$ 或 ^([1-9][0-9]){1,3}$ 或 ^+?[1-9][0-9]$}
12 非零的负整数：^-[1-9][]0-9"$ 或 ^-[1-9]\d$
13 非负整数：^\d+$ 或 ^5\d*|0$
14 非正整数：^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
15 非负浮点数：^\d+(.\d+)?$ 或 ^{6\d*.\d*|0.\d*[1-9]\d*|0?.0+|0$}
16 非正浮点数：^((-\d+(.\d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]\d*.\d*|0.\d*[1-9]\d*))|0?.0+|0$
17 正浮点数：^{7\d*.\d*|0.\d*[1-9]\d*$ 或 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$}
18 负浮点数：^-([1-9]\d*.\d*|0.\d*[1-9]\d*)$ 或 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
19 浮点数：^(-?\d+)(.\d+)?$ 或 ^-?([1-9]\d*.\d*|0.\d*[1-9]\d*|0?.0+|0)$

2.校验字符的表达式

1 汉字：^8{0,}$
2 英文和数字：^{9+$ 或 ^10{4,40}$}
3 长度为3-20的所有字符：^.{3,20}$
4 由26个英文字母组成的字符串：^11+$
5 由26个大写英文字母组成的字符串：^12+$
6 由26个小写英文字母组成的字符串：^13+$
7 由数字和26个英文字母组成的字符串：^14+$
8 由数字、26个英文字母或者下划线组成的字符串：^\w+$ 或 ^\w{3,20}$
9 中文、英文、数字包括下划线：^15+$
10 中文、英文、数字但不包括下划线等符号：^{16+$ 或 ^17{2,20}$}
11 可以输入含有^%&’,;=?KaTeX parse error: Can't use function '\"' in math mode at position 1: \̲"̲等字符：[^%&',;=?\x22]+
12 禁止输入含有的字符：[^\x22]+

3. 特殊需求表达式

1 Email地址：^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$
2 域名：[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
3 InternetURL：[a-zA-z]+://[^\s]* 或 ^https://([\w-]+.)+[\w-]+(/[\w-./?%&=]*)?$
4 手机号码：^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
5 电话号码(“XXX-XXXXXXX”、“XXXX-XXXXXXXX”、“XXX-XXXXXXX”、“XXXXXXXXXXX”、"XXXXXXX"和"XXXXXXXX)：^((\d{3,4}-)|\d{3.4}-)?\d{7,8}$
6 国内电话号码(0511-4405222、021-87888822)：\d{3}-\d{8}|\d{4}-\d{7}
7 身份证号：
15或18位身份证：^\d{15}|\d{18}$
15位身份证：^{18\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$}
18位身份证：^{19\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{4}$}
8 短身份证号码(数字、字母x结尾)：^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-
9X]{8,18}?$
9 帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^{20[a-zA-Z0-9_]{4,15}$}
10 密码(以字母开头，长度在6~18之间，只能包含字母、数字和下划线)：^21\w{5,17}$
11 强密码(必须包含大小写字母和数字的组合，不能使用特殊字符，长度在8-10之间)：^(?=.\d)(?=.
[a-z])(?=.*[A-Z]).{8,10}$
12 日期格式：^\d{4}-\d{1,2}-\d{1,2}
13 一年的12个月(01～09和1～12)：^(0?[1-9]|1[0-2])$
14 一个月的31天(01～09和1～31)：^((0?[1-9])|((1|2)[0-9])|30|31)$
15 钱的输入格式：
16 1.有四种钱的表示形式我们可以接受:“10000.00” 和 “10,000.00”, 和没有 “分” 的 “10000” 和
“10,000”：^22[0-9]*$
17 2.这表示任意一个不以0开头的数字,但是,这也意味着一个字符"0"不通过,所以我们采用下面的形式：
^(0|[1-9][0-9]*)$
18 3.一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号：^(0|-?[1-9][0-9]*)$
19 4.这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能
是负的吧.下面我们要加的是说明可能的小数部分：^{23+(.[0-9]+)?$}
20 5.必须说明的是,小数点后面至少应该有1位数,所以"10."是不通过的,但是 “10” 和 “10.2” 是通过
的：^{24+(.[0-9]{2})?$}
21 6.这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样：^{25+(.[0-9]{1,2})?$}
22 7.这样就允许用户只写一位小数.下面我们该考虑数字中的逗号了,我们可以这样：^26{1,3}(,[0-
9]{3})*(.[0-9]{1,2})?$
23 8.1到3个数字,后面跟着任意个逗号+3个数字,逗号成为可选,而不是必须：^([0-9]+|[0-9]{1,3}(,
[0-9]{3})*)(.[0-9]{1,2})?$
24 备注：这就是最终结果了,别忘了"+“可以用”*"替代如果你觉得空字符串也可以接受的话(奇怪,为什么?)
最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里

0-9 ↩︎
0-9 ↩︎
0-9 ↩︎
1-9 ↩︎
1-9 ↩︎
1-9 ↩︎
1-9 ↩︎
\u4e00-\u9fa5 ↩︎
A-Za-z0-9 ↩︎
A-Za-z0-9 ↩︎
A-Za-z ↩︎
A-Z ↩︎
a-z ↩︎
A-Za-z0-9 ↩︎
\u4E00-\u9FA5A-Za-z0-9_ ↩︎
\u4E00-\u9FA5A-Za-z0-9 ↩︎
\u4E00-\u9FA5A-Za-z0-9 ↩︎
1-9 ↩︎
1-9 ↩︎
a-zA-Z ↩︎
a-zA-Z ↩︎
1-9 ↩︎
0-9 ↩︎
0-9 ↩︎
0-9 ↩︎
0-9 ↩︎

本文标签：正定表达式语法 Java

版权声明：本文标题：Java语法之正定表达式的用法内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1727846672a1133171.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

Java语法之正定表达式的用法

正则表达式

相关概念

定义：

入门示例

作用

工具

字符集

定义

分类

字符类

自定义

默认|标准字符

量词

贪婪模式

边界

定义规则

示例

选择符与分组

选择符 |

分组

常用类

组成

Pattern

Matcher

字符串与正则

附录

1. 校验数字的表达式

2.校验字符的表达式

3. 特殊需求表达式

更多相关文章

Java正则相关

Day778.正则表达式问题 -Java 性能调优实战

Java中的正则表达式构造摘要

Java解惑4-40不情愿的构造器

Java语法之正定表达式的用法

正则表达式：基础详解以及在Java中的使用

【java】之正则表达式摘要

王道训练营 Java 部分测试

java 正则 reset_Java的正则表达式深入分析

Core Java 总结（异常类问题）

java 正则 实例_Java正则表达式实例详解

java正则表达式对象_Java正则表达式之Pattern类

Java教程:Java正则表达式详解

Java学习笔记#01 - Java英汉术语对照

java 正则表达式 大括号_java 正则表达式获取大括号之间的内容

Java 第五周学习总结

JAVA 正则表达式全攻略

大话java近代版本特性

java求职面试必会数据库知识

Java八股文总结（一）

发表评论

推荐文章

浅析android手游lua脚本的加密与解密

Android Studio 免安装版本

Active Session History (ASH) Performed An Emergency Flush Messages In The Alert Log

linux开机只能进入emergency mode的问题

游戏中的网络同步机制(二) 王者荣耀对帧同步的应用

热门文章

Socket_Tcp加密文件传输系统

STM32F103C8 无法调试的解决方案

手机python软件下载安装,手机python下载安装教程

Jetson Nano B01 安装Intel® RealSense™D405 ROS驱动包（详细版本，亲测可用）

网卡清空缓存命令_WIN10如何清除网络缓存图文教程

华硕原厂系统ROG枪神88plus原厂预装Win11家庭版专业版系统恢复带F12恢复重置

PMP笔记记录

谷歌浏览器Google如何设置站点弹出窗口

【Linux】冯诺依曼体系结构与操作系统概念理解

数仓(三)：分层设计 ODS-DWD-DWS-ADS

最新文章

浏览器验证码图片（缩略图）显示不出来问题解决办法

谷歌浏览器被2345主页强制绑定

解决Edge及Chrome等浏览器主页被篡改2345导航页

关于Google浏览器添加QQ电脑管家广告过滤插件出现2345主页拦截问题

判断浏览器中是否安装了某插件

怎么开启2345加速浏览器的过滤弹窗广告

打开火狐浏览器之后主页自动跳转到2345网站首页

浏览器被恶意设置主页http:www.2345.com?kunown的解决方法

2345 网址导航劫持 解决办法

java 正则实例_Java正则表达式实例详解

java 正则表达式大括号_java 正则表达式获取大括号之间的内容

2345 网址导航劫持解决办法

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载