Java基础知识正则表达式|电子爱好者

admin管理员组
文章数量:1579363

正则表达式

正则表达式是用来描述具有一定特征的字符串的特殊字符串。Regular Expression。

入门示例

ab*: a 若干个 b ->* 零个及以上，匹配: a ab abbbbb abbbbbbb 不能 bbbbb。

(cd)*: ()->组,改变了优先级，若干个 cd，匹配: “” cd cdcd cdcdcd

ab*(cd)*：a 若干个 b 和若干个 cd 匹配: a ab abbbbb abbbbbbb acd acdcd abbbbbcd abcd

ab*|(cd)*: |或的优先级低匹配: a ab cd

ab|c : 匹配 ab c

自定义

由 [] 组，只匹配一个，需要注意以下四个:

^ : 如果在第一个位置，表示取反的含义。

- ：表示一个区间即范围

] : 最近一个位置为:结束，如果要表示普通的]请加 \

\ : 转义

. 在字符类中不是代表任意的字符，代表自身 . 的含义。如果需要表示原有的含义，挪动位置或者加

\ 。

默认标准字符类

量词

贪婪模式

在匹配次数不定时如 *, {n,}, + 匹配字符越多越好，默认模式即”贪婪模式”

贪婪模式 greedy(匹配字符越多越好，可回溯)

? 懒惰模式 lazy reluctant (匹配字符越少越好，可回溯)

+ 独占模式 possessive(匹配字符越多越好,不可回溯) 用的较少 cokecolacoooooooooooooke

.*o –>贪婪模式 
.{2,}o–>贪婪模式 
.{2,}?o –>懒惰模式 
.{2,}+o –>独占模式，不可回溯 没有匹配到内容。 
<.+?> ->找出标签 不要标签内的内容。不是<.+> 
<[^>]+>->找出标签 不要标签内的内容。不是<.+>

阻止贪婪有两种方式

1、量词后面使用 ?

2、使用取反

边界

1)、边界不占用宽度，只是一个界限

2)、 ^ ：开始 \b ：单词边界 \B ：非单词边界 $ ：结束

^ ：多行代表每行头单行代表整个字符串的开始

$ : 多行代表每行尾单行代表字符串的结尾

\b : 匹配前面或后面的不是\w

\B : 匹配前面或后面的是\w

查找开头的 hello -> ^hello 
找出 独立的单词 world -> \bworld\b 
查找结尾的 world -> world$

选择符与分组

选择符|

| ->优先级低 ,满足匹配则停止，不会查找更优的方案

he|hello –>只匹配 he,不匹配 hello

hello|he->匹配 he 与 hello

分组（）

匹配 ab c -> ab|c

匹配 ab ac -> a(b|c)

只匹配 get -> \bget\b

匹配 get 和 getValue -> getvalue|get get(value)?

获取 and or -> \band\b|\bor\b \b(and|or)\b

反向引用： \ 内部默认缓存,从第一个左括号计算，编号为 1 开始。必须认识组编号，为 ( 的位置

非捕获组: (?:xxx) ：不缓存组

零宽断言

前瞻（Lookahead）后顾（Lookbehind）

常用类

public class TestReg01 { 
    public static void main(String[] args) { 
        String str ="^(\\d+)yjxxt"; 
        //转成正则表达式 
        Pattern p =Pattern.compile(str);
        //匹配 
        Matcher m=p.matcher("abcyjxxt11yjxxt22yjxxt"); 
        //是否匹配 
        System.out.println(m.find()); 
        m=p.matcher("11yjxxt22yjxxt"); 
        System.out.println(m.find()); 
        str ="((\\d+)(yjxxt))"; 
        p =Pattern.compile(str); 
        m=p.matcher("abcsxt11sxt22sxt"); 
        //获取匹配的字符串 
        while(m.find()){ 
            //组 
            System.out.println(m.groupCount()+"-->"+m.group()+"-->"+m.group(0)); 
            //0-->整个表达式 
            //从 1 开始获取 
            System.out.println(m.group(2)+"-->"+m.group(3)); } } }

附录

常用正则大全

1. 校验数字的表达式

1 数字：^[0-9]*$ 

2 n位的数字：^\d{n}$ 

3 至少n位的数字：^\d{n,}$ 

4 m-n位的数字：^\d{m,n}$ 

5 零和非零开头的数字：^(0|[1-9][0-9]*)$ 

6 非零开头的最多带两位小数的数字：^([1-9][0-9]*)+(.[0-9]{1,2})?$ 

7 带1-2位小数的正数或负数：^(\-)?\d+(\.\d{1,2})?$ 

8 正数、负数、和小数：^(\-|\+)?\d+(\.\d+)?$ 

9 有两位小数的正实数：^[0-9]+(.[0-9]{2})?$ 

10 有1~3位小数的正实数：^[0-9]+(.[0-9]{1,3})?$ 

11 非零的正整数：^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$ 

12 非零的负整数：^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$ 

13 非负整数：^\d+$ 或 ^[1-9]\d*|0$ 

14 非正整数：^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$ 

15 非负浮点数：^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ 

16 非正浮点数：^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1- 

9]\d*))|0?\.0+|0$ 

17 正浮点数：^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0- 

9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$ 

18 负浮点数：^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)| 

([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$ 

19 浮点数：^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

2. 校验字符的表达式

1 汉字：^[\u4e00-\u9fa5]{0,}$ 

2 英文和数字：^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$ 

3 长度为3-20的所有字符：^.{3,20}$ 

4 由26个英文字母组成的字符串：^[A-Za-z]+$ 

5 由26个大写英文字母组成的字符串：^[A-Z]+$ 

6 由26个小写英文字母组成的字符串：^[a-z]+$ 

7 由数字和26个英文字母组成的字符串：^[A-Za-z0-9]+$ 

8 由数字、26个英文字母或者下划线组成的字符串：^\w+$ 或 ^\w{3,20}$ 

9 中文、英文、数字包括下划线：^[\u4E00-\u9FA5A-Za-z0-9_]+$ 

10 中文、英文、数字但不包括下划线等符号：^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00- 

\u9FA5A-Za-z0-9]{2,20}$ 

11 可以输入含有^%&',;=?$\"等字符：[^%&',;=?$\x22]+ 

12 禁止输入含有~的字符：[^~\x22]+

3. 特殊需求表达式

1 Email地址：^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$ 

2 域名：[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.? 

3 InternetURL：[a-zA-z]+://[^\s]* 或 ^https://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ 

4 手机号码：^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$ 

5 电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX- 

XXXXXXXX"、"XXXXXXX"和"XXXXXXXX)：^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$ 

6 国内电话号码(0511-4405222、021-87888822)：\d{3}-\d{8}|\d{4}-\d{7} 

7 身份证号：

15或18位身份证：^\d{15}|\d{18}$ 

15位身份证：^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$ 

18位身份证：^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0- 

1])\d{4}$ 

8 短身份证号码(数字、字母x结尾)：^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0- 

9X]{8,18}?$ 

9 帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 

10 密码(以字母开头，长度在6~18之间，只能包含字母、数字和下划线)：^[a-zA-Z]\w{5,17}$ 

11 强密码(必须包含大小写字母和数字的组合，不能使用特殊字符，长度在8-10之间)：^(?=.*\d)(?=.* 

[a-z])(?=.*[A-Z]).{8,10}$ 

12 日期格式：^\d{4}-\d{1,2}-\d{1,2} 

13 一年的12个月(01～09和1～12)：^(0?[1-9]|1[0-2])$ 

14 一个月的31天(01～09和1～31)：^((0?[1-9])|((1|2)[0-9])|30|31)$ 

15 钱的输入格式： 

16 1.有四种钱的表示形式我们可以接受:"10000.00" 和 "10,000.00", 和没有 "分" 的 "10000" 和 

"10,000"：^[1-9][0-9]*$ 

17 2.这表示任意一个不以0开头的数字,但是,这也意味着一个字符"0"不通过,所以我们采用下面的形式： 

^(0|[1-9][0-9]*)$ 

18 3.一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号：^(0|-?[1-9][0-9]*)$ 

19 4.这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能 

是负的吧.下面我们要加的是说明可能的小数部分：^[0-9]+(.[0-9]+)?$ 

20 5.必须说明的是,小数点后面至少应该有1位数,所以"10."是不通过的,但是 "10" 和 "10.2" 是通过 

的：^[0-9]+(.[0-9]{2})?$ 

21 6.这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样：^[0-9]+(.[0-9]{1,2})?$ 

22 7.这样就允许用户只写一位小数.下面我们该考虑数字中的逗号了,我们可以这样：^[0-9]{1,3}(,[0- 

9]{3})*(.[0-9]{1,2})?$ 

23 8.1到3个数字,后面跟着任意个 逗号+3个数字,逗号成为可选,而不是必须：^([0-9]+|[0-9]{1,3}(, 

[0-9]{3})*)(.[0-9]{1,2})?$ 

24 备注：这就是最终结果了,别忘了"+"可以用"*"替代如果你觉得空字符串也可以接受的话(奇怪,为什么?) 

最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里25 xml文件：^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$ 

26 中文字符的正则表达式：[\u4e00-\u9fa5] 

27 双字节字符：[^\x00-\xff] (包括汉字在内，可以用来计算字符串的长度(一个双字节字符长度计2， 

ASCII字符计1)) 

28 空白行的正则表达式：\n\s*\r (可以用来删除空白行) 

29 HTML标记的正则表达式：<(\S*?)[^>]*>.*?|<.*? /> (网上流传的版本太糟糕，上面这个也仅仅能 

部分，对于复杂的嵌套标记依旧无能为力) 

30 首尾空白字符的正则表达式：^\s*|\s*$或(^\s*)|(\s*$) (可以用来删除行首行尾的空白字符(包括 

空格、制表符、换页符等等)，非常有用的表达式) 

31 腾讯QQ号：[1-9][0-9]{4,} (腾讯QQ号从10000开始) 

32 中国邮政编码：[1-9]\d{5}(?!\d) (中国邮政编码为6位数字) 

33 IP地址：\d+\.\d+\.\d+\.\d+ (提取IP地址时有用)

长度计2，

ASCII字符计1))

28 空白行的正则表达式：\n\s*\r (可以用来删除空白行)

29 HTML标记的正则表达式：<(\S*?)[^>]>.?|<.*? /> (网上流传的版本太糟糕，上面这个也仅仅能

部分，对于复杂的嵌套标记依旧无能为力)

30 首尾空白字符的正则表达式：^\s*|\s*KaTeX parse error: Undefined control sequence: \s at position 4: 或(^\̲s̲*)|(\s*) (可以用来删除行首行尾的空白字符(包括

空格、制表符、换页符等等)，非常有用的表达式)

31 腾讯QQ号：[1-9][0-9]{4,} (腾讯QQ号从10000开始)

32 中国邮政编码：[1-9]\d{5}(?!\d) (中国邮政编码为6位数字)

33 IP地址：\d+.\d+.\d+.\d+ (提取IP地址时有用)

本文标签：基础知识正则表达式 Java

版权声明：本文标题：Java基础知识正则表达式内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1727846690a1133174.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

Java基础知识正则表达式

正则表达式

附录

更多相关文章

Java_正则表达式

java正则表达式实例_Java正则表达式的实例操作指南

Java常用API

java正则 pp_java正则表达式彻底研究

Java中的正则表达式

正则表达式大全

Day14-正则表达式及常用类

java正则u_Java 正则表达式

探究正则表达式性能优化

长文慎点，Java学习笔记（四）

Java学习笔记#01 - Java英汉术语对照

java 正则表达式 大括号_java 正则表达式获取大括号之间的内容

java正则表达式语法详解及其使用代码实例 (转)

android开发中常用的正则表达式,Android开发之正则表达式的使用1

Perl正则表达式详解

大话java近代版本特性

java求职面试必会数据库知识

C语言基础知识入门（2022年）

Java八股文总结（一）

Java入门到精通(干就完了)

发表评论

推荐文章

[Proteus8]使用proteus8对单片机进行模拟仿真,记录方波图出现的过程

windows和Ubuntu双系统安装详细步骤

推荐几个资源搜索网站

中国科学院大学研究生学术英语-全文-翻译（Unit 1）

从关键新闻和最新技术看AI行业发展（2024.2.26-3.10第十八期） |【WeThinkIn老实人报】

热门文章

bios 设置定时开机

在安卓手机上安装完整kali linux系统

OGG转MP3音频格式转换：6种免费音频转换器推荐

【问题解决】Ubuntu开机进入you are in emergency mode

Win10家庭版、专业版、企业版、教育版各版本功能区别对照表

值得收藏的网盘搜索引擎&amp;网盘搜索工具

elementary OS 5 Juno (Pantheon) 安装后配置总结（干货很多）

Eclipse中查找替换所使用的正则表达式的定义

使用谷歌浏览器调试WEB前端的一些必备调试技巧

APP功能测试点（全）

最新文章

Chrome浏览器主页被hao123、360和2345篡改恢复到默认的方法

联想小新的火狐浏览器被2345恶意纂改解决方案

win11桌面出现ie图标且无法删除，打开是2345主页：解决方法

安全防护，IE浏览器主页被2345劫持的后续操作

彻底卸载2345系列

2345加速浏览器有哪些特点

解决谷歌浏览器首页被2345篡改问题

解决IE浏览器被2345劫持问题

解决浏览器主页被2345劫持的简单方法

Google Chrome浏览器被2345绑定首页，尝试各种办法都无法改回，一打开就跳转？本修改方法试用于“联想笔记本“。

使用wangEditor遇到的浏览器不兼容问题

怎么浏览URL的PDF文件呢

浏览器主页被篡改为hao123、360和2345解决办法

Microsoft Edge打开主页就是2345界面

Chrome谷歌浏览器打开默认是2345导航的解决办法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

java 正则表达式大括号_java 正则表达式获取大括号之间的内容

值得收藏的网盘搜索引擎&网盘搜索工具

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载