Java 正则表达式:语法讲解和常用表达式汇总

article/2025/8/26 8:11:10

原创博文,欢迎转载,转载时请务必附上博文链接,感谢您的尊重。

正则表达式定义了字符串的模式;
正则表达式可以用来搜索、编辑或处理文本;
正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别。

正文

使用正则表达式需要引入 java.util.regex 包,我们就从这里入手讲解:
java.util.regex
java.util.regex 包主要包括以下三个类:

  • Pattern 类:
    pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。

  • Matcher 类:
    Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。
    matches方法

  • PatternSyntaxException:
    PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。

以下实例中演示了正则表达式的使用:

/* import java.util.regex.*; */
public void RegexExample() {String input = "I am Jimmy from mp.csdn.net";String regex = ".*csdn.*";// 方式1:String 的 matches 方法boolean flag1 = input.matches(regex);// 方式2:Pattern 对象的 matches 方法boolean flag2 = Pattern.matches(regex, input);// 方式3: Matcher 对象的 matches 方法Pattern p = Pattern.compile(regex);Matcher m = p.matcher(input);boolean flag3 = m.matches();System.out.println("字符串中是否包含了'csdn'子字符串? " + flag1 );System.out.println("字符串中是否包含了'csdn'子字符串? " + flag2 );System.out.println("字符串中是否包含了'csdn'子字符串? " + flag3 );
}
输出结果:字符串中是否包含了'csdn'子字符串? true字符串中是否包含了'csdn'子字符串? true字符串中是否包含了'csdn'子字符串? true

从上面的代码中,你会看到一个现象:

  • 3种方式的底层实现其实是一样的,只是封装的成度不一样,实际也确实如此;
  • 明白方式3,更有助于理解正则的执行过程;

matches 和 lookingAt 方法

matches() 和 lookingAt() 方法都用来尝试匹配一个输入序列模式。不同的是 matches() 要求整个序列都匹配,而 lookingAt() 不要求;
lookingAt() 方法虽然不需要整句都匹配,但是需要从第一个字符开始匹配;
这两个方法经常在输入字符串的开始使用。

public void matchAndLookingExample() {String REGEX = "foo";String INPUT = "foooooooooo";String INPUT2 = "ooooofoooooo";Pattern pattern = Pattern.compile(REGEX);Matcher matcher = pattern.matcher(INPUT);Matcher matcher2 = pattern.matcher(INPUT2);System.out.println("lookingAt(): "+matcher.lookingAt());System.out.println("matches(): "+matcher.matches());System.out.println("lookingAt(): "+matcher2.lookingAt());
}
输出结果:lookingAt(): true	// 开头匹配matches(): false	// 不是整个序列都匹配lookingAt(): false	// 开头不匹配

正则表达式语法

在其他语言中,\\ 表示:我想要在正则表达式中插入一个普通的(字面上的)反斜杠,请不要给它任何特殊的意义。

在 Java 中,\\ 表示:我要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义。

所以,在其他的语言中(如Perl),一个反斜杠 \ 就足以具有转义的作用,而在 Java 中正则表达式中则需要有两个反斜杠才能被解析为其他语言中的转义作用。也可以简单的理解在 Java 的正则表达式中,两个 \\ 代表其他语言中的一个 \,这也就是为什么表示一位数字的正则表达式是 \\d,而表示一个普通的反斜杠是 \\\\。

字符说明
^匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与"\n"或"\r"之后的位置匹配。
$匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与"\n"或"\r"之前的位置匹配。
*零次或多次匹配前面的字符或子表达式。例如,zo* 匹配"z"和"zoo"。* 等效于 {0,}。
+一次或多次匹配前面的字符或子表达式。例如,"zo+"与"zo"和"zoo"匹配,但与"z"不匹配。+ 等效于 {1,}。
?零次或一次匹配前面的字符或子表达式。例如,"do(es)?“匹配"do"或"does"中的"do”。? 等效于 {0,1}。
{n}n 是非负整数。正好匹配 n 次。例如,"o{2}"与"Bob"中的"o"不匹配,但与"food"中的两个"o"匹配。
{n,}n 是非负整数。至少匹配 n 次。例如,"o{2,}“不匹配"Bob"中的"o”,而匹配"foooood"中的所有 o。"o{1,}“等效于"o+”。"o{0,}“等效于"o*”。
{n,m}m 和 n 是非负整数,其中 n <= m。匹配至少 n 次,至多 m 次。例如,"o{1,3}"匹配"fooooood"中的头三个 o。‘o{0,1}’ 等效于 ‘o?’。注意:您不能将空格插入逗号和数字之间。
xy
[xyz]字符集。匹配包含的任一字符。例如,"[abc]“匹配"plain"中的"a”。
[ ^xyz]反向字符集。匹配未包含的任何字符。例如,"[^abc]“匹配"plain"中"p”,“l”,“i”,“n”。
[a-z]字符范围。匹配指定范围内的任何字符。例如,"[a-z]"匹配"a"到"z"范围内的任何小写字母。
\d数字字符匹配。等效于 [0-9]。
\D非数字字符匹配。等效于 [ ^0-9]。
\w匹配任何字类字符,包括下划线。与"[A-Za-z0-9_]"等效。
\W与任何非单词字符匹配。与"[ ^A-Za-z0-9_]"等效。

常用的正则表达式

说明正则表达式
一、校验数字的表达式 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
数字^ [0-9]*$
n位的数字^\d{n}$
至少n位的数字^\d{n,}$
m-n位的数字^\d{m,n}$
非零开头的最多带两位小数的数字^([1-9][0-9]*)+(.[0-9]{1,2})?$
带1-2位小数的正数或负数^(-)?\d+(.\d{1,2})?$
有1~3位小数的正实数^ [0-9]+(.[0-9]{1,3})?$
非负整数^\d+$
非正整数^((-\d+)
二、校验字符的表达式 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
汉字^ [\u4e00-\u9fa5]{0,}$
英文和数字^ [A-Za-z0-9]+$
长度为3-20的所有字符^.{3,20}$
由26个英文字母组成的字符串^ [A-Za-z]+$
由数字、26个英文字母或者下划线组成的字符串^\w+$ 或 ^\w{3,20}$
中文、英文、数字包括下划线^ [\u4E00-\u9FA5A-Za-z0-9_]+$
中文、英文、数字但不包括下划线等符号^ [\u4E00-\u9FA5A-Za-z0-9]+$
可以输入含有^%&’,;=?$"等字符[^%&’,;=?$\x22]+
禁止输入含有~的字符[^~\x22]+
三、特殊需求表达式 ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
Email地址^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$
域名[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
InternetURL[a-zA-z]+://[^\s]* 或 ^http://([\w-]+.)+[\w-]+(/[\w-./?%&=]*)?$
手机号码^(13[0-9]
电话号码^((\d{3,4}-)
身份证号(15位、18位数字)^\d{15}
短身份证号码(数字、字母x结尾)^([0-9]){7,18}(x
帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线)^ [a-zA-Z][a-zA-Z0-9_]{4,15}$
密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线)^ [a-zA-Z]\w{5,17}$
日期格式^\d{4}-\d{1,2}-\d{1,2}
中国邮政编码[1-9]\d{5}(?!\d) (中国邮政编码为6位数字)
腾讯QQ号[1-9][0-9]{4,} (腾讯QQ号从10000开始)
IP地址\d+.\d+.\d+.\d+ (提取IP地址时有用)
中文字符的正则表达式[\u4e00-\u9fa5]

我是IT无知君,您的点赞、评论和关注,是我继续创作的不懈动力。
学无止境,气有浩然,让我们一起加油,乘风破浪,江湖有缘再见!!


http://chatgpt.dhexx.cn/article/3Wwj8ryn.shtml

相关文章

25个常用的正则表达式汇总

来源 | http://www.fly63.com/ 正则表达式非常有用。正则表达式可用于每种语言。就像 json 一样&#xff0c;它们是通用的。在日常开发中&#xff0c;了解一些常用的正则表达式可以大大提高你的工作效率。 今天&#xff0c;我给大家分享25个常用的正则表达式&#xff0c;希望大…

正则表达式基本语法

一、核心作用&#xff1a; –文本的复杂处理 二、正则表达式的定义&#xff1a; 描述一个规则&#xff0c;通过这个规则可以匹配一类字符串 三、正则表达式的优势和用途&#xff1a; 优势&#xff1a;强大而灵活的文本处理工具 用途&#xff1a;大部分编程语言、数据库、文…

正则表达式的语法规则

一、行定位符&#xff08;^和$&#xff09; 行定位符就是用来描述字串的边界。“^”表示行的开始&#xff1b;“$”表示行的结尾。如&#xff1a; ^tm : 该表达式表示要匹配字串tm的开始位置是行头&#xff0c;如tm equal Tomorrow Moon就可以匹配 tm$ : 该表达式表示要匹配字串…

正则表达式常用语法解析

正则表达式常用语法解析 什么是正则表达式正则表达式之元字符匹配位置的元字符 ^、$、/b匹配字符的元字符 .、\w、\W、\s、\S、\d、\D 正则表达式之文字匹配字符类字符转义反义 正则表达式之限定符正则表达式之字符的运算替换分组反向引用零宽度断言负向零宽度断言优先级顺序 什…

Python正则表达式大全

定义&#xff1a;正则表达式是对字符串&#xff08;包括普通字符&#xff08;例如&#xff0c;a 到 z 之间的字母&#xff09;和特殊字符&#xff08;称为“元字符”&#xff09;&#xff09;操作的一种逻辑公式&#xff0c;就是用事先定义好的一些特定字符、及这些特定字符的组…

JS正则表达式语法大全(非常详细)

前面几节讲解了如何在 JavaScript 中使用正则表达式&#xff0c;以及如何执行匹配&#xff0c;本节就来讲一下正则表达式的具体语法。 正则表达式是一种通用的工具&#xff0c;在 JavaScript、PHP、Java、Python、C 等几乎所有的编程语言中都能使用&#xff1b;但是&#xff0c…

正则表达式语法及例子

正则表达式的语法规则 一、行定位符&#xff08;^和$&#xff09; 行定位符就是用来描述字串的边界。“^”表示行的开始&#xff1b;“$”表示行的结尾。如&#xff1a; ^tm : 该表达式表示要匹配字串tm的开始位置是行头&#xff0c;如tm equal Tomorrow Moon就可以匹配 tm$ :…

最全的常用正则表达式大全

一、校验数字的表达式 1 数字&#xff1a;^[0-9]*$ 2 n位的数字&#xff1a;^\d{n}$ 3 至少n位的数字&#xff1a;^\d{n,}$ 4 m-n位的数字&#xff1a;^\d{m,n}$ 5 零和非零开头的数字&#xff1a;^(0|[1-9][0-9]*)$ 6 非零开头的最多带两位小数的数字&#xff1a;^([1-9][…

正则表达式的语法

正则表达式语法简介  正则表达式是独立于任何语言的&#xff0c;虽然不同的 语言中其语法略有不同。  正则表达式的语法可以分为 • 特殊字符 • 边界匹配符 • 逻辑操作符 • 量词等  这些基本的语法规则合成使用&#xff0c;共同构成了正 则表达式强大的表示和匹配功能…

正则表达式基础语法大全

正则表达式基础语法 1.普通字符&#xff1a; 字母、数字、汉子、下划线、以及没有特殊定义的标点符号&#xff0c;都是“普通字符”。表达式中的普通字符&#xff0c;在匹配一个字符串的时候&#xff0c;匹配与之相同的一个字符。 2.简单的转义字符&#xff1a; 3.标准字符集…

最全常用正则表达式大全

一、校验数字的表达式 1. 数字&#xff1a;^[0-9]*$ 2. n位的数字&#xff1a;^\d{n}$ 3. 至少n位的数字&#xff1a;^\d{n,}$ 4. m-n位的数字&#xff1a;^\d{m,n}$ 5. 零和非零开头的数字&#xff1a;^(0|[1-9][0-9]*)$ 6. 非零开头的最多带两位小数的数字&#xff1a;^…

正则表达式的语法汇总

文章目录 1.正则表达式的基本语法1.1两个特殊符号 ^ 和 $^ 正则表达式的起始符$ 正则表达式的结束符^$ 结合使用不使用 ^$ 1.2 出现次数的表示符号 * &#xff1f;* 表示出现 0次 或者 至少1次 表示出现 至少1次? 表示出现 0次 或者 1次 1.3 指定出现次数的范围 {}使用{m,n} …

Java 集合List转 Map 和Map转List的方法总结(举例说明!)

最近遇到了一个场景是&#xff0c;要将从数据库中查出的List<bean>转换为List<map>然后再取map中的value&#xff0c;最后把所有的value写到Excel中。由于这个bean的属性太多了&#xff0c;我最开始没有采用list转map的方式取获取value&#xff0c;而是在for循环中…

Java8:list转Map

小故事 最近项目中&#xff0c;因为业务需要&#xff0c;我使用了for循环进行List转Map&#xff0c;项目经理看到了&#xff0c;深深的”鄙视“了我&#xff0c;说你怎么写这么古老的写法&#xff0c;一点不优雅。于是我就想到了Java8的新特性&#xff0c;使用stream流进行操作…

Java8 Stream(11)List转Map

一、前言 对于聚合统计可以参考下面博客。 Java8 Stream&#xff08;12&#xff09;Collectors 分组统计 详解 开发中&#xff0c;List转Map是非常常见的操作&#xff0c;例如&#xff1a; List<T> 转 Map<String, T>List<T> 转 Map<String, List<T&…

APP移动测试用例总结,总有你要用到的

目录 前言 一、首先是测试资源确认及准备 二、测试用例的设计与评审 三、UI测试 四、功能测试 五、中断测试 六、兼容性及适配测试 七、性能测试 八、稳定性测试 九、测试分析及测试报告输出 十、移动端测试用例的实践经验 总结 重点&#xff1a;配套学习资料和…

设计水杯,门锁的测试用例

测试用例公式&#xff1a; 功能测试 界面测试 性能测试 兼容性测试 易用性测试 安全测试 一般用脑图或者Excel来编写测试用例 百度脑图 - 便捷的思维工具 水杯的测试用例&#xff1a; 门锁的测试用例&#xff1a; 测试用例越多越好吗&…

APP 测试用例(大部分 APP 通用)

APP 测试用例 根据 场景设计法 来设计测试用例 安装与卸载权限设置软件更新登录与注册网络环境运行日历控件异常测试兼容性测试