正则中文匹配

article/2025/9/11 18:55:20

这篇文章主要讲如何使用正则匹配中文字符,中文正则表达式的匹配规则不像其他正则规则一样容易记住,下面一起看看这个中文正则表达式是怎么样的。
 

\w匹配的仅仅是中文,数字,字母,对于国人来讲,仅匹配中文时常会用到,见下

匹配中文字符的正则表达式: [\u4e00-\u9fa5]

或许你也需要匹配双字节字符,中文也是双字节的字符

匹配双字节字符(包括汉字在内):[^\x00-\xff]

注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

更多常用正则表达式匹配规则:

英文字母:[a-zA-Z]数字:[0-9]

匹配中文,英文字母和数字及_:

//code from http://caibaojian.com/zhongwen-regexp.html
^[\u4e00-\u9fa5_a-zA-Z0-9]+$

同时判断输入长度:·

[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$

1、一个正则表达式,只含有汉字、数字、字母、下划线不能以下划线开头和结尾:

^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$

其中:

^ 与字符串开始的地方匹配

(?!_)  不能以_开头(?!.*?_$)  不能以_结尾[a-zA-Z0-9_\u4e00-\u9fa5]+  至少一个汉字、数字、字母、下划线

$  与字符串结束的地方匹配

放在程序里前面加@,否则需要\\进行转义 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$"(或者:@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " )

2、只含有汉字、数字、字母、下划线,下划线位置不限:

^[a-zA-Z0-9_\u4e00-\u9fa5]+$

3、由数字、26个英文字母或者下划线组成的字符串

^\w+$

4、2~4个汉字

@"^[\u4E00-\u9FA5]{2,4}$";

5、^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$

用:(Abc)+ 来分析: XYZAbcAbcAbcXYZAbcAb

 


http://chatgpt.dhexx.cn/article/PWtWAjr9.shtml

相关文章

js正则中文

hi&#xff0c;大家好   今天跟小伙伴们浅谈以下如何用正则表示中文以及如何去运用。众所周知中文在计算机中是不能进行存储的。那我们是以什么办法让我们和计算机进行更好的沟通呢&#xff1f; 常用的几种中文编码格式 utf-8编码   utf-8又称“万国码”&#xff0c;可以同…

python正则如何匹配中文汉字

正则表达式匹配中文汉字&#xff0c;在实际应用中十分常见。 比如&#xff1a;爬虫网页文本提取、验证用户输入标准等。 以下面文本字符串为例&#xff0c;匹配出astr这个字符串中的所有汉字。 import re astr aaaaa何时when 杖尔看see南雪snow&#xff0c;我me与梅花plum bl…

Guava: Joiner

Joiner 字符串拼接对象 on 基本实例 Joiner.on(" ").join("四川省","成都市","金牛区").toString() 1 on 以空格为分隔符join内是拼接的对象:迭代器对象、数组、可变参数等 result 四川省 成都市 金牛区 1 特殊处理 动态拼接…

Google Guava中Joiner用法

Google Guava中Joiner用法 一&#xff1a;Google Guava的下载地址链接&#xff1a; Google Guava的jar包下载地址&#xff1a;https://pan.baidu.com/s/1B2IjhOlrulOgwceG1TehKQ 密码&#xff1a;2qha 1&#xff1a;java application项目引入下载的jar包。 2&#xff1a;we…

【第一章】google guava 之 Joiner学习

Joiner是将数组按照某分隔符分隔返回字符串 com.google.common.base.Joiner#on(java.lang.String) 用户构造函数设置用什么字符分隔 com.google.common.base.Joiner#appendTo(A, java.lang.Iterable<? extends java.lang.Object>) 用于传入一个集合&#xff0c;然后通…

001 Joiner

一.概述 本类的名称的含义就是连接器,可以帮助我们实现数据(对象)的连接. 二 . 对象的创建   Testpublic void test1() {Joiner joiner Joiner.on(",");} 创建一个Joiner对象,我们可以使用on()方法,含义就是会用这个分隔符进行连接数据. 我们可以发现我们实际上都…

mp4 joiner linux,MP4Joiner怎么用?使用MP4Joiner快速合并多个mp4视频文件的方法介绍

如何使用MP4Joiner快速合并多个mp4视频文件&#xff1f;MP4Joiner是一款专业小巧的MP4视频合并软件&#xff0c;支持将多个MP4视频合并为一个&#xff0c;支持自定义设置视频的前后顺序&#xff0c;速度非常快&#xff0c;也不会损坏视频质量&#xff0c;非常不错。接下来小编就…

1、Guava-连接器Joiner使用和源码分析

Guava-连接器Joiner使用和源码分析 1.Guava-连接器Joiner使用和源码分析1.1 使用版本1.2 代码示例1.2.1 基本使用1.2.2 集合中Null导致空指针异常1.2.3 忽略集合中的null1.2.4 用默认值代替集合中的null1.2.5 添加至Appendable中1.2.6 连接Map中的key和value1.2.7 使用Stream流…

如何在Linux中使用命令行卸载软件

所有的Linux系统中都带有包管理器命令&#xff0c;比如Ubuntu发行版里的dpkg命令&#xff0c;CentOS/RHEL发行版里带的yum和rpm命令&#xff0c;下面我就以自己比较熟悉的CentOS/RHEL系列发行版来讲解&#xff0c;以nginx这个常用的web软件为例。 查看系统上是否安装了nginx …

Linux如何使用命令行卸载安装包

严格地说&#xff0c;Linux是内核。Linux发行版由Linux内核、安装脚本、shell、编译器、桌面和其他组件组成。因此&#xff0c;卸载包或软件的Linux命令取决于Linux发行版的名称和类型。本文说明如何使用命令行在各种Linux发行版上卸载软件包或软件。 首先&#xff0c;您需要找…

Linux中使用rpm命令卸载软件

1、先使用rpm -qa | grep 软件包名称 例如卸载mysql&#xff1a; rpm -qa | grep mysql 2、使用rpm -e --nodeps 文件包名称 rpm -e --nodeps mysql-5.0.77-4.el5_6.6 rpm -e --nodeps libdbi-dbd-mysql-0.8.1a-1.2.2 rpm -e --nodeps mysql-5.0.77-4.el5_6.6 rpm -e --node…

Linux下如何彻底删除(卸载)MySQL?

首先连接操作系统&#xff0c;切换到root用户。 如果是使用yum安装的mysql&#xff0c;使用如下命令进行卸载&#xff08;不能确定使用何种方式安装的mysql情况下&#xff0c;按后续步骤一一进行处理即可&#xff09;&#xff1a; yum remove mysql mysql-server mysql-libs c…

Linux rpm命令详解,Linux安装、卸载、更新软件

「作者主页」&#xff1a;士别三日wyx 「作者简介」&#xff1a;CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 rpm命令详解 一、常用操作1、安装软件1.1、默认安装路径 2、更新软件3、卸载软件4、查询已经安装的软件 二、实用技巧三、rpm包命名规则 作用…

Linux 卸载程序

windows中安装了软件&#xff0c;可以通过图形化界面很方便的卸载&#xff0c;那么linux命令行的方式如何卸载程序呢&#xff1f; 首先看看安装了哪些程序 rpm -q -a #查询所有已安装的软件-q:query 查询 -a:all 所有 查询出了所有已安装的程序 所以需要过滤多自己需要卸载…

Linux软件的卸载

1.安装说明 configure作用:是源码安装软件时配置环境用的 他根据你的配置选项和你的系统情况生成makefile文件 为make 做准备。 最常用的参数: ./configure –prefix 作用: 不指定prefix&#xff0c;则可执行文件默认放在/usr/local/bin&#xff0c;库文件默认放在/usr/local…

Linux 卸载软件

一、卸载软件 1.输入命令 dpkg --list 查看已安装的软件 记住要卸载的软件的名字 sudo apt-get remove –-purge 要卸载的软件的名字 #卸载软件同时删除配置文件 sudo apt-get remove 要卸载的软件的名字 #卸载该软件 出现此界面为卸载并删除配置文件成功。 二、apt缓存删…

【Ubuntu】【Linux】命令卸载软件

Ubuntu命令卸载软件_李柏林的博客-CSDN博客_ubuntu卸载程序1.打开一个终端&#xff0c;输入dpkg --list ,按下Enter键&#xff0c;终端输出以下内容&#xff0c;显示的是你电脑上安装的所有软件。 2.在终端中找到你需要卸载的软件的名称&#xff0c;列表是按照首字母排序的。 3…

用sizeof来计算数组元素个数

一般大家常见的是用sizeof来求不同数据类型的空间大小&#xff0c;如&#xff1a; 但是我们也可以用其来计算数组元素个数&#xff0c;如下&#xff1a; 从数据可得该数组元素个数为8个。

详解strlen和sizeof在数组中的使用(四)

目录 一、前言 二、sizeof在指针中的试题&#xff1a; 解析&#xff1a; vs编辑器验证&#xff1a; 32位平台&#xff1a; 64位平台&#xff1a; 一、前言 前面一节我们已经讲过了有关于strlen在字符数组中的使用&#xff0c;以及strlen使用时候的注意事项 譬如只能在字符…

C++基础(十五)sizeof的用法 计算数组长度

sizeof本身是C语言的一个运算符&#xff0c;但也被C支持&#xff0c;且很多C代码中经常会出现。 sizeof可以很容易计算一个数组的长度&#xff0c;这在数组作为参数的函数中很有用(数组作为函数参数&#xff0c;传入的其实是首元素的地址&#xff0c;必须带上数组的实际长度作…