python正则如何匹配中文汉字

article/2025/9/11 23:56:10

正则表达式匹配中文汉字,在实际应用中十分常见。
比如:爬虫网页文本提取、验证用户输入标准等。
以下面文本字符串为例,匹配出astr这个字符串中的所有汉字。

import re
astr = '''aaaaa何时when 杖尔看see南雪snow,我me与梅花plum blossom两白头'''

下面介绍两种方法(本文环境为python3)
一、使用Unicode编码来匹配中文
常见的中文Unicode编码范围:\u4e00-\u9fa5
实现匹配代码:re.findall(’[\u4e00-\u9fa5]’, astr)

import re
astr = '''aaaaa何时when 杖尔看see南雪snow,我me与梅花plum blossom两白头'''
res = re.findall('[\u4e00-\u9fa5]', astr)
print(res)

匹配结果:
在这里插入图片描述
二、直接使用中文汉字实现中文匹配
没使用过可能还真不知道,中文匹配还可以这样
实现匹配代码:re.findall(’[一-龥]’, astr)

import re
astr = '''aaaaa何时when 杖尔看see南雪snow,我me与梅花plum blossom两白头'''
res = re.findall('[一-龥]', astr)
print(res)

匹配结果:
在这里插入图片描述
注:其实这里“一”对应的Unicode编码就是“\u4e00”,“龥”(yù)对应的Unicode编码就是“\u9fa5”。

常见非英文字符Unicode编码范围:
u4e00-u9fa5 (中文)
u0800-u4e00 (日文)
uac00-ud7ff(韩文)


http://chatgpt.dhexx.cn/article/ANgVwj3Q.shtml

相关文章

Guava: Joiner

Joiner 字符串拼接对象 on 基本实例 Joiner.on(" ").join("四川省","成都市","金牛区").toString() 1 on 以空格为分隔符join内是拼接的对象:迭代器对象、数组、可变参数等 result 四川省 成都市 金牛区 1 特殊处理 动态拼接…

Google Guava中Joiner用法

Google Guava中Joiner用法 一:Google Guava的下载地址链接: Google Guava的jar包下载地址:https://pan.baidu.com/s/1B2IjhOlrulOgwceG1TehKQ 密码:2qha 1:java application项目引入下载的jar包。 2:we…

【第一章】google guava 之 Joiner学习

Joiner是将数组按照某分隔符分隔返回字符串 com.google.common.base.Joiner#on(java.lang.String) 用户构造函数设置用什么字符分隔 com.google.common.base.Joiner#appendTo(A, java.lang.Iterable<? extends java.lang.Object>) 用于传入一个集合&#xff0c;然后通…

001 Joiner

一.概述 本类的名称的含义就是连接器,可以帮助我们实现数据(对象)的连接. 二 . 对象的创建   Testpublic void test1() {Joiner joiner Joiner.on(",");} 创建一个Joiner对象,我们可以使用on()方法,含义就是会用这个分隔符进行连接数据. 我们可以发现我们实际上都…

mp4 joiner linux,MP4Joiner怎么用?使用MP4Joiner快速合并多个mp4视频文件的方法介绍

如何使用MP4Joiner快速合并多个mp4视频文件&#xff1f;MP4Joiner是一款专业小巧的MP4视频合并软件&#xff0c;支持将多个MP4视频合并为一个&#xff0c;支持自定义设置视频的前后顺序&#xff0c;速度非常快&#xff0c;也不会损坏视频质量&#xff0c;非常不错。接下来小编就…

1、Guava-连接器Joiner使用和源码分析

Guava-连接器Joiner使用和源码分析 1.Guava-连接器Joiner使用和源码分析1.1 使用版本1.2 代码示例1.2.1 基本使用1.2.2 集合中Null导致空指针异常1.2.3 忽略集合中的null1.2.4 用默认值代替集合中的null1.2.5 添加至Appendable中1.2.6 连接Map中的key和value1.2.7 使用Stream流…

如何在Linux中使用命令行卸载软件

所有的Linux系统中都带有包管理器命令&#xff0c;比如Ubuntu发行版里的dpkg命令&#xff0c;CentOS/RHEL发行版里带的yum和rpm命令&#xff0c;下面我就以自己比较熟悉的CentOS/RHEL系列发行版来讲解&#xff0c;以nginx这个常用的web软件为例。 查看系统上是否安装了nginx …

Linux如何使用命令行卸载安装包

严格地说&#xff0c;Linux是内核。Linux发行版由Linux内核、安装脚本、shell、编译器、桌面和其他组件组成。因此&#xff0c;卸载包或软件的Linux命令取决于Linux发行版的名称和类型。本文说明如何使用命令行在各种Linux发行版上卸载软件包或软件。 首先&#xff0c;您需要找…

Linux中使用rpm命令卸载软件

1、先使用rpm -qa | grep 软件包名称 例如卸载mysql&#xff1a; rpm -qa | grep mysql 2、使用rpm -e --nodeps 文件包名称 rpm -e --nodeps mysql-5.0.77-4.el5_6.6 rpm -e --nodeps libdbi-dbd-mysql-0.8.1a-1.2.2 rpm -e --nodeps mysql-5.0.77-4.el5_6.6 rpm -e --node…

Linux下如何彻底删除(卸载)MySQL?

首先连接操作系统&#xff0c;切换到root用户。 如果是使用yum安装的mysql&#xff0c;使用如下命令进行卸载&#xff08;不能确定使用何种方式安装的mysql情况下&#xff0c;按后续步骤一一进行处理即可&#xff09;&#xff1a; yum remove mysql mysql-server mysql-libs c…

Linux rpm命令详解,Linux安装、卸载、更新软件

「作者主页」&#xff1a;士别三日wyx 「作者简介」&#xff1a;CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 rpm命令详解 一、常用操作1、安装软件1.1、默认安装路径 2、更新软件3、卸载软件4、查询已经安装的软件 二、实用技巧三、rpm包命名规则 作用…

Linux 卸载程序

windows中安装了软件&#xff0c;可以通过图形化界面很方便的卸载&#xff0c;那么linux命令行的方式如何卸载程序呢&#xff1f; 首先看看安装了哪些程序 rpm -q -a #查询所有已安装的软件-q:query 查询 -a:all 所有 查询出了所有已安装的程序 所以需要过滤多自己需要卸载…

Linux软件的卸载

1.安装说明 configure作用:是源码安装软件时配置环境用的 他根据你的配置选项和你的系统情况生成makefile文件 为make 做准备。 最常用的参数: ./configure –prefix 作用: 不指定prefix&#xff0c;则可执行文件默认放在/usr/local/bin&#xff0c;库文件默认放在/usr/local…

Linux 卸载软件

一、卸载软件 1.输入命令 dpkg --list 查看已安装的软件 记住要卸载的软件的名字 sudo apt-get remove –-purge 要卸载的软件的名字 #卸载软件同时删除配置文件 sudo apt-get remove 要卸载的软件的名字 #卸载该软件 出现此界面为卸载并删除配置文件成功。 二、apt缓存删…

【Ubuntu】【Linux】命令卸载软件

Ubuntu命令卸载软件_李柏林的博客-CSDN博客_ubuntu卸载程序1.打开一个终端&#xff0c;输入dpkg --list ,按下Enter键&#xff0c;终端输出以下内容&#xff0c;显示的是你电脑上安装的所有软件。 2.在终端中找到你需要卸载的软件的名称&#xff0c;列表是按照首字母排序的。 3…

用sizeof来计算数组元素个数

一般大家常见的是用sizeof来求不同数据类型的空间大小&#xff0c;如&#xff1a; 但是我们也可以用其来计算数组元素个数&#xff0c;如下&#xff1a; 从数据可得该数组元素个数为8个。

详解strlen和sizeof在数组中的使用(四)

目录 一、前言 二、sizeof在指针中的试题&#xff1a; 解析&#xff1a; vs编辑器验证&#xff1a; 32位平台&#xff1a; 64位平台&#xff1a; 一、前言 前面一节我们已经讲过了有关于strlen在字符数组中的使用&#xff0c;以及strlen使用时候的注意事项 譬如只能在字符…

C++基础(十五)sizeof的用法 计算数组长度

sizeof本身是C语言的一个运算符&#xff0c;但也被C支持&#xff0c;且很多C代码中经常会出现。 sizeof可以很容易计算一个数组的长度&#xff0c;这在数组作为参数的函数中很有用(数组作为函数参数&#xff0c;传入的其实是首元素的地址&#xff0c;必须带上数组的实际长度作…

C语言中 sizeof(数组名) 和 strlen(数组名) 的意义

数组名是什么呢&#xff1f; 数组名通常来说是数组首元素的地址 但是有2个例外&#xff1a; 1. sizeof(数组名)&#xff0c;这里的数组名表示整个数组&#xff0c;计算的是整个数组的大小 2. &数组名&#xff0c;这里的数组名表示整个数组&#xff0c;取出的是整个数组的地…

c语言在函数中使用sizeof求数组长度

c语言sizeof的重要用途之一就是求数组长度&#xff0c;但是sizeof必须在数组定义的位置使用。不能作为参数传入函数并在函数中使用sizeof&#xff1b; 比如下边这个例子 函数中打印结果为&#xff1b; 数组的长度应该是5但是结果却是2&#xff0c;这是为什么呢&#xff1f;因为…