什么是前缀索引?

article/2025/9/14 13:53:55

一、什么是前缀索引?

所谓前缀索引,说白了就是对文本的前几个字符建立索引(具体是几个字符在建立索引时去指定),比如以产品名称的前 10 位来建索引,这样建立起来的索引更小,查询效率更快!

有点类似于 Oracle 中对字段使用 Left 函数来建立函数索引,只不过 MySQL 的这个前缀索引在查询时是内部自动完成匹配的,并不需要使用 Left 函数。

二、为什么要用前缀索引?

可能有的同学会发出疑问,为什么不对整个字段建立索引呢?

一般来说,当某个字段的数据量太大,而且查询又非常的频繁时,使用前缀索引能有效的减小索引文件的大小,让每个索引页可以保存更多的索引值,从而提高了索引查询的速度。

比如,客户店铺名称,有的名称很长,有的很短,如果完全按照全覆盖来建索引,索引的存储空间可能会非常的大,有的表如果索引创建的很多,甚至会出现索引存储的空间都比数据表的存储空间大很多,因此对于这种文本很长的字段,我们可以截取前几个字符来建索引,在一定程度上,既能满足数据的查询效率要求,又能节省索引存储空间。

但是另一方面,前缀索引也有它的缺点,MySQL 中无法使用前缀索引进行 ORDER BY 和 GROUP BY,也无法用来进行覆盖扫描,当字符串本身可能比较长,而且前几个字符完全相同,这个时候前缀索引的优势已经不明显了,就没有创建前缀索引的必要了。

因此这又回到一个概念,那就是关于索引的选择性

关于数据库表索引的选择性,我会单独开篇来讲解,大家只需要记住一点:索引的选择性越高则查询效率越高,因为选择性高的索引可以让 MySQL 在查找时过滤掉更多的行,数据查询速度更快!

当某个字段内容的前几位区分度很高的时候,这个时候采用前缀索引,可以在查询性能和空间存储方面达到一个很高的性价比

那么问题来了,怎么创建前缀索引呢?

三、怎么创建前缀索引?

建立前缀索引的方式,方法很简单,通过如下方式即可创建!

ALTER TABLE table_name ADD KEY(column_name(prefix_length));

其中prefix_length这个参数,就是前缀长度的意思,通常通过如下方式进行确认,步骤如下:

第一步,先计算某字段全列的区分度。

SELECT COUNT(DISTINCT column_name) / COUNT(*) FROM table_name;

第二步,然后再计算前缀长度为多少时和全列的区分度最相似

SELECT COUNT(DISTINCT LEFT(column_name, prefix_length)) / COUNT(*) FROM table_name;

最后,不断地调整prefix_length的值,直到和全列计算出区分度相近,最相近的那个值,就是我们想要的值。

下面以某个测试表为例,数据体量在 100 万以上,表结构如下!

CREATE TABLE `tb_test` (`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,`name` varchar(100) DEFAULT NULL,PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4;

测试一下正常的带name条件查询,效率如下:

select * from tb_test where name like '1805.59281427%'

我们以name字段为例,创建前缀索引,找出最合适的prefix_length

首先,我们大致计算一下name字段全列的区分度。

可以看到,结果为 0.9945,也就是说全局不相同的数据率在99.45%这个比例。

下面我们一起来看看,不同的prefix_length值下,对应的数据不重复比例。

  • prefix_length5,区分度为0.2237

  • prefix_length10,区分度为0.9944

  • prefix_length11,区分度为0.9945

通过对比,我们发现当prefix_length11,最接近全局区分度,因此可以为name创建一个长度为11的前缀索引,创建索引语句如下:

alter table tb_test add key(name(11));

下面,我们再试试上面那个语句查询!

创建前缀索引之后,查询效率倍增

四、使用前缀索引需要注意的事项?

是不是所有的字段,都适合用前缀索引呢?

答案显然不是,在上文我们也说到了,当某个索引的字符串列很大时,创建的索引也就变得很大,为了减小索引体积,提高索引的扫描速度,使用索引的前部分字符串作为索引值,这样索引占用的空间就会大大减少,并且索引的选择性也不会降低很多,这时前缀索引显现的作用就会非常明显,前缀索引本质是索引查询性能和存储空间的一种平衡。

对于 BLOB 和 TEXT 列进行索引,或者非常长的 VARCHAR 列,就必须使用前缀索引,因为 MySQL 不允许索引它们的全部长度。

但是如果某个字段内容,比如前缀部分相似度很高,此时的前缀索引显现效果就不会很明显,采用覆盖索引效果会更好!

五、小结

好了,本文主要围绕前缀索引做了一次初步的知识讲解,具体数据库表索引的选择性,还需要结合业务实际需求来考虑!

今天就说这么多,后面的问题,我们继续再扯!

六、参考

1、CSDN - Java架构设计 - 一篇文章弄懂前缀索引

2、知乎 - Java编程宇宙 - 什么是前缀索引


http://chatgpt.dhexx.cn/article/TxgLjlUA.shtml

相关文章

Motrix - 清爽开源免费的全能下载工具 (跨平台、支持 BT / 磁力链 / 百度网盘)

简介 Motrix 是一款开源免费且界面非常清爽简约的全能型下载软件,它跨平台支持 Windows、Mac、Linux 三大系统,可以支持下载 HTTP、FTP、BT、磁力链接以及下载百度网盘等资源 Motrix 软件界面非常简约清爽,个人认为设计上比较精美&#xff0…

一个功能齐全的 BitTorrent 库,支持 DHT、磁力链接、加密等功能

【公众号回复 “1024”,免费领取程序员赚钱实操经验】 大家好,我是章鱼猫。 今天给大家推荐三个不错的开源项目。 1、Bt 这是一个 Java 的 BitTorrent 库。支持 DHT、磁力链接、加密等功能的 Java 库,可以根据自己的喜好开发和定制 BT 工具&a…

前缀码详解

文章目录 提出问题作出假设进一步假设进一步思考进一步探索 (二叉树编码字符)拓展(二叉树解码位串) 提出问题 计算机常用 位串(一串0和1组成的字符串) 来表示各种字符。如果想要用0和1表示26个英文字母&am…

前缀和(一)

本文首发自本人微信公众号:今天你A了吗。每日算法讲解,面试题,冲刺BAT大厂。微信扫码关注吧: 前缀和(一)仅涉及一维前缀和。前缀和(二)涉及二维前缀和。 一、介绍:什么是…

115://开头的链接怎么转磁力?

115浏览器是一款体积小巧、启动速度快的多功能网页浏览器,最近有些用户就来咨询小编115://开头的链接要如何转磁力?下面小编就来给大家详细分析一下这个问题。 115://开头的链接转磁力方法介绍 1、首先打开 115 浏览器,然后在其右上角的&…

磁力链接文件服务器,什么是磁力链接(BT、磁力链这些词语是什么意思?)

“知其然知其所以然”。我们经常在下载资料的时候能看到BT、磁力链等词语,百思特网这些词语到底是什么意思呢? 下载都会用,但是你了解吗? BT下载 传统的下载模式是每个客户端从服务器拷贝文件,跟校园内常用的FTP一样。因为服务器宽带是一定的,所以下载的人越多下载速度会…

磁力链前缀

magnet:?xturn:btih:

磁力链接 结构解析 分享

磁力链接由一组参数组成,参数间的顺序没有讲究,其格式与在HTTP链接末尾的查询字符串相同。最常见的参数是"xt",是"exact topic"的缩写,通常是一个特定文件的内容散列函数值形成的URN,例如&#xf…

2021下半年最新编程培训机构排名出炉!

就目前的IT行业发展情况来看,市场对程序员的需求还是非常大的,参加编程培训对小白来说是一个不错的选择,毕竟在专业的编程培训机构学习,能够在短时间内掌握技术要领。如今的编程培训机构鱼龙混杂,教学质量也是参差不齐…

我,是一个培训班出来的程序员 | 程序员有话说

作者 l HeroMe 责编 | 伍杏玲 本文经授权转载自Hollis(ID:hollischuang) 这个城市的所有人都在忙碌的过生活,他们行色匆匆,车水马龙,他们认为时间就是金钱。 我在办公楼里俯视着他们,在这个…

培训机构毕业的程序员被歧视的背后逻辑

(注:本文曾发表于《程序员》2015.11.B期) 现在,像达内、华清远见、国嵌、北大青鸟、传播智客等等IT培训机构很多,为尚未毕业的大学生、毕业了一时找不到工作的大学生、工作后想转行的再就业者提供了一个掌握新技能的机…

为什么都瞧不起培训班出来的程序员?

培训机构出来的程序员怎么了? 不怎么,就是容易招偏见! 某培训机构毕业的程序员大雄,和同班同学,一起伪造学历和经验,被HR发现后,全部被开除了。 而我在北京某大型培训机构(以下简称“…

几张图告诉你程序员的残酷现状,培训机构出来的程序员可以吗

别只看不评论,谈谈你心中的程序员,感兴趣的话可以扫描左侧二维码 IT行业可以说在国内行业薪资排名中一直名列前茅,这也是为什么IT行业一直持续火爆的原因,随着前几年来的移动互联网热潮,催生了大量的Android开发岗位&…

为什么很多公司不要培训机构出来的程序员?

近几年,互联网创业潮让IT技术人员的需求大大增加,各类IT培训机构风生水起,办得如火如荼。然而,一些公司却招聘网站上写着”没有上过培训班的优先。“为什么会有这样的区别对待呢? 经过调查发现,培训机构出来的程序员被…

为什么很多公司不要从IT培训机构出来的程序员?

在很多平台看到这样的问题:为什么很多公司不要从IT培训机构出来的程序员?作为一名it培训行业从业者,我试着去了解和分析提出这种问题的人,其出发点和立场,并客观阐述个人对于这个问题的一些看法。 为什么有一些公司不…

如何看待培训机构出来的非科班程序员

看着身边的同学和朋友的情况,有感而发,打算从各方面角度说一说这件事。 近几年,互联网创业潮让IT技术人员的需求大大增加,各类IT培训机构风生水起,办得如火如荼。大多培训机构都是以保底工资nk,年薪轻松上…

程序员编程培训

作为公认的屌丝逆袭最佳途径,程序员一度成为一个非常吃香的职业。因为这是一个不太看重学历和性别的行业,只要你技术过关,就不愁没工作。那么如何才能成为一位合格的程序员呢?除了大学专业是计算机之外,报培训班或许是…

从培训机构出来的程序员,后来都怎么样了?

Python实战社群 Java实战社群 长按识别下方二维码,按需求添加 扫码关注添加客服 进Python社群▲ 扫码关注添加客服 进Java社群▲ 知乎上有这样一个问题,培训班程序员几个月出来就月薪过万,那为什么我们还要花四年时间上大学? 乍一…

从培训机构出来的程序员,后来都怎么样了? | 程序员有话说

作者 | 素年清时 责编 | 伍杏玲 60s测试:你是否适合转型人工智能? https://edu.csdn.net/topic/ai30?utm_sourcecxrs_bw 【程序人生 编者按】随着互联网的大火,各大城市催生了一个又一个的培训班,每年以批量生产的模式向社会输送…

中国的程序员培训是不是有问题?

中国技术开放日的出海团对日本进行了为期一周的访问。笔者随行了头两天,参加 Slush Asia 大会,并访问了 Gungho 和 Deloitte 两家企业。虽然已经在日本生活了四年,但这样的体验却甚少,对中日两国的技术力有不少思考。 不知从什么时…