MySQL使用全文索引(fulltext index)

article/2025/11/4 22:03:53

1.创建全文索引(FullText index)

       旧版的MySQL的全文索引只能用在MyISAM表格的char、varchar和text的字段上。 

       不过新版的MySQL5.6.24上InnoDB引擎也加入了全文索引,所以具体信息要随时关注官网,

     1.1. 创建表的同时创建全文索引

             CREATE TABLE article ( 
                  id INT AUTO_INCREMENT NOT NULL PRIMARY KEY, 
                  title VARCHAR(200), 
                  body TEXT, 
                  FULLTEXT(title, body) 
              ) TYPE=MYISAM; 
   

    1.2.通过 alter table 的方式来添加

                ALTER TABLE `student` ADD FULLTEXT INDEX ft_stu_name  (`name`) #ft_stu_name是索引名,可以随便起

       或者:ALTER TABLE `student` ADD FULLTEXT ft_stu_name  (`name`)

 

    1.3. 直接通过create index的方式

                CREATE FULLTEXT INDEX ft_email_name ON `student` (`name`)

           也可以在创建索引的时候指定索引的长度:

                CREATE FULLTEXT INDEX ft_email_name ON `student` (`name`(20))

      

2. 删除全文索引

    2.1. 直接使用 drop index(注意:没有 drop fulltext index 这种用法)

                 DROP INDEX full_idx_name ON tommy.girl ;

    2.2. 使用 alter table的方式 

                ALTER TABLE tommy.girl DROP INDEX ft_email_abcd;

 

3.使用全文索引

     跟普通索引稍有不同

     使用全文索引的格式:  MATCH (columnName) AGAINST ('string')

     eg:

           SELECT * FROM `student` WHERE MATCH(`name`) AGAINST('聪')

           当查询多列数据时:

                建议在此多列数据上创建一个联合的全文索引,否则使用不了索引的

          SELECT * FROM `student` WHERE MATCH(`name`,`address`) AGAINST('聪 广东')

     3.1. 使用全文索引需要注意的是:(基本单位是)

            分词,全文索引以词为基础的,MySQL默认的分词是所有非字母和数字的特殊符号都是分词符(外国人嘛)

            这里推荐一篇文章:利用mysql的全文索引实现模糊查询 

       3.2. MySQL中与全文索引相关的几个变量:

             使用命令:mysql> SHOW VARIABLES LIKE 'ft%'; #ft就是FullText的简写

             ft_boolean_syntax    + -><()~*:""&|         #改变IN BOOLEAN MODE的查询字符,不用重新启动MySQL也不用重建索引
             ft_min_word_len    4                                   #最短的索引字符串,默认值为4,(通常改为1)修改后必须重建索引文件

                                                                               重新建立索引命令:repair table tablename quick 

             ft_max_word_len    84                                #最长的索引字符串,默认值为84,修改后必须重建索引文件

             ft_query_expansion_limit   20                      #查询括展时取最相关的几个值用作二次查询

             ft_stopword_file    (built-in)                      #全文索引的过滤词文件,具体可以参考:MySQL全文检索中不进行全文索引默认过滤词         


             特别注意:50%的门坎限制(当查询结果很多,几乎所有记录都有,或者极少的数据,都有可能会返回非所期望的结果)

                       -->可用IN BOOLEAN MODE即可以避开50%的限制。

                      此时使用全文索引的格式就变成了: SELECT * FROM `student` WHERE MATCH(`name`) AGAINST('聪' IN BOOLEAN MODE)

                        更多内容请参考:MySQL中的全文检索(1)

 

4. ft_boolean_syntax (+ -><()~*:""&|)使用的例子:

        4.1  + : 用在词的前面,表示一定要包含该词,并且必须在开始位置。

                            eg: +Apple 匹配:Apple123,     "tommy, Apple"

        4.2  - : 不包含该词,所以不能只用「-yoursql」这样是查不到任何row的,必须搭配其他语法使用。

                            eg: MATCH (girl_name) AGAINST ('-林志玲 +张筱雨')

                              匹配到: 所有不包含林志玲,但包含张筱雨的记录 

        4.3. 空(也就是默认情况),表示可选的,包含该词的顺序较高。 

                       例子:

                 apple banana           找至少包含上面词中的一个的记录行

                 +apple +juice               两个词均在被包含

                 +apple macintosh     包含词 “apple”,但是如果同时包含 “macintosh”,它的排列将更高一些

                 +apple -macintosh   包含 “apple” 但不包含 “macintosh”

        4.4. > :提高该字的相关性,查询的结果会排在比较靠前的位置。 

        4.5.< :降低相关性,查询的结果会排在比较靠后的位置。

                      例子:4.5.1.先不使用 >< 

                                select * from tommy.girl where match(girl_name) against('张欣婷' in boolean mode);

                                   可以看到完全匹配的排的比较靠前

                              4.5.2. 单独使用 >

                                select * from tommy.girl where match(girl_name) against('张欣婷 >李秀琴' in boolean mode);

                                  使用了>的李秀琴马上就排到最前面

 

                             4.5.3. 单独使用 <

                                select * from tommy.girl where match(girl_name) against('张欣婷 <不是人' in boolean mode);

                                 看到没,不是人排到最前面了,这里使用的可是 < 哦,说好的降低相关性呢,往下看吧。

 

                           4.5.4.同时使用><

                              select * from tommy.girl where match(girl_name) against('张欣婷 >李秀琴 <练习册 <不是人>是个鬼' in boolean mode);

                               到这里终于有答案了,只要使用了 ><的都会往前排,而且>的总是排在<的前面

                        小结一下:1. 只要使用 ><的总比没用的 靠前;

                                       2. 使用  >的一定比 <的排的靠前 (这就符合相关性提高和降低)

                                       3. 使用同一类的,使用的越早,排的越前。

        4.6. ( ):可以通过括号来使用字条件。  

                       eg: +aaa +(>bbb <ccc) // 找到有aaa和bbb和ccc,aaa和bbb,或者aaa和ccc(因为bbb,ccc前面没有+,所以表示可有可无),

                                         然后 aaa&bbb > aaa&bbb&ccc > aaa&ccc

           4.7. ~ :将其相关性由正转负,表示拥有该字会降低相关性,但不像「-」将之排除,只是排在较后面。 

                           eg:   +apple ~macintosh   先匹配apple,但如果同时包含macintosh,就排名会靠后。

           4.8. * :通配符,这个只能接在字符串后面。 

                                 MATCH (girl_name) AGAINST ('+*ABC*')   #错误,不能放前面

                                 MATCH (girl_name) AGAINST ('+张筱雨*')  #正确

           4.9. " " :整体匹配,用双引号将一段句子包起来表示要完全相符,不可拆字。 

                                 eg:  "tommy huang" 可以匹配  tommy huang xxxxx   但是不能匹配  tommy is huang

5.补充:Windows下无法修改 ft_min_word_len的情况,

          5. 1. 使用cmd打开 services.msc,

                找到你的 MySQL服务,右键Properties,找到你的my.ini所在的路径

                

          5.2. 停止MySQL,在my.ini中增加 ft_min_word_len = 1,重启MySQL,

                    然后使用命令 show variables like 'ft_min_word_len'; 查看是否生效了


http://chatgpt.dhexx.cn/article/x2V95yWM.shtml

相关文章

MySQL 全文索引

说到查询&#xff0c;日常中常用的baidu&#xff0c;cnbing ,google等之类的网站。关系型数据库中的全文索引应该也是从这些搜索引擎里摸索出来的。 全文索引介绍&#xff1a; 在数据库中常用的查询方式一般是 等价&#xff0c;范围方式。当然也有LIKE %的模糊查询&#xff0c…

MySQL索引系列:全文索引

什么是全文索引&#xff1f; 全文索引首先是 MySQL 的一种索引类型&#xff0c;也是搜索引擎的关键技术。 试想在1M大小的文件中搜索一个词&#xff0c;可能需要几秒&#xff0c;在100M的文件中可能需要几十秒&#xff0c;如果在更大的文件中搜索那么就需要更大的系统开销&am…

全文索引简介

全文索引技术就是将各种信息&#xff0c;文档中所有的文字序列都作为检索对象&#xff0c;找出包含检索词汇的信息或文档。 全文索引在数据库中一般是作为单独模块使用的&#xff0c;如MYSQL全文检索工具——Sphinx&#xff0c;一般全文索引模块需要配合数据库的存储方式进行处…

【MySQL】全文索引详解

文章目录 &#x1f340;全文索引概述 &#x1f340;全文索引的创建 &#x1f340;创建表时定义索引 &#x1f340;在已存在表上创建 &#x1f340;执行create语句 &#x1f340;执行ALTER TABLE语句 全文索引概述 全文索引主要对字符串类型建立基于分词的索引&#xff0c…

html怎么异步传数据,用jQuery实现异步通信(用json传值)方法步骤

jQuery是时下比较流行的一个js库&#xff0c;能够用简单的代码做出理想的效果&#xff0c;就像官网上说的那样“write less ,do more”。Jquery在一定程度上改写了以往对JavaScript的写法&#xff0c;本人就用jquery实现上篇中用ajax实现异步通信的效果&#xff0c;感受一下jqu…

用jQuery实现异步通信(用json传值)具体思路

jQuery是时下比较流行的一个js库&#xff0c;能够用简单的代码做出理想的效果&#xff0c;就像官网上说的那样“write less ,do more”。Jquery在一定程度上改写了以往对JavaScript的写法&#xff0c;本人就用jquery实现上篇中用ajax实现异步通信的效果&#xff0c;感受一下jqu…

jQuery的toggle

<!DOCTYPE html> <html><head><meta charset"utf-8"><title></title><!--引入jq框架--><script src"https://cdn.staticfile.org/jquery/2.1.1/jquery.min.js"></script></head><body>…

12.jQuery技术

一、jQuery知识点总览。 css&#xff08;&#xff09;方法&#xff1a;//通过css&#xff08;&#xff09;方法获取样式值let backgroundcolor $("#one").css("backgroundColor");alert(backgroundcolor);//通过css&#xff08;&#xff09;方法设置id为…

jQuery

##jQuery基础 1.概念&#xff1a;一个JavaScript框架。简化JS开发 *jQuery是一个快速、简洁的JavaScript框架&#xff0c;是继Prototype之后又一个优秀的JavaScript代码库&#xff08;框架&#xff09;于2006年1月由John Resig发布。 jQuery设计的宗旨是“write Less&#xf…

jQuery建立WebSocket连接

jQuery建立WebSocket连接&#xff0c;向服务端发送数据&#xff0c;实现WebSocket连接成功。 js代码如下&#xff1a; <script src"https://apps.bdimg.com/libs/jquery/2.1.4/jquery.min.js"></script><script type"text/javascript">…

WebGoat攻略 for Mac(1)

WebGoat攻略 for Mac&#xff08;1&#xff09; 一、环境配置1.配置Docker2.配置WebGoat3.连接WebGoat 二、题目攻略Introduction(介绍)a.WebGoatb.WebWolf General(通用)a.HTTP Basics(HTTP基础)b.HTTP Proxies配置OWASP ZAP c.Developer Tools(开发人员工具)d.CIA Triade.Cry…

代码审计之WEBGOAT 反序列化

反序列化这关在前端页面可以看到是提交token到后端&#xff0c;先看一下接口名 可以看到接口名为InsecureDeserialization/task&#xff0c;那就后端全局搜索InsecureDeserialization/task&#xff0c;最终定位到InsecureDeserializationTask.java 源码如下&#xff1a; packa…

kali搭建webgoat靶场

下载webgoat-server-8.0.0.M26.jar与webwolf-server-8.0.0.M26.jar&#xff0c;并保存至kali的documents处&#xff0c;并在此打开终端&#xff08;不然无法打开&#xff09; 打开webgoat-server-8.0.0.M26.jar 浏览器访问127.0.0.1:8080/WebGoat/login.html 进行注册且登录 成…

基于 WebGoat 平台的 SQL 注入攻击

基于 WebGoat 平台的 SQL 注入攻击 扩展功能参考: https://blog.csdn.net/HZC0217/article/details/126790211 使用实例参考: https://www.cnblogs.com/hndreamer/p/16635984.html 目录 1、什么是 webgoat? 2、jar 下载 3、环境搭建 4、运行 webgoat 5、在浏览器中登录 …

owaspbwa之WebGoat

简介 下载&#xff1a;https://sourceforge.net/projects/owaspbwa/files/ GitHub: https://github.com/chuckfw/owaspbwa/wiki/UserGuide 0x001 侦查 PORT STATE SERVICE VERSION 22/tcp open ssh OpenSSH 5.3p1 Debian 3ubuntu4 (Ubuntu Linux; protoc…

WebGoat之JWT部分攻略

环境搭建 使用docker容器搭建webgoat环境 什么是JWT Json web token (JWT), 是为了在网络应用环境间传递声明而执行的一种基于JSON的开放标准.该token被设计为紧凑且安全的&#xff0c;特别适用于分布式站点的单点登录&#xff08;单点登录SSO&#xff1a;在多个应用系统中&…

Webgoat靶场搭建

环境 jdk16 安装 文件源码看评论区哈。 下载过后是这个jdk-16.0.2.7z文件&#xff0c;这是个JDK16的包,进入bin目录下&#xff0c;可以看到靶场文件&#xff0c; 启动网站 打开一个cmd窗口执行启动网站命令 java --add-opens java.base/sun.nio.chALL-UNNAMED --add-op…

WebGoat通关教程

这里我们用docker镜像一键搭建即可 用docker命令开启webgoat docker run -d -p 8081:8080 -p 9090:9090 -e TZEurope/Amsterdam webgoat/goatandwolf 打开192.168.109.131:8081/WebGoat和192.168.109.131:9090/WebWolf能打开即可 192.168.109.131是本地IP 直接注册一个账号&…

在Ubuntu环境下使用docker配置webgoat环境

1.安装Docker环境 sudo apt install docker.io 2.配置Docker加速 打开配置文件 vim /etc/docker/daemon.json添加mirrors信息 {"registry-mirrors":["https://registry.docker-cn.com","http://hub-mirror.c.163.com"]}3.重启docker system…

WebGoat General Crypto Basics

目录 第2页 第3页 第4页 第6页 第2页 这一页是讲base64编码和Basic Authentication的 简单来说Basic Authentication中使用了base64编码&#xff0c;以本页的题目举例&#xff0c;如果有个HTTP头长这样 Authorization: Basic ZmFuY3llbGU6c2VjcmV0 那这个网站就是用了Basi…