数据结构之查找表

article/2025/9/16 23:23:24

前言

今天学习数据结构看到了一个词-静态查找表,还有与之对应的动态查找表,然后我发现。

啊,这是个啥,好像知道又好像不知道,不就是查找吗,干嘛弄这些专业的说法,回头翻了一下数据结构的书,才发现......。

唉,小小的抱怨一下,不过,我从这两个词联想到了一门基础但是要精通又不简单的学问,就是查找,然后还有前天被面试官问到的一个查找题,题目很简单,如何查找单向链表中倒数第K个数?当然你先遍历一遍数组,获取数组的总长度,然后再遍历一遍找倒数第K个数,当然可以,但是既然是面试题,这样的答案基本是凉凉的,我自己都不满意,更别提人家面试官了,当你抛出这个答案之后,面试官会说如果只遍历一遍呢?你就懵逼了,如果你和我一样懵逼的话,那么恭喜你,你现在还来得及,当然正确方法我就不说了,感兴趣的可以去想想,实在想不出来,我相信你会有办法的,xixixi,也不难。

好了,说了这么多,今天既然发现了自己的一个薄弱区-查找,指不准以后哪天还会在查找这里栽倒,于是,何不在这之前好好梳理一下查找这块呢?

目录

1.静态查找表

2.动态查找表

3.哈希表

正文

首先我们需要明白下静态查找表和动态查找表的定义,所谓的静态查找表是指在查找过程中只进行查找操作,动态查找表就是在查找过程中还会进行插入和删除操作,例如,查找某个元素,若查找到了,则删除。

1.静态查找表

静态查找表可以有不同的表示方法,在不同的表示方法中,实现的查找操作方法也不同。

这里列举平时遇到的最为常见的两种情况

a.以顺序表或线性链表表示静态查找表,则查找可用顺序查找来实现

b.以有序表(排好顺序的顺序表) 表示静态查找表,则查找可用折半查找(二分查找)来实现

第一种,就是一个for循环的事,就不赘述了,这里看一下第二种情况,也就是二分查找的代码,思想就是从中间位置起开始查找,如果正好位于正中间,那么就找到了,如果比正中间数据大,那么在后半部分查找,假设整个数据是升序,如果比正中间数据小,那么在前半部分查找,依次类推,递归结束的标志就是左边界大于右边界,也就是已经不能再分了,如果此时还没查找到,那么就返回未查找到即可

public class BinarySearch {public static void main(String[] args) {// TODO Auto-generated method stubint[] a=new int[]{2,3,5,8,9};int index=search(a,50);System.out.println(index);}public static int search(int[] a,int data){return binarlSearch(a, 0, a.length-1,data);}public static int binarlSearch(int[] a,int left,int right,int data){if(left>right)return -1;int mid=(left+right)/2;if(a[mid]==data){return mid;}else if(a[mid]<data){return binarlSearch(a, mid+1, right, data);}else{return binarlSearch(a, left, mid-1, data);}}
}

上面的只是查找里的入门知识,学任何东西都像打怪升级一样,先从小怪开始,由简变难,下面我们升级来打一个大点的怪!

2.动态查找表

动态查找表的特点是:表结构本身是在查找过程中动态生成的,即对于给定的key值,若表中存在其关键字等于key的记录,则查找成功返回,否则插入关键字等于key的记录。

动态查找表也可有不同的表示方法,这里主要讨论以各种树结构表示时的实现方法。

a.二叉排序树(又叫  二叉搜索树  二叉查找树)

二叉排序树的特点是:

1.若它的左子树不为空,则左子树上所有节点的值均小于它的根节点的值

2.若它的右子树不为空,则右子树上所有节点的值均大于它的根节点的值

3.它的左右子树也分别为二叉排序树

在了解了这个树的性质之后,我们不难联想到二分查找的思想,只不过大同小异,首先和根节点比较,如果比根节点大,则在右子树中查找,如果比根节点小,则在左子树中查找,如果相等,那么正好查找到了,如果左子树也没有,右子树也没有,则查找失败。

好了,我们掌握了上面的思想,不难写出下面的代码

	public boolean contains(Node root, Node node) {if (root == null) {return false;}if (node.data == root.data) {return true;} else if (node.data > root.data) {return contains(root.rChild, node);} else {return contains(root.lChild, node);}}

代码不难理解,然后我们再考虑这样一种情况,就是一个有序的链表,是不是也符合二叉排序树的性质,也就是说我们查找的这棵二叉排序树是有可能退化为一个链表的,那么我们再对照着上面这个查找的代码去看,会发现查找的效率已经退化成了O(n),这显然不是我们想要看到的结果,我们想要的效果是尽可能的将一组数据分为等长的两部分,以达到类似“二分”的效果,只有这样最终的效率才可以达到O log(n)的最优效果,于是我们就引出了这样一个问题,如何保证二叉排序树查找的效率维持在O log(n)呢?接着往下看

b.平衡二叉树

在上面,我们发现如果不对二叉排序树做任何处理,发现查找的效率会有可能退化为链表的查找效率,所以我们期望有一种解决方案能避免效率的降低,现在再来想想,为什么我们的查找效率会降低,究其原因就是二叉树退化成了链表,那么我们必须以某种手段来防止退化,比如强制要求左右子树的高度差小于某个值等措施,于是我们自然而然想到了平衡二叉树。

 

所以解决方案就是让二叉排序树转换为平衡二叉树,这个就好说了,主要涉及到四个操作,左左旋(LL)、右右旋(RR)、左右旋(LR)、右左旋(RL)。通过在插入一个元素的时候,判断是否符合平衡二叉树的性质,也就是左右子树的高度差是否小于1,如果不符合,那么根据情况做相应的旋转处理即可。

由于几个旋转基本类似,只要掌握了一个,剩下的依葫芦画瓢即可,我们现在来看下左左旋的代码

	// 左左翻转 LL// 返回值为翻转后的根结点private Node leftLeftRotation(Node node) {// 首先获取待翻转节点的左子节点Node lNode = node.lChild;node.lChild = lNode.rChild;lNode.rChild = node;node.height = max(getHeight(node.lChild), getHeight(node.rChild)) + 1;lNode.height = max(getHeight(lNode.lChild), node.height) + 1;if (node == root) {root = lNode;// 更新根结点}return lNode;}

剩下三个操作就不细说了,接下来我们再在插入和删除的时候,进行适当的判断,插入代码如下

	public void insert(int data) {if (root == null) {root = new Node(data);} else {insert(root, new Node(data));}}// node 为插入的树的根结点// insertNode 为插入的节点private Node insert(Node node, Node insertNode) {if (node == null) {node = insertNode;} else {if (insertNode.data < node.data) {// 将data插入到node的左子树node.lChild = insert(node.lChild, insertNode);// 如果插入后失衡if (getHeight(node.lChild) - getHeight(node.rChild) == 2) {if (insertNode.data < node.lChild.data) {// 如果插入的是在左子树的左子树上,即要进行LL翻转node = leftLeftRotation(node);} else {// 否则执行LR翻转node = leftRightRotation(node);}}} else if (insertNode.data > node.data) {// 将data插入到node的右子树node.rChild = insert(node.rChild, insertNode);// 如果插入后失衡if (getHeight(node.rChild) - getHeight(node.lChild) == 2) {if (insertNode.data > node.rChild.data) {node = rightRightRotation(node);} else {node = rightLeftRotation(node);}}} else {System.out.println("节点重复啦");}node.height = max(getHeight(node.lChild), getHeight(node.rChild)) + 1;}return node;}

删除代码如下

	public void remove(int data) {Node removeNode = new Node(data);if (contains(root, removeNode)) {remove(root, removeNode);} else {System.out.println("节点不存在,无法删除"+data);}}// 删除节点private Node remove(Node node, Node removeNode) {if (node == null) {return null;}// 待删除节点在node的左子树中if (removeNode.data < node.data) {node.lChild = remove(node.lChild, removeNode);// 删除节点后,若失去平衡if (getHeight(node.rChild) - getHeight(node.lChild) == 2) {Node rNode = node.rChild;// 获取右节点// 如果是左高右低if (getHeight(rNode.lChild) > getHeight(rNode.rChild)) {node = rightLeftRotation(node);} else {node = rightRightRotation(node);}}} else if (removeNode.data > node.data) {// 待删除节点在node的右子树中node.rChild = remove(node.rChild, removeNode);// 删除节点后,若失去平衡if (getHeight(node.lChild) - getHeight(node.rChild) == 2) {Node lNode = node.lChild;// 获取左节点// 如果是右高左低if (getHeight(lNode.rChild) > getHeight(lNode.lChild)) {node = leftRightRotation(node);} else {node = leftLeftRotation(node);}}} else {// 待删除节点就是node// 如果Node的左右子节点都非空if (node.lChild != null && node.rChild != null) {// 如果左高右低if (getHeight(node.lChild) > getHeight(node.rChild)) {// 用左子树中的最大值的节点代替nodeNode maxNode = maxNode(node.lChild);node.data = maxNode.data;// 在左子树中删除最大的节点node.lChild = remove(node.lChild, maxNode);} else {// 二者等高或者右高左低// 用右子树中的最小值的节点代替nodeNode minNode = minNode(node.rChild);node.data = minNode.data;// 在右子树中删除最小的节点node.rChild = remove(node.rChild, minNode);}} else {// 只要左或者右有一个为空或者两个都为空,直接将不为空的指向node// 两个都为空的话,想当于最后node也指向了空,逻辑仍然正确node = node.lChild == null ? node.rChild : node.lChild;// 赋予新的值}}if(node!=null) {node.height = max(getHeight(node.lChild), getHeight(node.rChild)) + 1;}return node;}

 每次在插入和删除时进行这样的操作之后,我们的二叉排序树终于变成一颗平衡二叉树啦,这样我们再执行上面一模一样的查找代码时,查找的效率就可以稳定在O log(n),完美!

 

其实仔细想想,这个问题,也是一个取舍的问题,虽然我们最后让二叉排序树的查找效率稳定为O log(n),但是我们却付出了不小的代价,就是每次插入以及删除的时候,都要进行大量的判断以及节点转换,这肯定会大大降低插入和删除的效率,与之带来的收益就是查找效率高,这样再一想,发现有点类似数组和链表的优缺点了,hhhh,事物总是有两面性,所以我们在实际使用时,也要根据场景来适当的做出取舍。

3.哈希表

在说哈希表之前,先回忆一下两个最简单的容器,一个是数组,一个是链表,这二者的优缺点我就不啰嗦了,之前的博客我也说过这样一个问题,既然数组查询快,链表插入删除快,就不能发明一种容器能兼具这二者的优点吗?这样岂不时省事多了,答案是能,没错,这个神奇的容器就是HashMap,而其核心就是哈希表,这时候,你兴冲冲的去查询哈希表,可能会遇到很多晦涩难懂的概念,什么关键字冲突,线性探测再散列,链地址法,再哈希等等,一下子头就大了,放心,我不会去给你灌输这些概念,我喜欢以实际使用的东西,或者叫“成品”来学习某个新的东西,然后再反过来看这些概念,这样就自然而然懂了,所以我们先简单了解HashMap的实现原理,再来看哈希表,就自然而然懂了。

既然是了解HashMap的实现原理,最最正确的方式就是直接打开jdk的源码去看,重点看核心方法put和remove即可,限于篇幅,我就说下大致思想。

我们首先需要知道的是HashMap存储的数据是键值对的形式,也就是key-value形式,然后就是HashMap里的一些重要成员变量及类,其中最重要的就是Node对象,每个Node对象含有key和value字段,用于保存插入的key和value值,Node数组的默认长度是16,当插入一个元素的时候,首先计算key的hash值,然后直接和数组长度-1做与运算,这样就定位到一个具体的下标,然后判断下标处是否有元素值存在,如果有,则以尾插法在该处形成一个链表,否则,就直接放入这个插入元素即可,所以最终效果就是这样的

看了这个结构图后,我们再回到我们的主题--查找,我们再来看看HashMap是如何查找的,首先拿到key值,计算key的hash值,然后同样的方法,和长度减1做与运算,得到下标,如果该下标处为空,则返回找不到,如果不为空,则从链表头开始,逐个遍历该链表,直到找到对应的value值与给定value值相等,若链表遍历完了仍然没有找到,则返回找不到。

我们现在再来看看这个设计有什么巧妙的地方,当我们在查询一个元素时,发现,对于哈希表来说,首先会根据key值来定位一个下标,这个巧妙利用了数组的优势,这样就不用去逐个遍历所有元素,然后如果发现该下标处已经存在了元素,则形成一个链表,而在形成一个链表之后,对同一个下标处的元素来说,插入删除的效率也变高了。或者换种通俗的话就是,使用数组将一个链表分割成了多个小段。总的来说这种设计就是结合了数组和链表,利用了二者的优势所在,完美结合!

好了,到这里,其实就已经学习了哈希表的一种,如上图,就是链地址法解决冲突的哈希表,相信到这里你也明白了,所谓的链地址法的具体含义,就是形成一个链表来解决冲突问题。

链地址法也是最常见的一种设计哈希表的方法,我们现在再来看看另外的两种。

线性探测再散列法,这种设计方式设计的哈希表的原理就是,当插入一个元素的时候,同样的先定位到一个下标,然后如果该下标处已经存在了元素,则判断下标+1的地方是否有元素存在,同样的如果仍然有元素存在,则下标继续+1,直到对应下标处没有元素存在时,则将元素插在这个地方。

再哈希法,这个设计方式就比较简单粗暴了,直接在计算key的hash值的方法时,也就是在定位具体的下标时,用两次hash函数来计算,这样原本一次hash计算到相同地方的元素,因为有第二次hash计算,所以会在二次hash函数处理之后,再次判断是否定位到了同一下标,若还是定位在统一下标,则继续hash函数处理,直到冲突不再发生。

我们仍然回到我们的主旨--查找上来,对这两种方法设计的哈希表,我们在查找时就是先定位,然后如果不存在元素,则“查找返回空”,否则比对对应的value值,如果不相等,则根据设计方法(线性探测再散列或再哈希)得到“下一个地址”,然后判断“下一个地址”是否为要查找的元素。

好了,到这里,基本说完了三种设计哈希表的方式以及对应的查找方法,个人觉得每一种方式都有自己的特点和适用场景,没有孰好孰坏,只有当我们都掌握了之后,我们才可以去选择用哪种方式来实现哈希表,完成业务要求。

结语

这次说的主要是查找,内容相对简单,但是查找这个东西,一但结合实际场景之后,还是有很多需要注意和深究的地方,比如海量数据排序和查找,所以只有会了基础,才能有选择的余地,以后实际场景中若是遇到了相关的问题,再总结归纳一篇“实际场景版”的,今天就到这里了。

 


http://chatgpt.dhexx.cn/article/bdAZhdQZ.shtml

相关文章

数据结构查找表详解(包含常用查找算法)

** 1. 什么是查找表 ** 在日常生活中&#xff0c;几乎每天都要进行一些查找的工作&#xff0c;在电话簿中查阅某个人的电话号码&#xff1b;在电脑的文件夹中查找某个具体的文件等等。本节主要介绍用于查找操作的数据结构——查找表。 查找表是由同一类型的数据元素构成的集…

FPGA工作原理

一.查找表&#xff08;Look-Up-Table)的原理与结构 采用这种结构的PLD芯片我们也可以称之为FPGA&#xff1a;如altera的ACEX,APEX系列,xilinx的Spartan,Virtex系列等。 查找表&#xff08;Look-Up-Table)简称为LUT&#xff0c;LUT本质上就是一个RAM。 目前FPGA中多使用4输入的…

FPGA知识积累【3】

目录 1.查找表&#xff08;LUT&#xff09;原理与结构2.FPGA基本结构3.FPGA的RAM、ROM、CAM4.硬件语言的层次5.寄生效应6.线与逻辑7.竞争冒险8.消除竞争冒险的方法 1.查找表&#xff08;LUT&#xff09;原理与结构 ①查找表简称LUT&#xff0c;本质上就是一个RAM。目前FPGA中多…

数据结构导论【六】之 查找表

感谢内容提供者&#xff1a;金牛区吴迪软件开发工作室 接上一篇&#xff1a;数据结构导论【五】之 图 文章目录 一、基本概念二、静态查找表的实现1.顺序表上的查找 -- 顺序查找a.过程b.算法c.算法分析 2.有序表上的查找 -- 二分查找a.二分查找思想b.二分查找过程c.二分查找算法…

查找表(Lookup table)

查找表&#xff08;look-up-table&#xff09;这个名字很好听&#xff0c;缩写 LUT&#xff0c;听起来很高端&#xff0c;其实是一种很简单高效的索引操作&#xff0c;今天简单介绍一下。 是啥 wiki定义&#xff1a; a lookup table is an array that replaces runtime computa…

从底层结构开始学习FPGA(2)----LUT查找表

文章目录 系列目录与传送门 一、概述 二、实现原理 系列目录与传送门 《从底层结构开始学习FPGA》目录与传送门 一、概述 记得刚接触FPGA的时候&#xff0c;总能看见类似这样的一句话----FPGA是基于查找表LUT的可编程逻辑器件。FPGA常常被人比作“数字积木”&#xff0c;就是因…

码,主码,主属性,非主属性,平凡函数依赖,完全依赖等词解释

码&#xff1a;代表数目的符号 主码 我们在建立数据库的时候&#xff0c;需要为每张表指定一个主码&#xff0c;主码也叫主键。 所谓主码就是在实体集中区分不同实体的候选码。 一个实体集中只能有一个主码&#xff0c;但可以有多个候选码。 必须注意两点&#xff1a; 1.主…

SpringBoot项目打jar后执行jar包提示:xx没有主属性清单 解决

SpringBoot项目打jar包后执行jar包提示&#xff1a;xx没有主属性清单 解决 今天在练习SpringBoot项目打jar包部署的时间遇见了一个问题&#xff1a;jar中没有主属性清单&#xff0c;对此也是比较疑惑&#xff0c;在百度之后找到了解决方式 主属性清单是jar包中MANIFEST.MF文件中…

【图示化】SQL Server概念:超键(码)、候选键(候选码)、主键(主码)、主属性与非主属性、外键

关系模型概念 字段属性名&#xff0c;每一行就是一条记录一个元组&#xff0c;每个单元格就是一个分量&#xff0c; 主键&#xff0c;外键 主码主键主关键字 超键&#xff08;码&#xff09;&#xff0c;候选键 码超键 超键 &#xff08;唯一的&#xff0c;可多余&#xff09; …

候选码、主码、全码、外码、主属性、主键、主关键字、非主属性

一、讲解 首先说明 键字码字&#xff0c;所以 主键主码主关键字&#xff0c;候选键候选码候选关键字… 所谓关系键&#xff0c;指的是一个表中的一个&#xff08;或一组&#xff09;属性&#xff0c;用来标识该表的每一行或与另一个表产生联系。 话不多说&#xff0c;上图&a…

软考系列之候选码,主码,主属性,非主属性详讲

候选码&#xff0c;主码&#xff0c;主属性&#xff0c;非主属性详讲 文章目录 目录 文章目录 前言 一、候选码&#xff0c;主码&#xff0c;属性&#xff0c;非主属性的定义 二、具体题目 三、补充 前言 软考刷题&#xff0c;遇到这系列的题目&#xff0c;对我来讲&#xff0…

数据库中主键、主码、主属性、关键字、候选关键字、码的区别

码是数据库系统中的基本概念&#xff0c;所谓码就是能唯一标识实体的属性&#xff0c;它是整个实体集的性质&#xff0c;而不是单个实体的性质。它包括超码、候选码和主码。 &#xff08;1&#xff09;超码是一个或多个属性的集合&#xff0c;这些属性可以让我们在一个实体集中…

函数依赖 主码 主属性 非主属性 候选键 超键 详解

最近做项目要搞数据库看到范式那一节头脑发晕&#xff0c;概念都忘了&#xff0c;于是从网上搜罗并整理一下&#xff1b; 函数依赖部分参考&#xff1a;https://blog.csdn.net/jsj13263690918/article/details/79796275 主码&#xff1a;主关键字&#xff08;主键&#xff0c;…

c语言memset详解

目录 1 函数声明1.1功能1.2 例子 2 常见错误2.1 搞反了 ch 和 n 的位置.2.2 过度使用memset2.3 3 特殊例子 1 函数声明 void *memset(void *s, char ch, unsigned n);1.1功能 将s所指向的某一块内存中的每个字节的内容全部设置为ch指定的ASCII值。块的大小由第三个参数指定,作…

【Java基础知识 9】序列化与反序列化

🍅 Java学习路线:搬砖工逆袭Java架构师 🍅 简介:Java领域优质创作者🏆、CSDN哪吒公众号作者✌ 、Java架构师奋斗者💪 🍅 扫描主页左侧二维码,加入群聊,一起学习、一起进步 🍅 欢迎点赞 👍 收藏 ⭐留言 📝 面试官:兄弟,说说你对transient的理解和感悟 …

详解序列化与反序列化

一、什么是序列化与反序列化 序列化时将对象状态转换为可保持或传输的形式的过程。序列化的补集是反序列化&#xff0c;反序列化是将流转换为对象。两个过程一起保证能够存储和传输数据。 .NET具有以下三种序列化技术&#xff1a; 1.二进制序列化 保持类型保真&#xff0c;这…

为什么要序列化?序列化你知道哪些?

凡事都要问为什么&#xff0c;在讲解序列化概念和原理前&#xff0c;我们先来了解一下为什么需要序列化。 为什么要序列化&#xff1f; 如果光看定义我想你很难一下子理解序列化的意义&#xff0c;那么我们可以从另一个角度来感受一下什么是序列化。 都玩过游戏么&#xff1…

说说什么是序列化,如何实现序列化

分析&回答 序列化机制 序列化机制&#xff08;包括序列化和反序列化&#xff09;的本质是用流将对象读到内存和写入外存。序列化机制的意义就是将对象脱离程序运行独立存在。通过网路或跨平台传输对象&#xff0c;传递的参数与返回值都实现序列化机制。实现序列化需要实现…

java序列化详解

一、序列化与反序列化 序列化&#xff1a;指堆内存中的java对象数据&#xff0c;通过某种方式把对存储到磁盘文件中&#xff0c;或者传递给其他网络节点&#xff08;网络传输&#xff09;。这个过程称为序列化&#xff0c;通常是指将数据结构或对象转化成二进制的过程。 即将对…

序列化和反序列化的底层实现原理是什么?

序列化和反序列化作为Java里一个较为基础的知识点&#xff0c;大家心里也有那么几句要说的&#xff0c;但我相信很多小伙伴掌握的也就是那么几句而已&#xff0c;如果再深究问一下Java如何实现序列化和反序列化的&#xff0c;就可能不知所措了&#xff01;遥记当年也被问了这一…