范式及反范式

article/2025/9/18 17:00:46

**

什么是范式?

**

范式来自英文Normal Form,简称NF。MySQL是关系型数据库,但是要想设计—个好的关 系,必须使关系满足一定的约束条件,此约束已经形成了规范,分成几个等级,一级比 一级要求得严格。满足这些规范的数据库是简洁的、结构明晰的,同时,不会发生插入 (insert)、删除(delete)和更新(update)操作异常。反之则是乱七八糟,不仅给数据库 的编程人员制造麻烦,而且面目可憎,可能存储了大量不需要的冗余信息。 目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、 巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。满足最 低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多规范要求的称为 第二范式(2NF),其余范式以次类推。一般来说,数据库只需满足第三范式(3NF)就行 了。

数据库设计的第一范式
定义: 属于第一范式关系的所有属性都不可再分,即数据项不可分。 理解: 第一范式强调数据表的原子性,是其他范式的基础。例如下表
在这里插入图片描述
name-age列具有两个属性,一个name,一个 age不符合第一范式,把它拆分成两列
在这里插入图片描述
上表就符合第一范式关系。但日常生活中仅用第一范式来规范表格是远远不够的,依然 会存在数据冗余过大、删除异常、插入异常、修改异常的问题,此时就需要引入规范化 概念,将其转化为更标准化的表格,减少数据依赖。 实际上,1NF是所有关系型数据库的最基本要求,你在关系型数据库管理系统
(RDBMS),例如SQL Server,Oracle,MySQL中创建数据表的时候,如果数据表的设计 不符合这个最基本的要求,那么操作一定是不能成功的。也就是说,只要在RDBMS中已经 存在的数据表,一定是符合1NF的。
数据库设计的第二范式
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必 须先满足第一范式(1NF)。 第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一地区分。通常在实现来 说,需要为表加上一个列,以存储各个实例的惟一标识。例如员工信息表中加上了员工 编号(emp_id)列,因为每个员工的员工编号是惟一的,因此每个员工可以被惟一区 分。这个惟一属性列被称为主关键字或主键、主码。

也就是说要求表中只具有一个业务主键,而且第二范式(2NF)要求实体的属性完全依赖 于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性。什么意思呢?
有两张表:订单表,产品表
在这里插入图片描述
一个订单有多个产品,所以订单的主键为【订单ID】和【产品ID】组成的联合主键,这 样2个组件不符合第二范式,而且产品ID和订单ID没有强关联,故,把订单表进行拆分为 订单表与订单与商品的中间表
在这里插入图片描述
数据库设计的第三范式
指每一个非主属性既不部分依赖于也不传递依赖于业务主键,也就是在第二范式的基础 上消除了非主键对主键的传递依赖。例如,存在一个部门信息表,其中每个部门有部门 编号(dept_id)、部门名称、部门简介等信息。那么在员工信息表中列出部门编号后就 不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部 门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余
在这里插入图片描述
其中
产品 ID与订单编号存在关联关系 产品名称与订单编号存在关联关系 产品ID与产品名称存在关联关系
订单表里如果如果产品ID发生改变,同一个表里产品名称也要跟着改变,这样不符合第三范式,应该把产品名称这一列从订单表中删除

反范式设计

什么叫反范式化设计?
完全符合范式化的设计真的完美无缺吗?很明显在实际的业务查询中会大量存在着表的 关联查询,而大量的表关联很多的时候非常影响查询的性能。

所谓得反范式化就是为了性能和读取效率得考虑而适当得对数据库设计范式得要求进行 违反。允许存在少量得冗余,换句话来说反范式化就是使用空间来换取时间。
反范式设计-商品信息
下面是范式设计的商品信息表
在这里插入图片描述
商品信息和分类信息经常一起查询,所以把分类信息也放到商品表里面,冗余存放。
在这里插入图片描述
范式化和反范式总结 范式化设计优缺点
1、范式化的更新操作通常比反范式化要快。
2、当数据较好地范式化时,就只有很少或者没有重复数据,所以只需要修改更少的数 据。
3、范式化的表通常更小,可以更好地放在内存里,所以执行操作会更快。
4、很少有多余的数据意味着检索列表数据时更少需要DISTINCT或者GROUP BY语句。在非 范式化的结构中必须使用DISTINCT或者GROUPBY才能获得一份唯一的列表,但是如果是一 张单独的表,很可能则只需要简单的查询这张表就行了。 范式化设计的缺点是通常需要关联。稍微复杂一些的查询语句在符合范式的表上都可能 需要至少一次关联,也许更多。这不但代价昂贵,也可能使一些索引策略无效。例如, 范式化可能将列存放在不同的表中,而这些列如果在一个表中本可以属于同一个索引。 反范式化设计优缺点
1、反范式设计可以减少表的关联
2、可以更好的进行索引优化。 反范式设计缺点也很明显,1、存在数据冗余及数据维护异常,2、对数据的修改需要更 多的成本。

实际工作中的反范式实现
性能提升-缓存和汇总 范式化和反范式化的各有优劣,怎么选择最佳的设计? 请记住:小孩子才做选择,我们全都要;小孩才分对错,大人只看利弊。
而现实也是,完全的范式化和完全的反范式化设计都是实验室里才有的东西,在真实世 界中很少会这么极端地使用。在实际应用中经常需要混用。

最常见的反范式化数据的方法是复制或者缓存,在不同的表中存储相同的特定列。 比如从父表冗余一些数据到子表的。前面我们看到的分类信息放到商品表里面进行冗余 存放就是典型的例子。 缓存衍生值也是有用的。如果需要显示每个用户发了多少消息,可以每次执行一个对用 户发送消息进行count的子查询来计算并显示它,也可以在user表用户中建一个消息发送 数目的专门列,每当用户发新消息时更新这个值。 有需要时创建一张完全独立的汇总表或缓存表也是提升性能的好办法。“缓存表”来表 示存储那些可以比较简单地从其他表获取(但是每次获取的速度比较慢)数据的表(例 如,逻辑上冗余的数据)。而“汇总表”时,则保存的是使用GROUP BY语句聚合数据的 表。 在使用缓存表和汇总表时,有个关键点是如何维护缓存表和汇总表中的数据,常用的有 两种方式,实时维护数据和定期重建,这个取决于应用程序,不过一般来说,缓存表用 实时维护数据更多点,往往在一个事务中同时更新数据本表和缓存表,汇总表则用定期 重建更多,使用定时任务对汇总表进行更新。
性能提升-计数器表 计数器表在Web应用中很常见。比如网站点击数、用户的朋友数、文件下载次数等。对于 高并发下的处理,首先可以创建一张独立的表存储计数器,这样可使计数器表小且快,
并且可以使用一些更高级的技巧。 比如假设有一个计数器表,只有一行数据,记录网站的点击次数,网站的每次点击都会 导致对计数器进行更新,问题在于,对于任何想要更新这一行的事务来说,这条记录上 都有一个全局的互斥锁(mutex)。这会使得这些事务只能串行执行,会严重限制系统的并 发能力。 怎么改进呢?可以将计数器保存在多行中,每次随机选择一行进行更新。在具体实现 上,可以增加一个槽(slot)字段,然后预先在这张表增加100行或者更多数据,当对计 数器更新时,选择一个随机的槽(slot)进行更新即可。 这种解决思路其实就是写热点的分散,在JDK的JDK1.8中新的原子类LongAdder也是这种 处理方式,而我们在实际的缓冲中间件Redis等的使用、架构设计中,可以采用这种写热 点的分散的方式,当然架构设计中对于写热点还有削峰填谷的处理方式,这种在MySQL的 实现中也有体现,我们后面会讲到。
反范式设计-分库分表中的查询 例如,用户购买了商品,需要将交易记录保存下来,那么如果按照买家的纬度分表,则每个 买家的交易记录都被保存在同一表中, 我们可以很快、 很方便地査到某个买家的购买情
况, 但是某个商品被购买的交易数据很有可能分布在多张表中, 査找起来比较麻烦 。

反之, 按照商品维度分表, 则可以很方便地査找到该商品的购买情况, 但若要査找到买 家的交易记录, 则会比较麻烦 。
所以常见的解决方式如下。
( 1 ) 在多个分片表查询后合并数据集, 这种方式的效率很低。
( 2 ) 记录两份数据, 一份按照买家纬度分表, 一份按照商品维度分表,
( 3 ) 通过搜索引擎解决, 但如果实时性要求很高, 就需要实现实时搜索 在某电商交易平台下, 可能有买家査询自己在某一时间段的订单, 也可能有卖家査询自 已在某一时间段的订单, 如果使用了分库分表方案, 则这两个需求是难以满足的, 因此, 通用的解决方案是, 在交易生成时生成一份按照买家分片的数据副本和一份按照卖家分 片的数据副本,查询时分别满足之前的两个需求,因此,查询的数据和交易的数据可能是分 别存储的,并从不同的系统提供接口。


http://chatgpt.dhexx.cn/article/fhfPRFIN.shtml

相关文章

数字签名算法

数字签名算法主要包含RSA、DSA、ECDSA三种算法 1. 它的消息传递操作是: 由消息发送方构建密匙对,由消息发送的一方公布公钥至消息接收方,消息发送方对消息用私钥做签名处理消息接收方用公钥对消息做验证 2. RSA签名算法主要分为MD系列和SH…

数字签名的应用实例

一 安全信息公告 一些信息安全方面的组织会在其网站上发布一些关于安全漏洞的警告,那么这些警告信息是否真的是该组织发布的呢?我们如何确认发布这些信息的网站没有被第三方篡改呢? 在这样的情况下,就可以使用数字签名&#xff…

openssl数字签名

实验步骤 1. 创建明文文档plain.txt,写入内容。 2. (打开bin目录下的exe文件运行)计算plain.txt的哈希值,输出到文件digest.txt。 注意这个地方是sha1 是数字1而不是字母L 3. 利用RSA算法对摘要进行签名。 (1&#…

RSA数字签名

目录 利用RSA-Tool加密消息利用RSA算法实现对称密钥的安全分配利用RSA算法生成数字签名 利用RSA-Tool加密消息 1.运行RSA-Tool,点击Start按钮,滑动鼠标生成一个随机数。点击Generate生成一对大质数p、q及Npq。 2.自己选定一个可…

密码技术-数字签名

一、数字签名 用私钥生成数字签名,用公钥验证签名 数字签名的方法 ① 直接对消息签名(很少用这个) (1)Alice 用自己的私钥对消息进行加密 (2)Alice 将消息和签名发送给 Bob (3&…

总结数字签名实现身份验证

消息篡改和不可抵赖性 TCP协议确保数据能够正确发送到通信双方,加上数据加密算法保证数据安全传输,但是在HTTP应用中通信双方通常不清楚发送方的身份,尤其在客户端服务器通信下,通常一个服务器会处理多个客户端连接,结…

rsa签名算法c语言,数字签名算法rsa

数字签名算法消息传递模型 由消息发送方构建密钥对,这里由甲方完成。 由消息发送方公布公钥至消息接收方,这里由甲方将公钥公布给乙方。 注意如加密算法区别,这里甲方使用私钥对数据签名,数据与签名形成一则消息发送给乙方,私钥仅用于签名,公钥仅用于验证。 RSA RSA数字签…

数字签名原理简述

本文结合下面两个问题来讲解数字签名的基本原理。结合图片希望能给大家一个清晰简单明了的分析和讲解。 1. 问题描述: (1)用户A向远方的用户B发送一个消息,用户B如何确认所收到的消息在传输的过程中没被篡改过? (2)用户B收到了消息之后,如何防止A随之否认这个消息是…

密码学系列之七:数字签名

数字签名 1. 概述1.1 基本概念1.2 签名原理1.2.1 形式化定义1.2.2 签名过程 2 基于RSA的签名方案2.1 实现过程2.2 安全性分析 3 基于离散对数的签名方案3.1 ElGamal签名体制3.1.1 实现过程3.1.2 安全性分析 3.2 Schnorr签名体制3.2.1 实现过程3.2.2 安全性分析 3.3 DSA签名体制…

数字签名算法类别及用途

0x01 数字签名算法的类别 数字签名(digital signature)是一种电子签名,也可以表示为一种数学算法,通常用于验证消息(例如,电子邮件、信用卡交易或数字文档)的真实性和完整性。 在“数字签名论述…

数字签名-原理

数字签名 1. 从消息认证到数字签名1.1. 消息认证码的局限性1.2. 通过数字签名解决问题 2. 签名的生成和验证3. 数字签名的方法3.1 签名步骤3.2 过程图解 4. 数字签名无法解决的问题 “数字签名 — 消息到底是谁写的” 数字签名是一种将相当于现实世界中的盖章、签字的功能在计算…

什么是数字签名?

数字签名 数字签名 数字签名一、介绍二、功能三、流程四、数字证书 一、介绍 数字签名(又称公钥数字签名)是只有信息的发送者才能产生的别人无法伪造的一段数字串,这段数字串同时也是对信息的发送者发送信息真实性的一个有效证明。数字签名通…

一文彻底搞懂加密、数字签名和数字证书,看不懂你打我!

前言 这本是 2020 年一个平平无奇的周末,小北在家里刷着 B 站,看着喜欢的 up 主视频。 在一旁玩手机的女朋友突然问”你知道数字证书是来干啥的不,为啥浏览器提示证书不可信?” 你要说这个,那我可来劲了&#xff0c…

cisco 路由器 无线配置

配置环境:Cisco Packet Tracer 6.0 AP设备型号:1841 PC设备:Linksys-WPC300N模块的虚拟pc 第一步:配置接口ip R3(config)#interface Dot11Radio0/1/0 R3(config-if)#ip address 172.16.10.1 255.255.255.0 第二步:配置…

实验一 CISCO路由器的基本配置

要求: 1. 初始化配置; 2. 设置接口IP地址; ( F0/0 S1/0 ) 3. 测试; ( ping 、 telnet ) 4. 设置密码; ( console口、VTY接口和特权 ) 5. 查看。 &…

CISCO路由器基础配置和静态路由配置

学习Cisco的基础网络配置下载可以用Cisco公司开发的模拟器:Cisco packet tracer。本文的配置也都是用此模拟器配置的。 路由器 路由器的功能主要有以下几点: 1.实现网络互连,路由器支持各种局域网和广域网接口,主要用于互连局域…

cisco交换机配置方法

PS: 1.如代码能缩写尽量缩写节省时间 命令唯一才可以使用缩写方式 比如:config terminal 缩写为 conf t 即可 2.查看配置信息,只能在特权模式下查看 3.如果代码只记得前几位,直接按tab键补全,或者?查找一下 4…

一、思科路由器的基本配置

实验项目:路由器的基本配置 实验器材:Router2621XM一台、PC两台、交叉线两根。 实验目的:学习思科路由器的直连路由配置。 实验拓扑: 实验步骤: PC的配置 1.PC0配置IP、网关 IP:192.168.6.2 网关&am…

Cisco路由器配置命令

伟人对我毫无意义,我只欣赏自己理想中的明星。——尼采《善恶的彼岸》 Cisco工作模式 思科的工作模式有四种 用户模式:这一级别权限很低,只能查看路由器的基本状态,无法进行设置。 一般是Router> 特权模式:这一…

Cisco 路由器SSH配置

SSH1又分为1.3和 1.5两个版本。SSH1采用DES、3DES、Blowfish和RC4等对称加密算法保护数据安全传输,而对称加密算法的密钥是通过非对称加密算法(RSA)来完成交换的。SSH1使用循环冗余校验码(CRC)来保证数据的完整性&…