Oracle索引详解(索引的原理,创建索引,删除索引,修改索引等)

article/2025/11/6 13:37:09

Oracle索引详解

一.索引概述

Oracle作为关系型数据库,用户查找数据与行的物理位置无关,表中的每一行均用一个ROWID来标识,当Oracle数据库中存储海量的记录时,就意味着有大量的ROWID标识,那么Oracle如何能快速找到指定的ROWID呢?这时就需要索引对象了。

如果一个表中存有海量的数据记录,当对该表进行指定条件的查询时,常规的查询方法会将所有的记录都读取出来,一一与查询条件进行比较,最后返回满足条件的记录,这样操作会导致时间和I/O开销都非常大,我们可以通过建立索引来减少开销,有了索引之后,只需要在索引中找到符合查询条件的索引值字段,就可以通过保存在索引中的ROWID快速找到表中对应的记录。(将表看作一本书,索引就是目录,没有目录你就要一页一页翻,有了目录,根据目录中标记的页码(ROWID)去指定页中寻找你想要的内容即可,懂了吗?😁)

Oracle不仅要在数据字典中保存索引的定义,还需要在表空间中为它分配实际的存储空间。创建索引时,Oracle会自动在默认表空间或指定表空间中创建一个索引段。(因为Oracle能并行读取不同硬盘的数据,所以将索引和表放在不同硬盘的不同表空间中能够提高查询的速度,避免产生I/O冲突)

建立和规划索引时,必须选择合适的表和列,如果选择的不合适,可能会出现抱着木柴救火的绝美画面,不仅无法提高查询速度,反而会极大降低DML操作的速度,我总结出建立索引需要注意的几点:

  1. 索引应该建立在where语句频繁引用的表的列上。
  2. 索引应该建立在经常需要基于某列或某几列排序的表的列上。
  3. 一个表中的索引不是越多越好。索引主要用于加快查询速度,但索引越多会导致DML的速度越慢,所以索引的个数需要你好好权衡一下。
  4. 指定索引块空间的使用参数。基于表建立索引时,Oracle 会将相应表的列数据添加到索引块中。为索引块添加数据时,Oracle会按照PCTFREE参数在索引块中预留部分空间,该预留空间是为将来的INSERT操作准备的。如果将来在表上执行大量INSERT操作,那么应该在建立索引时设置较大的PCTFREE。
  5. 将表和索引部署到相同的表空间中,可以简化表空间的管理。将表和索引部署到不同的表空间中,可以提高访问性能。
  6. 当在大表上建立索引时,使用NOLOGGING选项可以最小化重做记录。使用NOLOGGING选项可以节省重做日志空间、降低索引建立时间、提高索引并行建立的性能。
  7. 最好不要在小表上建立索引,杀鸡何须宰牛刀?
  8. 多表连接时应在连接列上建立索引。
二.建立索引

Oracle创建索引的流程是首先对将要建立索引的字段进行排序,然后将排序后的字段值和对应记录ROWID存储在索引段中。Oracle索引也分几个类型,按照索引数据的存储方式可以分为B树索引、位图索引、反向健索引和基f函数的案引:按照索引列的唯性又可以分为唯有和非唯索引:按照索引列的个数又可以分为单列索引和复合索引,下面我就分类讲解一下各个索引。

1.B树索引

B树索引是Oracle默认的索引类型,它以B树结构组织并存储索引数据,不懂什么是B树的可以百度一下,你就知道。B树索引中的数据是以升序方式排序的,B树索引由根块、分支块和叶块组成,其中主要数据都集中在叶子节点上。

B树索引结构图

Oracle采用这种方式的索引,可以确保无论索引条目在何处,只需要花费相同的I/O即可获取它,所以它被称为B(Balanced)树索引。如果在Where子句中要经常引用某列或某几列,应该基于这些列建立B树索引。代码如下:

create index tiger_index on tigerlearn(tiger)
pctfree 25 --可以默认不写
tablespace Tiger_TS;

为tigerlearn表的tiger列创建索引tiger_index,子句pctfree指定为将来insert操作所预留的空闲空间,子句tablespace用于指定索引段所在的表空间。假设表已经包含了大量数据,那么在建立索引时应该仔细规划pctfree的值,以便为以后的insert操作预留空间。

2.位图索引

在B树索引中,通过在索引中保存排序的索引列的值以及记录物理地址ROWID来实现快速查找,但对于一些特殊的表,B树索引效率较低,比如一个表中有一列,数据只有正确、错误两个取值,如果建立B树索引,使用该索引对表进行检索时,将返回近一半的数据,效率非常低下,这种情况我们定义一个变量“基数”,比如一个表有10000行数据,一列只有100个取值,基数为1%。Oracle推荐,当一个列的基数小于1%时,适合建立位图索引。代码如下:

create bitmap index tiger_index_bitmap on tigerlearn(tiger)
tablespace Tiger_TS;

初始化参数CREATE_BITMAP_AREA_SIZE用于指定建立位图索引时分配的位图区大小,默认值为8MB,该参数值越大建立位图索引的速度就越快。修改该参数的代码如下:

alter system set create_bitmap_are_size = 8388608 
scope = spfile
3.反向键索引

Oracle会自动为表的主键创建B树索引,通常主键会是一个递增的序列编号,如果使用默认的B树索引,当数据量巨大时会导致索引数据分布不均,叶子节点可能会偏向某一个方向,这时就需要另一个索引机制,反向键索引,它可以将添加的数据随机分散到索引中,它在顺序递增列上建立索引时非常有用。反向键索引的工作原理非常简单,在存储结构方面它与常规的B树索引相同。然而,如果用户使用序列在表中输入记录,则反向键索引首先指向每个列键值的字节,然后在反向后的新数据上进行索引。例如,如果用户输入的索引列为2011,则反向转换后为1102; 9527 反向转换后为7259。需要注意的是,刚才提及的两个序列编号是递增的,但是当进行反向键索引时却是非递增的。这意味着,如果将其添加到子叶节点中,则可能会在任意的子叶节点中进行。这样就使得新数据在值的范围上的分布通常比原来的有序数更均匀。代码如下:

create bitmap index tiger_index_reverse on tigerlearn(tiger) reverse
tablespace Tiger_TS;
4.基于函数的索引

基于函数的索引是常规的B树索引,但它存储的数据是由表中的数据应用函数后所得到的,而不是直接存储表中的数据本身。下面是基于lower函数建立的索引。代码如下:

create index tiger_index_fun on tigerlearn(lower(tiger));

创建这个函数索引后,如果在查询条件中包含相同的lower函数,则会提高查询的执行效率,如果没有创建函数索引,而是创建了普通的B树索引,在查询中使用lower函数会执行全表进行搜索,因为lower数据不在表中也不在索引中。

三.索引的其他操作
1.修改索引

对一个表建立索引后,对表的DML操作不断增加,索引中会产生越来越多的存储碎片,会拉低索引的工作效率,可以采用两种方式来清除碎片,重建索引或合并索引,重建索引就是简单的新建一个索引,然后把原来的索引删除。

合并索引代码:

alter index tiger_index coalesce deallocate unused;

重建索引可重新指定索引对象的表空间,代码如下:

alter index tiger_index rebulid
tablespace emp;--可以不写,默认原来的表空间
2.删除索引

删除索引的方式与索引的创建方式有关,如果使用create index语句显式地创建该索引,则可以用drop index语句删除该索引。

drop index tiger_index

如果索引是在定义约束时由Oracle自动创建的,则必须禁用或删除该约束本身。

3.显示索引信息

通过查询数据字典视图dba_indexes,可以显示数据库中的所有索引;

通过查询数据字典视图all_indexes,可以显示当前用户可访问地所有索引;

通过查询数据字典视图user_indexes,可以显示当前用户地索引信息。

通过查询数据字典视图dba_ind_columns,可以显示所有索引地表列信息;

通过查询数据字典视图all_ind_columns,可以显示当前用户可访问地所有索引地表列信息;

通过查询数据字典视图user_ind_columns,可以显示当前用户索引地表列信息。

建立索引时,Oracle会为索引分配相应地索引字段,索引数据被存储在索引段中,段名与索引名完全相同。

通过查询索引段视图user_segments,可以显示当前用户所拥有的段分配的信息。

通过查询数据字典视图dba_ind_expressions,可以显示数据库中所有函数索引所对应的函数或表达式。

通过查询数据字典user_ind_expression,可以显示当前用户的所有函数索引所对应的函数或表达式。

e.g.

select index_name,index_type from dba_indexeswhere owner = 'tiger'

http://chatgpt.dhexx.cn/article/wJAqgilY.shtml

相关文章

es批量删除索引

es批量删除索引 ES/DSL语句删除索引中的文档,以时间为过滤条件 执行时如图所示: 请求:sgl_zc_termina_exhaust_20200924/_delete_by_query post DSL风格的语句: { “query”: { “bool”: { “must”: [{ “range”: { “collectTime”: { “gt”: “1616342400000”, “lt”…

Phoenix删除索引

直接在DBeaver的工具中使用Phonix连接hbase,创建索引后,直接右键删除索引,会报错无法删除。 以下提示删除索引的操作: select * from SYSTEM."CATALOG" where TABLE_NAMET5_3D71E0783EE811E9B1C10050569D5D3A AND TABLE_SCHEM MP…

mysql删除索引_SQL基础12:Mysql删除索引

图片发自简书App 学习此文之前,一起先来回顾下Mysql创建索引 简介:在本篇教程中,你将学习如何使用MYSQL DROP INDEX语法删除表中已经存在的索引。 一、MYSQL删除索引的语法 要从表中删除现有索引,可使用DROP INDEX*语句&#xff0…

MySql 删除索引

#删除索引 -- (1)使用alter table 删除 -- 语法:alter table 表名 drop index|key 索引名 -- 列如:删除表book11中的索引 alter table book11 drop index sno -- (2)使用 drop index 删除 -- 语法:drop index 索引名称 on 表名 -- 列如:删除表book…

MySQL——索引的创建与删除

文章目录 MySQL——索引的创建与删除1、创建索引的三种方式1.1、建表时创建索引1.2、修改表时创建索引1.3、使用 CREATE INDEX 语句创建索引 2、删除索引 MySQL——索引的创建与删除 1、创建索引的三种方式 1.1、建表时创建索引 使用CREATE TABLE创建表时,除了可…

c++ 实现meanshift

自己手动实现了meanshift,算是把之前还有些模糊的地方给搞清楚了,本来应该半天就可以的,结果高斯核函数计算权重那里弄错了,多花了好一阵子功夫才搞定。 原理 对于所有样本点中的一个点x,计算它的shift vector&#…

Meanshift均值漂移聚类算法

一、meanshift 均值漂移就是把指定的样本点沿着密度上升的方向移向高密度区域。这里可以用矢量加法的几何意义来理解。参考博文Mean Shift 聚类算法 meanshift为 M r ( x ) 1 k ∑ x i ∈ S r ( x ) ( x i − x ) M_r(x)\frac{1}{k}\sum\limits_{x_i\in S_r(x)}(x_i-x) Mr​…

MeanShift 目标跟踪

MeanShift算法,又称为均值漂移算法,采用基于颜色特征的核密度估计,寻找局部最优,使得跟踪过程中对目标旋转,小范围遮挡不敏感。 文章目录 MeanShift 原理MeanShift 跟踪步骤meanShift 函数原型反向投影MeanShift 跟踪…

MeanShift跟踪MATLAB实现

一、简介 核跟踪方法是目标跟踪的主要方法, 应用非常广泛。例如Meashift、Camshift 算法, 它直接运用最速下降法的原理, 向梯度下降方向对目标模板逐步迭代, 直到迭代到最优位置。它的核心就是一步一步迭代寻找最优点, 在跟踪中, 就是为了寻找相似度值最大的候选区间。 本文主…

OpenCV每日函数 对象追踪模块 Meanshift算法

1、meanshift的基本思想 meanshift 背后的直觉很简单。考虑你有一组点。(它可以是像直方图反投影这样的像素分布)。您有一个小窗口(可能是一个圆圈),您必须将该窗口移动到最大像素密度(或最大点数)的区域。如下图所示: 2、meanshift的原理简述 均值偏移和模式发现技术,…

meanshift算法学习(二):opencv中的meanshift

0.前言 接着上一篇文章点击打开链接说,opencv中提供的meanshift可以用来实现跟踪,其基本原理是迭代求解概率分布的“局部极值”。这一篇内容,我只讲opencv中的meanshift的用法和源代码分析。因为:(1)具体的…

聚类算法之Mean Shift

Mean Shift聚类算法 1. 基本原理 对于Mean Shift算法,是一个迭代得步骤,即每次迭代的时候,都是找到圆里面点的平均位置作为新的圆心位置。说的简单一点,使得圆心一直往数据密集度最大的方向移动。 2. 基本的Mean Shift向量形式…

meanshift跟踪算法

以下是用meanshift实现目标跟踪的实验报告(包含源码),实验中详细介绍了meanshift跟踪算法的原理,结合OTB100跟踪数据集对meanshift跟踪效果进行了分析。 目 录 一.实验名称 二.实验目的 三.实验原理 3.1 前言 3.2 meanshift …

传统目标跟踪——MeanShift算法

目录 一、均值漂移(MeanShift) 二、流程 三、代码 3.1 meanshift+固定框的代码 3.2 优化:meanshift鼠标选择 3.3 meanshift自己实现函数 四、补充知识 4.1 直方图 4.2 归一化 4.3 直方图反投影 一、均值漂移(…

Mean Shift 聚类算法

原文:https://blog.csdn.net/hjimce/article/details/45718593 一、mean shift 算法理论 Mean shift 算法是基于核密度估计的爬山算法,可用于聚类、图像分割、跟踪等,因为最近搞一个项目,涉及到这个算法的图像聚类实现&#xff…

mean shift聚类matlab,机器学习:Mean Shift聚类算法

今天的文章介绍如何利用Mean Shift算法的基本形式对数据进行聚类操作。而有关Mean Shift算法加入核函数计算漂移向量部分的内容将不在本文讲述范围内。实际上除了聚类,Mean Shift算法还能用于计算机视觉等场合,有关该算法的理论知识请参考这篇文章。 Mea…

Python 实现MeanShift算法

原理 大家自行百度吧,我懒得码字了 推荐一下原理原理https://blog.csdn.net/jinshengtao/article/details/30258833 代码 直接上代码了,看不懂,就参照一下原理 # author: wdq # contact: 1920132572qq.com # datetime:2022/3/15 17:40 # …

Sklearn聚类算法之meanshift

以二维来说明可能更容易理解,下图中的很多的红点就是我们的样本特征点,meanshift就是在这些点中的任意一个点为圆心,然后以半径R画一个圆(在opencv中是一个矩形),然后落在这个圆中的所有点和圆心都会对应的…

Python实现Mean Shift聚类算法

Mean Shift算法,又称均值聚类算法,聚类中心是通过在给定区域中的样本均值确定的,通过不断更新聚类中心,直到聚类中心不再改变为止,在聚类、图像平滑、分割和视频跟踪等方面有广泛的运用。 Mean Shift向量 对于给定的…

mean shift 跟踪算法

说明一: Mean Shift算法,一般是指一个迭代的步骤,即先算出当前点的偏移均值,移动该点到其偏移均值,然后以此为新的起始点,继续移动,直到满足一定的条件结束. 1. Meanshift推导 给定d维空间Rd的n个样本点 ,i1,…,n,在空间中任选一点x,那么Mean Shift向量…