mysql innodb的表由.frm .ibd 组成，frm：存了每个表的元数据，包括表结构的定义等；ibd：存了每个表的元数据，包括表结构的定义等；

1.0 ibd文件基本结构

ibd文件由Tablespaces,Segments,Extents,Pages组成。
Tablespaces(FIL_PAGE_TYPE_FSP_HDR)：是数据文件的第一个Page，存储表空间关键元数据信息。
Segments(FIL_PAGE_INODE)：数据文件的第3个page，用于管理数据文件中的segement，每个索引占用2个segment，分别用于管理叶子节点和非叶子节点。
Extents(FIL_PAGE_TYPE_XDES)：XDES Page除了文件头部外，其他都和FSP_HDR页具有相同的数据结构，可以称之为Extent描述页，每个Extent占用40个字节，一个XDES Page最多描述256个Extent。
Pages(FIL_PAGE_INDEX)：是InnoDB管理存储空间的基本单位，一个页的大小一般是16KB。
在这里插入图片描述
新建一个数据库时，innodb存储引擎会初始化一个名为ibdata1 的表空间文件，这个文件会存储所有表的数据，以及我们所熟知但看不到的系统表sys_tables、sys_columns、sys_indexes 、sys_fields等。此外，还会存储用来保证数据完整性的回滚段数据；通过设置参数innodb_file_per_table，可以每一个表都对应一个自己的独立表空间文件，而不是存储到公共的ibdata1文件中。独立的表空间文件之存储对应表的B+树数据、索引和插入缓冲等信息，其余信息还是存储在默认表空间中。

1.1 PAGE类型是FIL_PAGE_TYPE_FSP_HDR的文件结构

是ibd的第一个page，记录整个表的Page管理信息，主要包含2种数据结构，分别为fsp header和xdes entry。
1.fsp header固定为112字节（是这个page的核心职责）
2.fsp header之后为xdes entry数组(256)，每个entry管理64个page，1个page16K（即管理256M空间），该数组在FIL_PAGE_TYPE_XDES中介绍

1.1.1 基本结构介绍

在这里插入图片描述

1.1.2 表头介绍

在这里插入图片描述

space id 当前表空间的ID
size 当前space最大可容纳的page数,文件扩大时才会改变这个值
limit 当前space已经分配初始化的page数,包括空闲的和已经使用的
flag 未起作用
frage used FSP_FREE_FRAG列表中已经被使用的page数
free list space中可用的extent对象列表，extent里面没有一个page被使用
frag free list 有可用碎叶page的extent列表，exntent里面有部分page被使用
frag full list 没有有可用page的extent列表，exntent里面全部page被使用
segment id 下一个可利用的segment id
full inode list space当前完全占满的segment inode页列表
free inode list space当前完全占满的segment inode页列表，full inode list 和 free inode list的结构如下

1.2 PAGE类型是FIL_PAGE_INODE的文件结构

段是表空间文件中的主要组织结构，它是一个逻辑概念，用来管理物理文件，是构成索引、表、回滚段的基本元素。创建一个索引（B+树）时会同时创建两个段，分别是内节点段和叶子段，内节点段用来管理（存储）B+树非叶子（页面）的数据，叶子段用来管理（存储）B+树叶子节点的数据；也就是说，在索引数据量一直增长的过程中，所有新的存储空间的申请，都是从“段”这个概念中申请的。
在这里插入图片描述
每个INODE ENTRY管理一个段(如索引段(即B+树的内部节点)下的所有extend(簇)，数据段(B+树的叶子节点)，回滚段等等)，这个段下的所有页由extend(簇)来管理

inode entry字段解释

1.3 PAGE类型是FIL_PAGE_TYPE_XDES的文件结构

数据文件的第一个Page类型为FIL_PAGE_TYPE_FSP_HDR，在创建一个新的表空间时进行初始化(fsp_header_init)，该page同时用于跟踪随后的256个Extent(约256MB文件大小)的空间管理，所以每隔256MB就要创建一个类似的数据页，类型为FIL_PAGE_TYPE_XDES ，XDES Page除了文件头部外，其他都和FSP_HDR页具有相同的数据结构，可以称之为Extent描述页，每个Extent占用40个字节，一个XDES Page最多描述256个Extent。
在这里插入图片描述

file segment id：段id，如果extent属于某个段的话，记录其段id，占用8个字节
xdes list node：extent链表的双向指针节点，占用12个字节，fsp header中的链表头指向的目标就是这里
state：该extent的状态，比如空闲或者已完全被使用等等，该状态是枚举类型，值为XDES_FREE，XDES_FREE_FRAG，XDES_FULL_FRAG，XDES_FSEG，占用4字节
page state bitmap：用2个bit表示extent中的一个page，其中一个bit表示该page是否是空闲(XDES_FREE_BIT)，另一个bit保留，尚未使用(XDES_CLEAN_BIT)，占用16字节，16*8/2=64，正好可以标记一个extent 64个页的使用情况

1.4 PAGE类型是FIL_PAGE_INDEX的文件结构

是ibd的用于管理页节点和叶子节点的page。
在这里插入图片描述
User Records记录具体的数据内容，其中就包括数据库每行数据的具体数据，单条记录文件结构如下

如果是聚簇索引

索引结构：[主键列][TRXID][ROLLPTR][其他建表的非主键列]
参与记录比较的列：主键列
内节点key列：[主键列]+page No指针

如果是二级索引

索引结构：[索引列][主键列]
参与记录比较的列：[索引列][主键列]
内节点key列：[索引列][主键列]+page No指针

2.0 通过py_innodb_page_info查看ibd的基本信息，如下：

没有找到趁手的二进制分析工具分析idb文件，如果谁找到好的工具还望告知哈！我现在用的是Analysis这个工具

page offset 00000000, page type <File Space Header>   //page类型FIL_PAGE_TYPE_FSP_HDR
page offset 00000001, page type <Insert Buffer Bitmap>
page offset 00000002, page type <File Segment inode>   //page类型FIL_PAGE_INODE
page offset 00000003, page type <B-tree Node>, page level <0002>   //page类型FIL_PAGE_INDEX，Page Header->PAGE_LEVEL=2，是叶节点
page offset 00000004, page type <B-tree Node>, page level <0002>
page offset 00000005, page type <B-tree Node>, page level <0002>
page offset 00000006, page type <B-tree Node>, page level <0001>   //page类型FIL_PAGE_INDEX，Page Header->PAGE_LEVEL=1，是叶节点
page offset 00000007, page type <B-tree Node>, page level <0001>
page offset 00000008, page type <B-tree Node>, page level <0002>
page offset 00000009, page type <B-tree Node>, page level <0002>
page offset 0000000a, page type <B-tree Node>, page level <0000>   //page类型FIL_PAGE_INDEX，Page Header->PAGE_LEVEL=0，是叶子节点
page offset 0000000b, page type <B-tree Node>, page level <0000>
page offset 0000000c, page type <B-tree Node>, page level <0000>
page offset 0000000d, page type <B-tree Node>, page level <0000>
page offset 0000000e, page type <B-tree Node>, page level <0000>
page offset 0000000f, page type <B-tree Node>, page level <0000>
...
page offset 00000000, page type <Freshly Allocated Page>
page offset 00000000, page type <Freshly Allocated Page>
page offset 00000000, page type <Freshly Allocated Page>
page offset 00000000, page type <Freshly Allocated Page>
Total number of page: 14592:
Freshly Allocated Page: 2584
Insert Buffer Bitmap: 1
File Space Header: 1
B-tree Node: 12005
File Segment inode: 1

3.0 分析文件结构，对我们优化数据库的帮助

1.我们知道mysql的其中一个重要的性能瓶颈就是磁盘IO。如果一张表的字段越多，字段的值越大，意味着一个Page能存放的数据量越少，造成数据查询需要加载更多的Page进行更多的IO操作。
2.我们知道磁盘的顺序读写要比随机读写快，但是频繁的插入和删除后，逻辑上相邻的数据可能分散在不同的Page中（数据是以链表形式存放在Page中的）。所以有的时候删除重建索引可以提高查询效率，即：将逻辑上相邻的数据顺序存储在Page上，将随机读写变成顺序读写同时也减少了IO操作。
3.如果我们通过主键id查询某行数据，由于mysql数据本身就是索引，所以只需要执行一次IO；如果我们通过非主键索引查询一个某行数据的某个字段，如果该字段也属于该索引只执行一次IO即可，如果是非索引字段第一次IO取到主键id，第二次IO才是获取数据（这里说的可能有点片面）