MySQL系列:innodb引擎分析之基础数据结构

近一年来一直在分析关于数据库相关的源码,前段时间分析了levelDB的实现和BeansDB的实现,这两个数据库网络上分析的文章很多,也都比较分析的比较深,所以也就没有太多必要重复劳动。最近开始关注关系数据库和MYSQL,当然主要还是数据库存储引擎,首先我还是从innodb这个最流行的开源关系数据库引擎着手来逐步分析和理解。我一般分析源码的时候都是从基础的数据结构和算法逐步往上分析,遇到不明白的地方,自己按照源码重新输入一遍并做对应的单元测试,这样便于理解。对于Innodb这样的大项目,也应该如此,以后我会逐步将具体的细节和实现写到BLOG上。以下是我对innodb基础的数据结构和算法的理解。

1.vector

innodb的vector是个动态数组的数据结构,和c++的STL用法相似,值得一提的是vector的内存分配可以通过函数指针来指定是从heap内存池堆上分配内存还是用OS自带的malloc来分配内存。内存分配器的结构为:

        struct ib_alloc_t {
             ib_mem_alloc_t	mem_malloc; 				//分配器的malloc函数指针
             ib_mem_free_t	mem_release;  				//分配器的free函数指针
             ib_mem_resize_t	mem_resize;  				//分配器的重新定义堆大小指针
             void*	 arg;     					//堆句柄,如果是系统的malloc方式,这个值为NULL
<span style="white-space:pre">	</span>};

vector内部集成了排序功能函数,其排序的算法是通过qsort(快速)来进行排序。

vector内存结构:

2.内存list

innodb的list数据结构是个标准的双向链表结构,ib_list_node_t当中有指向前一个node的prev和指向后一个

node的next,list的内存分配可以通过heap内存堆来分配,也可以通过系统的malloc来分配。就看是采用

ib_list_create_heap来创建list爱是永ib_list_create来创建list。但是内部的ib_list_node_t的内存分配是通过

heap来分配的。

ist的内存结构:

3.FIFO-queue

innodb的FIFO queue是个多线程的消息队列,可以有多个线程向queue中添加消息,可有多个线程同时读取queue中的消息并进行处理。queue的mutex是保证同时只有一个线程在操作(读或者写)queue的items链表,os_event是写线程完成后通知所有读线程可以进行queue的读事件,也就是说,只有向queue写完成一个消息,才会发送event信号给读线程。queue的消息缓冲区是采用ib_list_t来做存储的,一般写的时候写在list的最后,而读总是读取list的第一个。queue处理提供一直读取到消息为止的方法以外,也提供最长等待读取消息的方法,这样读取线程没有必要一直等待消息,可以在等待一段时间后去处理其他的任务。其C结构定义如下:

struct ib_wqueue_t
{
	ib_mutex_t	mutex; /*互斥量*/
	ib_list_t*	items; /*用list作为queue的载体*/
	os_event_t	event; /*信号量*/
};

4.哈希表

innodb中的哈希表的基本构造和传统的哈希表的构造是相似的,不同的就是innodb的哈希表采用的是自定义链式桶结构,而没有采用每个桶单元用传统的list来做碰撞管理。由于这个特性,innodb中的哈希表操作采用了一系列操作宏来做操作,这样做的目的是为了能泛型的对哈希表做操作,因为在innodb中,除了操作内存中的数据以外,还会操作隐射硬盘中的数据。以下是innodb的操作宏:

HASH_INSERT                                    插入操作

HASH_DELETE                                    删除操作

HASH_GET_FIRST                               获取指定HASH key对应cell的第一个数据单元

HASH_GET_NEXT                                获取cell_node对应的下一个单元

HASH_SEARCH                                   查找对应key的值

HASH_SEARCH_ALL                            遍历整个hash table并将每个数据单元为参数执行ASSERTION操作

HASH_DELETE_AND_COMPACT        删除操作并且优化和调整heap堆上的内存分配布局,使得heap效率更高

HASH_MIGRATE                                 将OLD_TABLE的数据单元合并到NEW_TABLE当中

这些宏在调用的时候都会指定数据的类型和Next函数名。

innodb的哈希表在多线程并发模式下也提供cell级粒度的锁,有mutex类型的锁,也有rw_lock类型的锁。在hash_create_sync_obj_func函数调用过程中,会创建一个n_sync_obj的锁数据单元,n_sync_obj必须是2的N次方。也就是说如果n_sync_obj
= 8, 哈希表的n_cells = 19,那就至少两个cell公用一个锁。这是其他哈希表无法比拟的。

以下是hash table的结构定义:

struct hash_table_t
{
	enum hash_table_sync_t	type;		/*hash table的同步类型*/
	ulint			n_cells;	/*hash桶个数*/
	hash_cell_t*		array;		/*hash桶数组*/
#ifndef UNIV_HOTBACKUP
	ulint			n_sync_obj;
	union{ /*同步锁*/
		ib_mutex_t*	mutexes;
		rw_lock_t*	rw_locks;
	}sync_obj;
	/*heaps的单元个数和n_sync_obj一样*/
	mem_heap_t**		heaps;
#endif
	mem_heap_t*		heap;
	ulint			magic_n;	/*校验魔法字*/
#endif
};

5.小结

Innodb还有其他的一些数据结构,例如最小堆,这些都是通用的封装,也就不做过多的描述,在可以去看看innodb的源码相关就可以。innodb在定义数据结构的时候做了特殊的处理,例如对线程并发的控制,对内存分配的控制。这样做的目的是为了统一的管理。innodb的代码是C的,但支持C++。里面并没有使用STL这种传统的数据结构和算法,很大程度上是适合性的问题。据说MYSQL 5.7开始大量使用boost 和STL。个人感觉STL还勉强,使用boost有点步子迈大了的感觉。

时间: 2025-01-06 23:00:56

MySQL系列:innodb引擎分析之基础数据结构的相关文章

MySQL中innodb引擎分析(初始化)

MySQL的存储引擎是以插件形式工作的,这应该是MySQL的一大特色了吧! 依据<深入理解MySQL>的内容,5.1版本号时存储引擎的插件化都还不是彻底,确切的说是刚加入的特性.为MySQL加入一个存储引擎时,须要更改一些上层代码,零散的更改本来就有点麻烦,同一时候project也要又一次编译一次.我听别人说,已经能够不改C/C++代码就直接加入引擎了.这种话,折腾存储引擎的话就更方便了! 这段代码来自ha_innodb.cc,这是MySQL中申明存储引擎插件的标准过程.这段代码利用了宏.在p

MySQL数据库InnoDB引擎下服务器断电数据恢复

说明: 线上的一台MySQL数据库服务器突然断电,造成系统故障无法启动,重新安装系统后,找到之前的MySQL数据库文件夹. 问题: 通过复制文件的方式对之前的MySQL数据库进行恢复,发现在程序调用时找不到数据库中的表,造成网站无法正常访问. 分析: 1.MySQL数据库,使用拷贝文件方式来恢复数据库,只支持MyISAM引擎: 2.如果有数据库或数据表使用了InnoDB引擎,恢复的时候,必须连同MySQL数据库目录下的ibdata1文件一起拷贝过来. 解决办法: 1.停止MySQL服务 serv

mysql的INNODB引擎锁的原理试验

mysql的INNODB引擎锁的原理是怎样的,来做个试验. mysql> SELECT VERSION(); +-----------+ | VERSION() | +-----------+ | 5.5.20    | +-----------+ 1 row in set (0.00 sec) CREATE TABLE test ( a INT(5), b VARCHAR(10), c VARCHAR(10) ); INSERT INTO test VALUES(1,'111','111');

MySQL列:innodb的源代码的分析的基础数据结构

在过去的一年中的数据库相关的源代码分析.前段时间分析levelDB实施和BeansDB实现,数据库网络分析这两篇文章非常多.他们也比较深比较分析,所以没有必要重复很多劳力.MYSQL,当然主要还是数据库存储引擎,首先我还是从innodb这个最流行的开源关系数据库引擎着手来逐步分析和理解. 我一般分析源代码的时候都是从基础的数据结构和算法逐步往上分析.遇到不明确的地方,自己依照源代码又一次输入一遍并做相应的单元測试,这样便于理解.对于Innodb这种大项目,也应该如此,以后我会逐步将详细的细节和实

MySQL系列:innodb引擎分析之线程并发同步机制

innodb是一个多线程并发的存储引擎,内部的读写都是用多线程来实现的,所以innodb内部实现了一个比较高效的并发同步机制.innodb并没有直接使用系统提供的锁(latch)同步结构,而是对其进行自己的封装和实现优化,但是也兼容系统的锁.我们先看一段innodb内部的注释(MySQL-3.23): Semaphore operations in operating systems are slow: Solaris on a 1993 Sparc takes 3 microseconds (

MySQL系列:innodb引擎分析之文件IO

innodb作为数据库引擎,自然少不了对文件的操作,在innodb中所有需要持久化的信息都需要文件操作,例如:表文件.重做日志文件.事务日志文件.备份归档文件等.innodb对文件IO操作可以是煞费苦心,其主要包括两方面,一个是对异步io的实现,一个是对文件操作管理和io调度的实现.在MySQL-5.6版本的innodb还加入了DIRECT IO实现.做了这么多无非是优化io操作的性能.在innodb的文件IO部分中,主要实现集中在os_file.*和fil0fil.*两个系列的文件当中,其中o

Java面试05|MySQL及InnoDB引擎

1.InnoDB引擎索引 InnoDB支持的索引有以下几种: (1)哈希索引 (2)全文索引 (1)B+树索引 又可以分为聚集索引与辅助索引 索引的创建可以在CREATE TABLE语句中进行,也可以单独用CREATE INDEX或ALTER TABLE来给表增加索引.删除索引可以利用ALTER TABLE或DROP INDEX语句来实现. (1)使用ALTER TABLE语句创建索引.语法如下: alter table table_name add index index_name (colu

优化系列 | InnoDB引擎数据表压缩特性测试

一.前言Innodb Plugin引擎开始引入多种格式的行存储机制,目前支持:Antelope.Barracuda两种.其中Barracuda兼容Antelope格式.另外,Innodb plugin还支持行数据压缩特性,不过前提是采用Barracuda行存储格式.表空间启用压缩的前提是innodb表空间文件存储格式修改成:Barracuda,需要修改2个选项:innodb_file_format = "Barracuda"innodb_file_format_max = "

mysql数据库innodb引擎的一个重要内核参数swappiness

在linux内核中有一个叫 swappiness 的参数.可以调整内存的使用方式. 默认情况下,这个数值为60,这意味着内核会比较多的为文件系统提供内存作为缓存,甚至会将一些程序占据的内存交换到swap中以腾出内存. 这正好与使用innodb引擎的mysql数据库有冲突:innodb缓冲池本来就相当于文件系统的缓存,它会缓存住一部分读取过的数据库. 这部分内存通常不会怎么修改变动,所以操作系统就更会倾向于交换出这部分内存到swap中.这样,当mysql真的需要innodb缓冲区中 的数据时,操作