C++ 《STL源码剖析》学习-vector

  本文章是笔者学习《STL源码剖析》的学习笔记,记录的是笔者的个人理解,因为个人的水平有限,难免会有理解不当的地方,而且该书出版的时间比较久,难免会有些不一样。如有不当,欢迎指出。

  vector是c++中经常用到的数据结构,而且在面试时也会有提及,因此了解vector很重要。

  一说到vector,我们就很容易想到另外一个与它十分相似的数据结构,关于它们之间显著的差别,我觉得是在于空间运用的灵活性上。数组是静态的,在声明的时候就要指明其具体的空间大小,而vector是动态的,随着元素的增加,它内部机制会自行扩充以容纳新元素。



  这里提及一个问题。

1 #include <iostream>
2
3 int main() {
4     int len;
5     std::cin >> len;
6     int arr[len];
7     return 0;
8 }

  如上的一小段代码,在VS中编译会报错,而在g++编译器中却能顺利通过,这里个人不是很理解,或许是跟编译器内部的编译规则有关系。



  平时,我们要使用vector的时候,声明如下

std::vector<int> vec0;std::vector<int> vec1(10);std::vector<int> vec2(10, 0);

  这短短的一句代码中,到底是做了些什么呢?

  我们还是先看看书中给出的部分代码吧。

 1 template <class T, class Alloc = alloc>
 2 class vector {
 3
 4 ...
 5
 6 protected:
 7   typedef simple_alloc<value_type, Alloc> data_allocator;
 8   iterator start;                                     //表示目前使用空间的头
 9   iterator finish;                                   //表示目前使用空间的尾
10   iterator end_of_storage;                        //表示目前可用空间的尾
11
12   void fill_initialize(size_type n, const T& value) {
13         start = allocate_and_fill(n, value);
14         finish = start + n;
15         end_of_storage = finish;
16   }
17
18    // 分配空间并填满内容
19    iterator allocate_and_fill(size_type n, const T& x) {
20         iterator result = data_allocator::allocate(n);
21         uninitialized_fill_n(result, n, x);
22         return result;
23     }
24
25 ...
26
27 public:
28     vector() : start(0), finish(0), end_of_storage(0) {}
29     vector(size_type n, const T& value) {fill_initialize(n, value);}
30     vector(int n, const T& value) {fill_initialize(n, value);}
31     vector(long n, const T& value) {fill_initialize(n, value);}
32     explicit vector(size_type n) {fill_initialize(n, T());}
33 ...
34 }

  上述中可以看到vector部分构造函数,其中默认构造函数只是把所有的迭代器都初始化为0,这是最简单的了,但注意它并没有申请内存空间。另外4个大同小异,都向堆申请了大小为n的内存空间,只是初始化这些空间的时候进行的操作不一样而已:3个用传入的形参来进行初始化,1个用T类型的值初始化T()来进行初始化。这4个构造函数都用同一个函数fill_initialize()来进行堆空间的申请并且初始化。现在让我们看看这个函数到底干了些什么。

void fill_initialize(size_type n, const T& value) {
        start = allocate_and_fill(n, value);
        finish = start + n;
        end_of_storage = finish;
}

  这个函数不难理解,它要做的工作主要是初始化迭代器。它接受两个参数n和value,n指明了要申请的堆空间大小,value指明了要初始化这些堆空间的内容,并把它们传给另外一个函数allocate_and_fill() ,该函数才是真正的申请堆空间和初始化。接着fill_initialize()就根据allocate_and_fill() 返回的迭代器来初始化start迭代器,并且初始化finish和end_of_storage迭代器。

  以下再让我们看看allocate_and_fill() 函数。

  // 分配空间并填满内容
iterator allocate_and_fill(size_type n, const T& x) {
         iterator result = data_allocator::allocate(n);
         uninitialized_fill_n(result, n, x);
         return result;
 }

  从函数的名字我们都可以大概知道它是要干什么的了。它接受来自fill_initialize()的两个参数,该两个参数的含义在前面已提及。然后申请堆空间并初始化。data_allocator实质上就是simple_alloc<value_type, Alloc>,simple_alloc是SGI STL的空间配置器,SGI STL的空间配置器的简单介绍请点这里或自行谷歌。若果是SGI STL第一级配置器那么data_allocator::allocate()实质上就是直接调用c语言中的malloc()来申请堆空间;若是第二级配置器,就先考察申请区块是否大于128bytes,若是大于则转调用第一级配置器,否则就以内存池来管理,目的是为了避免太多小额区块造成内存碎片化。

  在讲完data_allocator::allocate()后,我们不妨看看uninitialized_fill_n(),它定义在<stl_uninitialized.h>中。<stl_uninitialized.h>定义了一些全局函数,如uninitialized_fill_n(),用来填充或复制大块内存数据,以便提高效率。

template<class ForwardIterator, class SIze, class T>
ForwardIterator uninitialized_fill_n(ForwardIterator first, Size n, const T& x);

  迭代器first指向将要初始化空间的起始处;n表示将要初始化空间的的大小;x表示初始化的值。如果[first,first+n)范围内的每一个迭代器都指向未初始化的内存,那么uninitialized_fill_n()会调用copy constructor,在该范围内产生x的副本,但注意一点是在此过程中若任何一个copy constructor丢出异常,uninitialized_fill_n()必须析构已产生的所有元素。

  说完vector的构造,那么就先看看析构函数吧。

... ...

~vector() {
    destroy(start, finish);
    dellocate();
}

... ...

  析构函数很简单,就调用两个函数:destroy()和dellocate()。destroy()负责对象的析构,这个下面将要讲述。dellocate()负责释放申请的堆空间。这里释放的方式又与空间配置器相关。若果是第一级配置器,就直接调用c语言中free()函数,这正如申请时的简便。但若果是第二级配置器,则比较复杂一些,具体请参考这里或自行谷歌。

  上面的内容就是关于vector申请和释放堆空间的大概过程,但仅仅是申请和释放堆空间而已。

  为了能继续下去,我们来看看下面的代码。

class Foo {..};
Foo* pf = new Foo;             // 分配内存,然后构造对象
delete pf;                     // 将对象析构,然后释放内存

  上述的new操作符做了两件事:(1)分配内存(2)调用Foo::Foo()构造对象。

  同样,delete操作符也做了两件事:(1)调用Foo::~Foo()将对象析构(2)释放内存

  但是,在STL 配置器中为了精密分工,把这些操作都细分开来。具体来说就是

  ::construct()负责对象的构造

  ::destroy()负责对象的析构

  alloc::allocate()负责内存分配

  alloc::deallocate()负责内存释放

  上面vector的内存操作所用到就是alloc::allocate(),alloc::deallocate(),这里就不在讲述了。

  construct()和destroy()都包含在<stl_construct.h>内。

// 这是construct()函数
template <class T1, class T2>
inline void construct(T1* p, const T2& value) {
    new (P) T1(value);  // placement new;调用T1::T1(value)
}

  上述construct()接受一个指针p和一个初值value,该函数的用途就是将初值拷贝一份到指针所指的空间上,这个还是简单明了的。

  接着是destroy()。这个函数有两个版本,先看第一个版本。

// 第一个版本template <class T>
inline void destroy(T* pointer) {
    pointer->~T();
}

  第一个版本接受一个指针,调用析构函数将该指针所指的对象析构。

// 第二个版本
template<class ForwardIterator, class T>
inline void destroy(ForwardIterator first, ForwardIterator last, T*) {
    __destroy(first, last, value_type(first));
}

  第二版本接受first和last两个迭代器,将[first, last)范围内的所有对象析构掉。这里还要考虑效率问题,但代码上不再展开。

  好了,对对象的构建和析构的过程有了基本的认识后,再看看vector的push_back()函数的实现吧

1 void push_back(const T& x) {
2     if (finish != end_of_storage) {
3         construct(finish, x);
4         ++finish;
5     } else {
6         insert_aux(end(), x);
7      }
8 }    

  当我们把元素push_back到vector的尾端后,函数首先检查是否还有备用的空间,如果有的话就调用construct()函数,在finish迭代器指定的位置上构建x对象,同时改变finish迭代器,使其自增1。

  然而若果没有备用空间,就需要扩充空间了,这就是insert_aux()函数所要做的。

 1 template <class T, class Alloc>
 2     void insert_aux(iterator position, const T& x)
 3     {
 4         if (finish != end_of_storage)    // 还有备用空间
 5         {
 6             // 在备用空间起始处构造一个元素,并以vector最后一个元素值为其初值
 7             construct(finish, *(finish - 1));
 8             ++finish;
 9             T x_copy = x;
10             copy_backward(position, finish - 2, finish - 1);
11             *position = x_copy;
12         }
13         else   // 已无备用空间
14         {
15             const size_type old_size = size();
16             const size_type len = old_size != 0 ? 2 * old_size : 1;
17             // 以上配置元素:如果大小为0,则配置1(个元素大小)
18             // 如果大小不为0,则配置原来大小的两倍
19             // 前半段用来放置原数据,后半段准备用来放置新数据
20
21             iterator new_start = data_allocator::allocate(len);  // 实际配置
22             iterator new_finish = new_start;
23             // 将内存重新配置
24             try
25             {
26                 // uninitialized_copy()的第一个参数指向输入端的起始位置
27                 // 第二个参数指向输入端的结束位置(前闭后开的区间)
28                 // 第三个参数指向输出端(欲初始化空间)的起始处
29
30                 // 将原vector的安插点以前的内容拷贝到新vector
31                 new_finish = uninitialized_copy(start, position, new_start);
32                 // 为新元素设定初值 x
33                 construct(new_finish, x);
34                 // 调整已使用迭代器的位置
35                 ++new_finish;
36                 // 将安插点以后的原内容也拷贝过来
37                 new_finish = uninitialized_copy(position, finish, new_finish);
38             }
39             catch(...)
40             {
41                 // 回滚操作
42                 destroy(new_start, new_finish);
43                 data_allocator::deallocate(new_start, len);
44                 throw;
45             }
46             // 析构并释放原vector
47             destroy(begin(), end());
48             deallocate();
49
50             // 调整迭代器,指向新vector
51             start = new_start;
52             finish = new_finish;
53             end_of_storage = new_start + len;
54         }
55     }            

  从代码中可以知道,当备用空间不足时,vector做了以下的工作:

  1. 重新分配空间(15~22行):若原来的空间大小为0,则扩充空间为1,否则扩充为原来的两倍。
  2. 移动数据(31~37行)
  3. 释放原空间(47~48行)
  4. 更新迭代器(51~53行)

  当调用默认构造函数构造vector时,其空间大小为0,但当我们push_back一个元素到vector尾端时,vector就进行空间扩展,大小为1,以后每当备用空间用完了,就将空间大小扩展为原来的两倍。

  注意的是,所谓动态增加大小,并不是在原空间之后接续新空间,(因为无法保证原空间之后上有可供分配的空间),而是以原大小的两倍来另外分配一块较大空间,因此,一旦空间重新分配,指向原vector的所有迭代器就会失效,这里要特别注意。

  讲完push_back()函数,我们再看看pop_back()函数吧。

void pop_back() {
    --finish();                // 将尾端迭代器往前移一格,表示将放弃尾端元素
    destroy(finish);          // 析构对象
}

  相比push_back()函数,pop_back()函数简单多了,这里就不再叙述。



  到这里,对vector已经有了基本的认识了,当然还有一些函数,如erase(),就不再展开了,其实都是离不开四个主要操作:堆空间的申请与释放,对象的创建与销毁。

  当然了,知道了不一定意味着用得好,平时还是要多加总结和训练的。

  加油吧~~朝着一个新高度前进~~

时间: 2024-10-26 02:40:26

C++ 《STL源码剖析》学习-vector的相关文章

c++ stl源码剖析学习笔记(一)

template <class InputIterator, class ForwardIterator>inline ForwardIterator uninitialized_copy(InputIterator first, InputIterator last,ForwardIterator result) 函数使用示例 #include <algorithm> #include <iostream> #include <memory> #inclu

stl源码剖析学习笔记(二)traits编程技法简明例程

解释说明 traits侯捷老师的翻译是萃取.其目的就是在编译期进行模板调用的类型识别,从而做一些事情. 最突出的例子,我觉得不是<STL源码剖析>中"迭代器概念与traits编程技法"这一章的说明,而是stl算法中copy的实现.代码在stl源码的stl_algobase.h中. copy的最终实现,大致分为两类,一类是直接整块内存的memmove操作,另一类是一个个对象赋值.其中涉及has_trivial_assignment_operator的类型推断. 如果has_t

STL源码剖析 学习笔记

目录: 第二章 空间适配器 第三章 迭代器 第四章 序列式容器(vector,list,deque,stack,heap,priority_queue,slist) 第五章 关联式容器(树的算法 + RB_tree ,set,map,hashtable) 第六章 算法 第七章 仿函数 第八章 适配器(adapet) 第二章 空间适配器 具有次配置力的SGI空间适配器,STL allocator将对象的内存分配和初始化分离开,内存配置由alloc:allocate 负责,内存释放由dealloca

c++ stl源码剖析学习笔记(二)iterator auto_ptr(老版本书籍示例 新版本C++中已经废除此概念)

ITERATOR template<class InputIterator,class T> InputIterator find(InputIterator first,InputIterator last,const T& value) { while(first != last && *first != value) ++first; return first; } 代码示例 1 #include <iostream> 2 #include <v

《STL源码剖析》学习之traits编程

侯捷老师在<STL源码剖析>中说到:了解traits编程技术,就像获得“芝麻开门”的口诀一样,从此得以一窥STL源码的奥秘.如此一说,其重要性就不言而喻了.      之前已经介绍过迭代器,知道了不同的数据结构都有自己专属的迭代器,不同的迭代器也有不同的特性,由于算法的接口是统一的,通过迭代器的不同属性,算法自动选择正确的执行流程,在完全任务的同时,也尽可能提高算法的执行效率.那算法如何获知迭代器的属性呢?这一光荣的任务就是traits完成的.在STL实现中,traits编程技术得到大量的运用

STL源码剖析——STL算法之find查找算法

前言 由于在前文的<STL算法剖析>中,源码剖析非常多,不方便学习,也不方便以后复习,这里把这些算法进行归类,对他们单独的源码剖析进行讲解.本文介绍的STL算法中的find.search查找算法.在STL源码中有关算法的函数大部分在本文介绍,包含findand find_if.adjacent_find.search.search_n.lower_bound. upper_bound. equal_range.binary_search.find_first_of.find_end相关算法,下

STL源码剖析——STL算法之merge合并算法

前言 由于在前文的<STL算法剖析>中,源码剖析非常多,不方便学习,也不方便以后复习,这里把这些算法进行归类,对他们单独的源码剖析进行讲解.本文介绍的STL算法中的merge合并算法.源码中介绍了函数merge.inplace_merge.并对这些函数的源码进行详细的剖析,并适当给出使用例子,具体详见下面源码剖析. merge合并算法源码剖析 // merge, with and without an explicitly supplied comparison function. //将两个

STL源码剖析——STL算法之remove删除算法

前言 由于在前文的<STL算法剖析>中,源码剖析非常多,不方便学习,也不方便以后复习,这里把这些算法进行归类,对他们单独的源码剖析进行讲解.本文介绍的STL算法中的remove删除算法,源码中介绍了函数remove.remove_copy.remove_if.remove_copy_if.unique.unique_copy.并对这些函数的源码进行详细的剖析,并适当给出使用例子,具体详见下面源码剖析. remove移除算法源码剖析 // remove, remove_if, remove_co

STL源码剖析之组件

本篇文章开始,进行STL源码剖析的一些知识点,后续系列笔记全是参照<STL源码剖析>进行学习记录的 STL在现在的大部分项目中,实用性已经没有Boost库好了,毕竟STL中仅仅提供了一些容器供编码者实用,Boost库相对而言全面了许多,所以更适合做一些项目的开发.但STL源码中依然有很多我们值得学习,思考的地方,包括现在大部分面试,都会问及到STL的框架源码部分.所以决定将这本书其中重要的几个部分拉出来做个笔记,以加深记忆并和大神们探讨探讨. 先简单介绍一下STL中的大致组成部分,一张图就明了