我们知道标准库中的容器有vector,list和deque。另外还有slist,只不过它不是标准容器。而谈到容器,我们不得不知道进行容器一切操作的利器---迭代器。而在了解迭代器之前,我们得先知道每个容器的结构,包括它的逻辑结构和物理结构。让我们先说说vector:
一、vector
我们先来看看vector容器内元素在内存中的布局:
其中的#0,#1...就是容器内的元素。从上图可以看出vector维护的是一个连续的线性空间,和数组是一样的。所以不论其元素为何种型别,普通指针就可以作为vector的迭代器!因为vector迭代器所需要的操作如operator*,operator->,operator++,operator+,operator-,operator+=,operator-=,普通指针天生就具备。查看vector的源码,我们可以看到vector的迭代器并没有另外定义为一个模版类,而是直接
typedef value_type* iterator。 更可以看出 vector
的迭代器就是一个普通指针。对于普通指针,我就不在多说。相信大家也早已理解。
二、list
还是先来看看list的结构:从list的名字我们就可以看出 list
的结构应该是一个链表,事实上他的结构确实是一个链表---一个环状双向链表。他的结构图如下:;
画的可能有点乱,但是如果你知道双链表的结构,你可以自行画出。上图的每个结点就是 list
容器中用来保存元素值的结构了。其中的#0,#1...就是容器的实际保存的元素值。而 list 的迭代器本身是一个模板类,我们看看 list
的迭代器设计:
template<class T, class Ref, class Ptr>
struct __list_iterator {
//定义了一些类型的别名
typedef __list_iterator<T, T&, T*> iterator;
typedef __list_iterator<T, const T&, const T*> const_iterator;
typedef __list_iterator<T, Ref, Ptr> self;typedef bidirectional_iterator_tag iterator_category;
typedef T value_type;
typedef Ptr pointer;
typedef Ref reference;
typedef __list_node<T>* link_type;
typedef size_t size_type;
typedef ptrdiff_t difference_type;link_type node;
//构造函数
__list_iterator(link_type x) : node(x) {}
__list_iterator() {}
__list_iterator(const iterator& x) : node(x.node) {}//重载操作符
bool operator==(const self& x) const { return node == x.node; }
bool operator!=(const self& x) const { return node != x.node; }
reference operator*() const { return (*node).data; }#ifndef __SGI_STL_NO_ARROW_OPERATOR
pointer operator->() const { return &(operator*()); }
#endif /* __SGI_STL_NO_ARROW_OPERATOR */self& operator++() {
node = (link_type)((*node).next);
return *this;
}
self operator++(int) {
self tmp = *this;
++*this;
return tmp;
}
self& operator--() {
node = (link_type)((*node).prev);
return *this;
}
self operator--(int) {
self tmp = *this;
--*this;
return tmp;
}
};
这个迭代器的模板类其实并没有多少东西。只包括:
1.定义一些类型别名
2.定义一个 node 成员变量
3.必要的构造函数和重载了的操作符
其中真正起作用的是 node 成员变量,它是指向 list 链表结构的结点的普通指针, list 链表结点的结构定义代码如下:
template <class T>
struct __list_node {
typedef void* void_pointer;
void_pointer next;
void_pointer prev;
T data;
};
就是一般的结构体啦,不过这里是模板形式的。其中的 prev 和 next是双向链表必须的两个指针分别指向前一个结点和后一个结点。data
用来保存实际的值。可以看出,list 的迭代器只是封装了 list node 的指针
,并重载了迭代器应有的操作符而已。想想我们在用普通操作链表的时候,要想指向下一个结点,也就是实现指针的自增是怎么做的?是不是用 p =
p->next啊,只不过这里把他用++操作符代替了我们的操作,更加方便了而已!所以 list 的迭代器也挺简单。list 迭代器重载了 ==, !=,
*, ->, 前置++,后置++,前置--,后置--。没有重载 +,-,+=,-n,所以 list 的迭代器只是一个 Bidirectional
Iterator。而 vector 的迭代器是普通指针,它是 Random Access Iterator。
三、deque
我们知道 vector 是个单向开口的连续线性空间,而 deque 则是一种双向开口的连续线性空间。所以 vector
从尾端插入元素效率较高,而如果从头部插入,则效率奇差。deque 可以从两端插入,效率也很高。在介绍 deque 迭代器之前,我们先来了解一下 deque
的逻辑结构。deque 到底是什么样的一个结构、在内存中如何布局,才可以从两端插入且是连续线性空间呢?我还是先来张图,根据图我们再娓娓道来:
看到这个图,大家也许蒙了,第一反映是怎么这么复杂?跟 vector
内存布局比起来,确实很复杂。因为它并不是真正的连续线性空间,而是模拟的。看到图中标志的缓冲区(node-buffer)没,它才是用来存储 deque
容器元素的真正承担者。他们是一段段定量连续空间。其大小可以自己指定,默认是 512bytes。接下来我们看看 map
这个结构:它也是一个连续的线性空间,不过它保存的是指向每个缓冲区(node-buffer)首地址的指针。map 起着中央控制器的作用,所以我们称其为中控器。既然
deque 在内存中如此布局,那如何伪装成一个连续的线性空间呢?造成这个假象的任务全落到了迭代器的身上。我们来看看 deque
迭代器、中控器、缓冲区之间的相互关系: 为了更好的说明问题,我给出一个实际的例子。现在假设有一个 deque 有 20 个元素,每个缓冲区是 8
个元素大小。其结构如下图:
我们看到实例中有三个缓冲区(node-buffer),可以保存24个元素,而现在deque只有20个,所以还剩4个剩余空间(图中灰色部分)。map是中控器,我们可以看到其并没有满,而且起始位置也不是在
map 首地址,这都是为了能够实现在头尾两端进行插入。再看看 start 和 finish,他们分别是 deque 的 begin()和 end()
返回的迭代器。看完迭代器、中控器、缓冲区之间的关系,我们来看看 deque 迭代器的代码:
1 //确定缓冲区大小的函数
2 inline size_t __deque_buf_size(size_t n, size_t sz)
3 {
4 return n != 0 ? n : (sz < 512 ? size_t(512 / sz) : size_t(1));
5 }
6
7 template <class T, class Ref, class Ptr>
8 struct __deque_iterator {
9 //定义一些类型别名
10 typedef __deque_iterator<T, T&, T*> iterator;
11 typedef __deque_iterator<T, const T&, const T*> const_iterator;
12 static size_t buffer_size() {return __deque_buf_size(0, sizeof(T)); }
13
14 typedef random_access_iterator_tag iterator_category;
15 typedef T value_type;
16 typedef Ptr pointer;
17 typedef Ref reference;
18 typedef size_t size_type;
19 typedef ptrdiff_t difference_type;
20 typedef T** map_pointer;
21
22 typedef __deque_iterator self;
23
24 //图片中的几个指针
25 T* cur;
26 T* first;
27 T* last;
28 //中控器结点
29 map_pointer node;
30
31 //构造函数
32 __deque_iterator(T* x, map_pointer y)
33 : cur(x), first(*y), last(*y + buffer_size()), node(y) {}
34 __deque_iterator() : cur(0), first(0), last(0), node(0) {}
35 __deque_iterator(const iterator& x)
36 : cur(x.cur), first(x.first), last(x.last), node(x.node) {}
37
38 //以下全是重载
39 reference operator*() const { return *cur; }
40 pointer operator->() const { return &(operator*()); }
41 //注意这个操作符
42 difference_type operator-(const self& x) const {
43 return difference_type(buffer_size()) * (node - x.node - 1) +
44 (cur - first) + (x.last - x.cur);
45 }
46 //注意这个操作符
47 self& operator++() {
48 ++cur;
49 if (cur == last) {
50 set_node(node + 1);
51 cur = first;
52 }
53 return *this;
54 }
55 self operator++(int) {
56 self tmp = *this;
57 ++*this;
58 return tmp;
59 }
60
61 self& operator--() {
62 if (cur == first) {
63 set_node(node - 1);
64 cur = last;
65 }
66 --cur;
67 return *this;
68 }
69 self operator--(int) {
70 self tmp = *this;
71 --*this;
72 return tmp;
73 }
74 //注意这个操作符
75 self& operator+=(difference_type n) {
76 difference_type offset = n + (cur - first);
77 if (offset >= 0 && offset < difference_type(buffer_size()))
78 cur += n;
79 else {
80 difference_type node_offset =
81 offset > 0 ? offset / difference_type(buffer_size())
82 : -difference_type((-offset - 1) / buffer_size()) - 1;
83 set_node(node + node_offset);
84 cur = first + (offset - node_offset * difference_type(buffer_size()));
85 }
86 return *this;
87 }
88
89 self operator+(difference_type n) const {
90 self tmp = *this;
91 return tmp += n;
92 }
93
94 self& operator-=(difference_type n) { return *this += -n; }
95
96 self operator-(difference_type n) const {
97 self tmp = *this;
98 return tmp -= n;
99 }
100
101 reference operator[](difference_type n) const { return *(*this + n); }
102
103 bool operator==(const self& x) const { return cur == x.cur; }
104 bool operator!=(const self& x) const { return !(*this == x); }
105 bool operator<(const self& x) const {
106 return (node == x.node) ? (cur < x.cur) : (node < x.node);
107 }
108 //用来跳一个缓冲区
109 void set_node(map_pointer new_node) {
110 node = new_node;
111 first = *new_node;
112 last = first + difference_type(buffer_size());
113 }
114 };
代码中最重要的就是迭代器重载的那些操作符,有*,->,-,前置++,后置++,前置--,后置--,+=,+,-=,-,[],==,!=,<!可以看出
deque 的迭代器是一个 Random Access
Iterator。我们要注意的几个操作符是++,--,+=,-=,+,-,这些操作都涉及到指针的移动,而deque是伪连续线性空间,在到移动到一个缓冲区尾部时,应该要用函数set_node()跳到下一个缓冲区。也就是说,我们要处理好边界情况。deque
的迭代器有些复杂,关键我们要知道 deque 的逻辑结构,才能知道迭代器操作符的的具体操作步骤。