模板是的算法独立于存储的数据类型,而迭代器使算法独立于使用的容器类型。理解迭代器是理解STL的关键。
迭代器应该具备的特征:
(1)应该能够对迭代器进行解除引用的操作,以便能够访问它引用的值。即如果P是一个迭代器,则应该对*P进行定义
(2)应该能够将一个迭代器赋给另一个迭代器。如果P和Q都是迭代器,则应对P=Q定义。
(3)应该能够对迭代器进行比较,看它们是否相等。即如果P和Q都是迭代器,则应对P==Q和P!=Q进行定义。
(4)应该能够使用迭代器遍历容器中的所有元素,这可以通过迭代器定义的++P和P++来实现。
值得注意的是,常规的指针就能够满足迭代器的要求,因此可以将指针看作是一种迭代器。
说了这么多,也许你并不理解,没关系,读完下面实例,再回头看这些陈述,你就会发现so easy!
下面来看具体实例解释:
首先在double数组中搜索特定值的函数,可以这样编写该函数:
1 double * find_ar(double * ar, int n, const double & val) 2 { 3 for (int i = 0; i < n; i++) 4 if (ar[i] == val) 5 return &ar[i];//成功找到,返回该值的地址 6 return 0; //否则返回空指针 7 }
可以看出,该算法是与特定的数据容器(数组)关联在一起的;
下面是搜索另一种数据结构-----链表的算法,每个节点的指针域都指向下一个节点,链表最后一个节点的指针被设为0:
同样,该算法是与特定的数据容器(数组)关联在一起的。
1 struct Node 2 { 3 double item; 4 Node * p_next; 5 }; 6 Node * find_ll(Node * head, const double & val) 7 { 8 Node * start; 9 for (start = head; start != 0; start = start->p_next) 10 if ( start->item == val) 11 return start; 12 return 0; 13 }
于是,大神们就想:有木有一种算法可以独立于这些数据容器(链表,数组等)呢?显然,操作相同(如:都是搜索一种元素),容器一变,算法就要重写,确实很麻烦。即搞出一种算法,不论数据容器怎么变,该算法都适用。于是迭代器应运而生!
重新编写find_arr()函数:
1 typedef double * iterator; 2 iterator find_ar(iterator begin, iterator end, const double & val) 3 { 4 iterator ar; 5 for (ar = begin; ar != end; ar++) 6 { 7 if (*ar == val) 8 return ar; 9 return end;//表示没有找到 10 } 11 }
程序解释:begin是指向数组起始位置,end指向数组的超尾,解释一下超尾, 超尾就是数组最后一个元素后面的一个元素(当然有可能是空值,但显然这个元素已经不在数组范围了)的位置,特别注意不要理解为数组最后一个元素的位置,这点很重要,搞清楚begin和end的概念之后,相信上面的程序很容易理解了。至于如何让begin指向数组第一个元素,如何让end指向超尾和本讨论无关,当然也丝毫不影响对本讨论的理解,所以完全不用多想这个问题。
对于find_ll()函数,先定义一个迭代器类,看不懂没关系,只需要感性上知道这个迭代器类定义了*,++,==,!=等运算符是干啥的。大致浏览一遍,定义iterator类不是重点(否则本讨论就应该改名“类的定义及其使用”,哈哈),千万不要纠结iterator类的定义,以为这种纠结会影响对本讨论的理解,再次声明本讨论主要介绍为什么使用迭代器,以及迭代器的原理,至于具体迭代器类的定义是根据具体需要可以自定义的,不用想太多,读完这篇,只要搞懂我们使用迭代器的意义在哪里就证明你完成了阅读任务,而具体的迭代器的定义,STL里面早就有人帮我们写好了,不是我们操心的事!这里写出来只是方便讨论,感性认识一下即可。
1 struct Node 2 { 3 double item; 4 Node * p_next; 5 }; 6 class iterator 7 { 8 private: 9 Node * pt; 10 public: 11 //构造函数重构,使用列表初始化 12 iterator() : pt(0) {} 13 iterator(Node * pn) : pt(pn) {} 14 double operator * () {return pt -> item;}//定义*操作符 15 iterator& operator++() //定义++前缀操作符,及++it 16 { 17 pt = pt->p_next; 18 return *this; 19 } 20 iterator& operator++(int) //定义++后缀操作符,及it++ 21 { 22 iterator tmp = *this; 23 pt = pt->p_next; 24 return tmp; 25 } 26 //...operator==()operator!=(),etc 27 };
正如前面所说,重点不是如何定义iterator类,而是有了这样的类(库函数里有,大家不用就纠结如何定义哈,这样的类已经有了,否则我在这里废话半天有毛用),第二个搜索函数find_ll()可以改写为:
1 iterator find_ll(iterator head, const double & val) 2 { 3 iterator start; 4 for (start = head; start != 0; ++start) 5 { 6 if (*start == val) 7 return start; 8 return 0;//表示没有找到 9 } 10 }
可以发现这和find_ar()几乎相同,只是find_ar()使用超尾迭代词end,而find_ll()使用存储在最后一个节点中的空值0.
于是进一步改进,在定义数据容器的迭代器时,要求数组和链表都有一个超尾元素(C++在STL确实也是这样做的),并在迭代器达到超尾时结束搜索。这样,find_ar()和find_ll()检测数据尾的方式将相同,从而成为相同的算法。
最后做一个总结:STL遵循上面介绍的方法。首先,每个容器类(vector, list, deque)定义了相应的迭代器类型。对于其中某个类,迭代器可能是指针;而对于另一个容器类,则可能是对象。不管实现方式如何,迭代器都将提供所需要的操作,如*和++等等。其次,每一个容器类都一个超尾标记,当迭代器递增到超越容器的最后一个值后,这个值将被赋给迭代器。每个容器类都有begin()和end()方法,它们分别返回一个指向容器的第一个元素和超尾位置的迭代器。每个容器类都使用++操作,让迭代器从指向第一个元素逐步指向超尾位置,从而遍历容器中的每一个元素。
再次强调,使用容器类时,无需知道其迭代器是如何实现的,也无需知道超尾是如何实现的,而只需知道它有迭代器,其begin()返回一个指向第一个元素的迭代器,end()一个指向超尾位置的迭代器即可。