(转)数据结构之图(存储结构、遍历)

一、图的存储结构

1.1 邻接矩阵

图的邻接矩阵存储方式是用两个数组来表示图。一个一维数组存储图中顶点信息,一个二维数组(邻接矩阵)存储图中的边或弧的信息。

设图G有n个顶点,则邻接矩阵是一个n*n的方阵,定义为:

看一个实例,下图左就是一个无向图。

从上面可以看出,无向图的边数组是一个对称矩阵。所谓对称矩阵就是n阶矩阵的元满足aij = aji。即从矩阵的左上角到右下角的主对角线为轴,右上角的元和左下角相对应的元全都是相等的。

从这个矩阵中,很容易知道图中的信息。

(1)要判断任意两顶点是否有边无边就很容易了;

(2)要知道某个顶点的度,其实就是这个顶点vi在邻接矩阵中第i行或(第i列)的元素之和;

(3)求顶点vi的所有邻接点就是将矩阵中第i行元素扫描一遍,arc[i][j]为1就是邻接点;

而有向图讲究入度和出度,顶点vi的入度为1,正好是第i列各数之和。顶点vi的出度为2,即第i行的各数之和。

若图G是网图,有n个顶点,则邻接矩阵是一个n*n的方阵,定义为:

这里的wij表示(vi,vj)上的权值。无穷大表示一个计算机允许的、大于所有边上权值的值,也就是一个不可能的极限值。下面左图就是一个有向网图,右图就是它的邻接矩阵。

那么邻接矩阵是如何实现图的创建的呢?代码如下。

  1 #include <stdio.h>
  2 #include <stdlib.h>
  3 #include <curses.h>
  4
  5 typedef char VertexType;                //顶点类型应由用户定义
  6 typedef int EdgeType;                   //边上的权值类型应由用户定义
  7
  8 #define MAXVEX  100             //最大顶点数,应由用户定义
  9 #define INFINITY    65535               //用65535来代表无穷大
 10 #define DEBUG
 11
 12 typedef struct
 13 {
 14     VertexType vexs[MAXVEX];            //顶点表
 15     EdgeType   arc[MAXVEX][MAXVEX];         //邻接矩阵,可看作边
 16     int numVertexes, numEdges;      //图中当前的顶点数和边数
 17 }Graph;
 18
 19 //定位
 20 int locates(Graph *g, char ch)
 21 {
 22     int i = 0;
 23     for(i = 0; i < g->numVertexes; i++)
 24     {
 25         if(g->vexs[i] == ch)
 26         {
 27             break;
 28         }
 29     }
 30     if(i >= g->numVertexes)
 31     {
 32         return -1;
 33     }
 34
 35     return i;
 36 }
 37
 38 //建立一个无向网图的邻接矩阵表示
 39 void CreateGraph(Graph *g)
 40 {
 41     int i, j, k, w;
 42     printf("输入顶点数和边数:\n");
 43     scanf("%d,%d", &(g->numVertexes), &(g->numEdges));
 44
 45     #ifdef DEBUG
 46     printf("%d %d\n", g->numVertexes, g->numEdges);
 47     #endif
 48
 49     for(i = 0; i < g->numVertexes; i++)
 50     {
 51         g->vexs[i] = getchar();
 52         while(g->vexs[i] == ‘\n‘)
 53         {
 54             g->vexs[i] = getchar();
 55         }
 56     }
 57
 58     #ifdef DEBUG
 59     for(i = 0; i < g->numVertexes; i++)
 60     {
 61         printf("%c ", g->vexs[i]);
 62     }
 63     printf("\n");
 64     #endif
 65
 66
 67     for(i = 0; i < g->numEdges; i++)
 68     {
 69         for(j = 0; j < g->numEdges; j++)
 70         {
 71             g->arc[i][j] = INFINITY; //邻接矩阵初始化
 72         }
 73     }
 74     for(k = 0; k < g->numEdges; k++)
 75     {
 76         char p, q;
 77         printf("输入边(vi,vj)上的下标i,下标j和权值:\n");
 78
 79         p = getchar();
 80         while(p == ‘\n‘)
 81         {
 82             p = getchar();
 83         }
 84         q = getchar();
 85         while(q == ‘\n‘)
 86         {
 87             q = getchar();
 88         }
 89         scanf("%d", &w);
 90
 91         int m = -1;
 92         int n = -1;
 93         m = locates(g, p);
 94         n = locates(g, q);
 95         if(n == -1 || m == -1)
 96         {
 97             fprintf(stderr, "there is no this vertex.\n");
 98             return;
 99         }
100         //getchar();
101         g->arc[m][n] = w;
102         g->arc[n][m] = g->arc[m][n];  //因为是无向图,矩阵对称
103     }
104 }
105
106 //打印图
107 void printGraph(Graph g)
108 {
109     int i, j;
110     for(i = 0; i < g.numVertexes; i++)
111     {
112         for(j = 0; j < g.numVertexes; j++)
113         {
114             printf("%d  ", g.arc[i][j]);
115         }
116         printf("\n");
117     }
118 }
119
120 int main(int argc, char **argv)
121 {
122     Graph g;
123
124     //邻接矩阵创建图
125     CreateGraph(&g);
126     printGraph(g);
127     return 0;
128 }

 从代码中可以得到,n个顶点和e条边的无向网图的创建,时间复杂度为O(n + n2 + e),其中对邻接矩阵Grc的初始化耗费了O(n2)的时间。

1.2 邻接表

邻接矩阵是不错的一种图存储结构,但是,对于边数相对顶点较少的图,这种结构存在对存储空间的极大浪费。因此,找到一种数组与链表相结合的存储方法称为邻接表。

邻接表的处理方法是这样的:

(1)图中顶点用一个一维数组存储,当然,顶点也可以用单链表来存储,不过,数组可以较容易的读取顶点的信息,更加方便。

(2)图中每个顶点vi的所有邻接点构成一个线性表,由于邻接点的个数不定,所以,用单链表存储,无向图称为顶点vi的边表,有向图则称为顶点vi作为弧尾的出边表。

例如,下图就是一个无向图的邻接表的结构。

从图中可以看出,顶点表的各个结点由data和firstedge两个域表示,data是数据域,存储顶点的信息,firstedge是指针域,指向边表的第一个结点,即此顶点的第一个邻接点。边表结点由adjvex和next两个域组成。adjvex是邻接点域,存储某顶点的邻接点在顶点表中的下标,next则存储指向边表中下一个结点的指针。

对于带权值的网图,可以在边表结点定义中再增加一个weight的数据域,存储权值信息即可。如下图所示。

对于邻接表结构,图的建立代码如下。

/* 邻接表表示的图结构 */
#include <stdio.h>
#include<stdlib.h>

#define DEBUG
#define MAXVEX 1000         //最大顶点数
typedef char VertexType;        //顶点类型应由用户定义
typedef int EdgeType;           //边上的权值类型应由用户定义

typedef struct EdgeNode         //边表结点
{
    int adjvex;         //邻接点域,存储该顶点对应的下标
    EdgeType weigth;        //用于存储权值,对于非网图可以不需要
    struct EdgeNode *next;      //链域,指向下一个邻接点
}EdgeNode;

typedef struct VertexNode       //顶点表结构
{
    VertexType data;        //顶点域,存储顶点信息
    EdgeNode *firstedge;        //边表头指针
}VertexNode, AdjList[MAXVEX];

typedef struct
{
    AdjList adjList;
    int numVertexes, numEdges;  //图中当前顶点数和边数
}GraphList;

int Locate(GraphList *g, char ch)
{
    int i;
    for(i = 0; i < MAXVEX; i++)
    {
        if(ch == g->adjList[i].data)
        {
            break;
        }
    }
    if(i >= MAXVEX)
    {
        fprintf(stderr,"there is no vertex.\n");
        return -1;
    }
    return i;
}

//建立图的邻接表结构
void CreateGraph(GraphList *g)
{
    int i, j, k;
    EdgeNode *e;
    EdgeNode *f;
    printf("输入顶点数和边数:\n");
    scanf("%d,%d", &g->numVertexes, &g->numEdges);

    #ifdef DEBUG
    printf("%d,%d\n", g->numVertexes, g->numEdges);
    #endif

    for(i = 0; i < g->numVertexes; i++)
    {
        printf("请输入顶点%d:\n", i);
        g->adjList[i].data = getchar();          //输入顶点信息
        g->adjList[i].firstedge = NULL;          //将边表置为空表
        while(g->adjList[i].data == ‘\n‘)
        {
            g->adjList[i].data = getchar();
        }
    }
    //建立边表
    for(k = 0; k < g->numEdges; k++)
    {
        printf("输入边(vi,vj)上的顶点序号:\n");
        char p, q;
        p = getchar();
        while(p == ‘\n‘)
        {
            p = getchar();
        }
        q = getchar();
        while(q == ‘\n‘)
        {
            q = getchar();
        }
        int m, n;
        m = Locate(g, p);
        n = Locate(g, q);
        if(m == -1 || n == -1)
        {
            return;
        }
        #ifdef DEBUG
        printf("p = %c\n", p);
        printf("q = %c\n", q);
        printf("m = %d\n", m);
        printf("n = %d\n", n);
        #endif

        //向内存申请空间,生成边表结点
        e = (EdgeNode *)malloc(sizeof(EdgeNode));
        if(e == NULL)
        {
            fprintf(stderr, "malloc() error.\n");
            return;
        }
        //邻接序号为j
        e->adjvex = n;
        //将e指针指向当前顶点指向的结构
        e->next = g->adjList[m].firstedge;
        //将当前顶点的指针指向e
        g->adjList[m].firstedge = e;

        f = (EdgeNode *)malloc(sizeof(EdgeNode));
        if(f == NULL)
        {
            fprintf(stderr, "malloc() error.\n");
            return;
        }
        f->adjvex = m;
        f->next = g->adjList[n].firstedge;
        g->adjList[n].firstedge = f;
    }
}

void printGraph(GraphList *g)
{
    int i = 0;
    #ifdef DEBUG
    printf("printGraph() start.\n");
    #endif

    while(g->adjList[i].firstedge != NULL && i < MAXVEX)
    {
        printf("顶点:%c  ", g->adjList[i].data);
        EdgeNode *e = NULL;
        e = g->adjList[i].firstedge;
        while(e != NULL)
        {
            printf("%d  ", e->adjvex);
            e = e->next;
        }
        i++;
        printf("\n");
    }
}

int main(int argc, char **argv)
{
    GraphList g;
    CreateGraph(&g);
    printGraph(&g);
    return 0;
}

对于无向图,一条边对应都是两个顶点,所以,在循环中,一次就针对i和j分布进行插入。

本算法的时间复杂度,对于n个顶点e条边来说,很容易得出是O(n+e)。

1.3 十字链表

对于有向图来说,邻接表是有缺陷的。关心了出度问题,想了解入度就必须要遍历整个图才知道,反之,逆邻接表解决了入度却不了解出度情况。下面介绍的这种有向图的存储方法:十字链表,就是把邻接表和逆邻接表结合起来的。

重新定义顶点表结点结构,如下所示。

其中firstin表示入边表头指针,指向该顶点的入边表中第一个结点,firstout表示出边表头指针,指向该顶点的出边表中的第一个结点。

重新定义边表结构,如下所示。

其中,tailvex是指弧起点在顶点表的下表,headvex是指弧终点在顶点表的下标,headlink是指入边表指针域,指向终点相同的下一条边,taillink是指边表指针域,指向起点相同的下一条边。如果是网,还可以增加一个weight域来存储权值。

比如下图,顶点依然是存入一个一维数组,实线箭头指针的图示完全与邻接表相同。就以顶点v0来说,firstout指向的是出边表中的第一个结点v3。所以,v0边表结点hearvex = 3,而tailvex其实就是当前顶点v0的下标0,由于v0只有一个出边顶点,所有headlink和taillink都是空的。

重点需要解释虚线箭头的含义。它其实就是此图的逆邻接表的表示。对于v0来说,它有两个顶点v1和v2的入边。因此的firstin指向顶点v1的边表结点中headvex为0的结点,如上图圆圈1。接着由入边结点的headlink指向下一个入边顶点v2,如上图圆圈2。对于顶点v1,它有一个入边顶点v2,所以它的firstin指向顶点v2的边表结点中headvex为1的结点,如上图圆圈3。

十字链表的好处就是因为把邻接表和逆邻接表整合在一起,这样既容易找到以v为尾的弧,也容易找到以v为头的弧,因而比较容易求得顶点的出度和入度。

而且除了结构复杂一点外,其实创建图算法的时间复杂度是和邻接表相同的,因此,在有向图应用中,十字链表是非常好的数据结构模型。

这里就介绍以上三种存储结构,除了第三种存储结构外,其他的两种存储结构比较简单。

二、图的遍历

图的遍历和树的遍历类似,希望从图中某一顶点出发访遍图中其余顶点,且使每一个顶点仅被访问一次,这一过程就叫图的遍历。

对于图的遍历来说,如何避免因回路陷入死循环,就需要科学地设计遍历方案,通过有两种遍历次序方案:深度优先遍历和广度优先遍历。

2.1 深度优先遍历

深度优先遍历,也有称为深度优先搜索,简称DFS。其实,就像是一棵树的前序遍历。

它从图中某个结点v出发,访问此顶点,然后从v的未被访问的邻接点出发深度优先遍历图,直至图中所有和v有路径相通的顶点都被访问到。若图中尚有顶点未被访问,则另选图中一个未曾被访问的顶点作起始点,重复上述过程,直至图中的所有顶点都被访问到为止。

我们用邻接矩阵的方式,则代码如下所示。

 1 #define MAXVEX  100     //最大顶点数
 2 typedef int Boolean;            //Boolean 是布尔类型,其值是TRUE 或FALSE
 3 Boolean visited[MAXVEX];        //访问标志数组
 4 #define TRUE 1
 5 #define FALSE 0
 6
 7 //邻接矩阵的深度优先递归算法
 8 void DFS(Graph g, int i)
 9 {
10     int j;
11     visited[i] = TRUE;
12     printf("%c ", g.vexs[i]);                           //打印顶点,也可以其他操作
13     for(j = 0; j < g.numVertexes; j++)
14     {
15         if(g.arc[i][j] == 1 && !visited[j])
16         {
17             DFS(g, j);                  //对为访问的邻接顶点递归调用
18         }
19     }
20 }
21
22 //邻接矩阵的深度遍历操作
23 void DFSTraverse(Graph g)
24 {
25     int i;
26     for(i = 0; i < g.numVertexes; i++)
27     {
28         visited[i] = FALSE;         //初始化所有顶点状态都是未访问过状态
29     }
30     for(i = 0; i < g.numVertexes; i++)
31     {
32         if(!visited[i])             //对未访问的顶点调用DFS,若是连通图,只会执行一次
33         {
34             DFS(g,i);
35         }
36     }
37 }

如果使用的是邻接表存储结构,其DFSTraverse函数的代码几乎是相同的,只是在递归函数中因为将数组换成了链表而有不同,代码如下。

 1 //邻接表的深度递归算法
 2 void DFS(GraphList g, int i)
 3 {
 4     EdgeNode *p;
 5     visited[i] = TRUE;
 6     printf("%c ", g->adjList[i].data);   //打印顶点,也可以其他操作
 7     p = g->adjList[i].firstedge;
 8     while(p)
 9     {
10         if(!visited[p->adjvex])
11         {
12             DFS(g, p->adjvex);           //对访问的邻接顶点递归调用
13         }
14         p = p->next;
15     }
16 }
17
18 //邻接表的深度遍历操作
19 void DFSTraverse(GraphList g)
20 {
21     int i;
22     for(i = 0; i < g.numVertexes; i++)
23     {
24         visited[i] = FALSE;
25     }
26     for(i = 0; i < g.numVertexes; i++)
27     {
28         if(!visited[i])
29         {
30             DFS(g, i);
31         }
32     }
33 }

  对比两个不同的存储结构的深度优先遍历算法,对于n个顶点e条边的图来说,邻接矩阵由于是二维数组,要查找某个顶点的邻接点需要访问矩阵中的所有元素,因为需要O(n2)的时间。而邻接表做存储结构时,找邻接点所需的时间取决于顶点和边的数量,所以是O(n+e)。显然对于点多边少的稀疏图来说,邻接表结构使得算法在时间效率上大大提高。

2.2 广度优先遍历

广度优先遍历,又称为广度优先搜索,简称BFS。图的广度优先遍历就类似于树的层序遍历了。

邻接矩阵做存储结构时,广度优先搜索的代码如下。

 1 //邻接矩阵的广度遍历算法
 2 void BFSTraverse(Graph g)
 3 {
 4     int i, j;
 5     Queue q;
 6     for(i = 0; i < g.numVertexes; i++)
 7     {
 8         visited[i] = FALSE;
 9     }
10     InitQueue(&q);
11     for(i = 0; i < g.numVertexes; i++)//对每个顶点做循环
12     {
13         if(!visited[i])               //若是未访问过
14         {
15             visited[i] = TRUE;
16             printf("%c ", g.vexs[i]); //打印结点,也可以其他操作
17             EnQueue(&q, i);           //将此结点入队列
18             while(!QueueEmpty(q))     //将队中元素出队列,赋值给
19             {
20                 int m;
21                 DeQueue(&q, &m);
22                 for(j = 0; j < g.numVertexes; j++)
23                 {
24                     //判断其他顶点若与当前顶点存在边且未访问过
25                     if(g.arc[m][j] == 1 && !visited[j])
26                     {
27                         visited[j] = TRUE;
28                         printf("%c ", g.vexs[j]);
29                         EnQueue(&q, j);
30                     }
31                 }
32             }
33         }
34     }
35 } 

对于邻接表的广度优先遍历,代码与邻接矩阵差异不大, 代码如下。

 1 //邻接表的广度遍历算法
 2 void BFSTraverse(GraphList g)
 3 {
 4     int i;
 5     EdgeNode *p;
 6     Queue q;
 7     for(i = 0; i < g.numVertexes; i++)
 8     {
 9         visited[i] = FALSE;
10     }
11     InitQueue(&q);
12     for(i = 0; i < g.numVertexes; i++)
13     {
14         if(!visited[i])
15         {
16             visited[i] = TRUE;
17             printf("%c ", g.adjList[i].data);   //打印顶点,也可以其他操作
18             EnQueue(&q, i);
19             while(!QueueEmpty(q))
20             {
21                 int m;
22                 DeQueue(&q, &m);
23                 p = g.adjList[m].firstedge;     找到当前顶点边表链表头指针
24                 while(p)
25                 {
26                     if(!visited[p->adjvex])
27                     {
28                         visited[p->adjvex] = TRUE;
29                         printf("%c ", g.adjList[p->adjvex].data);
30                         EnQueue(&q, p->adjvex);
31                     }
32                     p = p->next;
33                 }
34             }
35         }
36     }
37 }

  对比图的深度优先遍历与广度优先遍历算法,会发现,它们在时间复杂度上是一样的,不同之处仅仅在于对顶点的访问顺序不同。可见两者在全图遍历上是没有优劣之分的,只是不同的情况选择不同的算法。

时间: 2024-10-12 20:16:16

(转)数据结构之图(存储结构、遍历)的相关文章

数据结构之图(存储结构、遍历)

新学期开始了,开始专心于技术上了,上学期的寒假总是那么短暂,飘飘乎就这样逝去,今天补补上学期还没学完的数据结构---图,希望能和大家一起探讨,共同进步~ 定义: 图是由顶点集合及顶点间的关系集合组成的一种数据结构. 图的存储结构: 1.1 邻接矩阵 图的邻接矩阵存储方式是用两个数组来表示图.一个一维数组存储图中顶点信息,一个二维数组(邻接矩阵)存储图中的边或弧的信息. 设图G有n个顶点,则邻接矩阵是一个n*n的方阵,定义为: 看一个实例,下图左就是一个无向图. 从上面可以看出,无向图的边数组是一

图存储与遍历的一些技巧

1. 广度优先遍历 图的广度优先遍历伪代码如下,其中Q为队列,visited为大小为n的bool数组. memset(visited, false, n);//n是图G结点个数 for u∈G if !visited[u] Q.push(u); while !Q.empty() v = Q.pop(); for each v's neighbors w if !visited[w] visited[w] = ture; Q.push(w); endif endfor endwhile endif

图 - 存储结构之邻接表

对于图来说,邻接矩阵是不错的一种图存储结构,但是我们也发现,对于边数相对顶点较少的图,这种结构是存在对存储空间的极大浪费的.因此我们考虑另外一种存储结构方式:邻接表(Adjacency List),即数组与链表相结合的存储方法. 邻接表的处理方法是这样的. 1.图中顶点用一个一维数组存储,另外,对于顶点数组中,每个数据元素还需要存储指向第一个邻接点的指针,以便于查找该顶点的边信息. 2.图中每个顶点vi的所有邻接点构成一个线性表,由于邻接点的个数不定,所以用单链表存储,无向图称为顶点vi的边表,

数据结构之图 Part3 – 2 遍历

BFS using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace LH.GraphConsole { class Program { private static bool[] visited; private static Queue<int> rootVertexQueue = new Queue<int>(); static void Main

数据结构之图 Part3 – 1 遍历

DFS using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace LH.GraphConsole { class Program { private static bool[] visited; static void Main(string[] args) { DFSTranverse(); } private static void DFSTranverse(

rwkj 1501 数据结构:图的DFS遍历

数据结构:图的DFS遍历 时间限制(普通/Java):1000MS/3000MS            运行内存限制:65536KByte 总提交:259            测试通过:183 描述 从已给的连通图中某一顶点出发,沿着一些边访遍图中所有的顶点,且使每个顶点仅被访问一次,就叫做图的遍历.图的遍历的遍历有DFS和BFS两种. 上面的图,从顶点0出发,按照顶点序号从小到大的顺序DFS,得到遍历顺序为0 1 2 3  4 5 6 7 8. 输入 输入图的顶点个数(<20)与边数,以及每

js数据结构与算法存储结构

数据结构(程序设计=数据结构+算法) 数据结构就是关系,没错,就是数据元素相互之间存在的一种或多种特定关系的集合. 传统上,我们把数据结构分为逻辑结构和物理结构. 逻辑结构:是指数据对象中数据元素之间的相互关系,也是我们今后最需要关注和讨论的问题. 物理结构:是指数据的逻辑结构在计算机中的存储形式. 常用的数据结构有: 数组,队列(queue),堆(heap),栈(stack),链表(linked list ),树(tree),图(graph)和散列表(hash) 栈(stack):运算只在表的

数据结构 - 二叉树的存储结构

顺序存储结构 二叉树存储结构的类型定义: #define MAX_SIZE 100 typedef telemtype sqbitree[MAX_SIZE]; 用一组地址连续的存储单元依次"自上而下.自左至右"存储完全二叉树的数据元素. 对于完全二叉树上编号为i的结点元素存储在一维数组的下标值为i-1的分量中,如图6-6(c)所示. 对于一般的二叉树,将其每个结点与完全二叉树上的结点相对照,存储在一维数组中, 链式存储结构 设计不同的结点结构可构成不同的链式存储结构. (1) 结点的类

数据结构 - 逻辑结构和存储结构

程序=算法+数据结构 N.沃思(Niklaus Wirth)教授提出: 程序=算法+数据结构 以上公式说明了如下两个问题: (1)算法决定如何构造和组织数据(算法→数据结构). (2)算法的选择依赖于作为基础的数据结构(数据结构→算法). 软件=程序+文档(软件工程的观点) 求解非数值计算的问题 主要考虑的是设计出合适的数据结构及相应的算法. 即:首先要考虑对相关的各种信息如何表示.组织和存储? 因此,可以认为:数据结构是一门研究非数值计算的程序设计问题中计算机的操作对象以及它们之间的关系和操作

浅谈数据结构之二叉树存储结构实现(七)

树:是n个结点的有限集:n=0时称为空树.在任意一棵非空树中,有且只有一个特定的结点称为根结点:其余的结点可分为m(m>0)个互不相交的有限集,其中每一个有限集都是一棵子树.结点拥有的子树数称为结点的度:度为0的结点称为叶结点或者终端结点,度不为0的结点称为分支结点或者非终端结点:树的度就是树内各结点的度的最大值. 二叉树的特点有:(1).每个结点最多有两棵子树,所以二叉树不存在度大于2的结点(注意:不是只有两棵子树,而是最多有两棵子树,没有子树或者有一颗子树都是可以的);(2).左子树和右子树