题目大意
给出一棵家谱树,树中的节点都有一个名字,保证每个名字都是唯一的,然后进行若干次查询,找出两个名字的最近公共祖先。
题目链接最近公共祖先
分析
数据量大,根据题目提示,采用Tarjan + 并查集算法,进行离线LCA查询操作。即先将所有的查询存储下来,然后统一DFS遍历一遍家族树,在遍历的过程中对遍历到的当前节点相关的那些查询进行设置答案。遍历完整棵树之后,再输出答案。
从根节点开始遍历,对树中的每个节点都设置一个颜色(白色表示未被访问,灰色表示DFS过程中进入到该节点所在的子树,还是没有从该节点所在的子树离开;黑色表示离开该节点所在的子树)。对当前正在访问的节点,则可以对和该节点相关的那些查询进行回复(只是得到答案,并存储下来,遍历完整个树后统一回复):
记当前节点为node1, 如果某个查询需要得到node1和node2的LCA,判断node2的颜色,
如果为白色,表示node2还没有被访问过,则此次先不用回复,等到node2被访问到的时候,再进行回复(那时候 node1的颜色和node2的颜色均不为白色);
如果为灰色,表示node2在node1先前被经过,且还没有结束,画图可知,node2就是node1和node2的LCA。
如果为黑色,那么需要从node2向上查找一个最低的灰色节点,且该节点就在node1到根节点的路径上。那个灰色节点就是node1和node2的LCA。为了加快node2上方的最低灰色节点的查找,使用并查集:
一个节点的子节点node的初始root为子节点本身,当子节点在被访问完(颜色被设置为黑色)之后,将子节点的root设置为node。那么,一个黑色节点的root就是它上方最低的那个灰色节点!
做题中间犯了一些错误:
没有考虑到可能多个查询的内容相同;开始做的时候,存储了每个节点相关的查询的节点unordered_map> ,想着这样在Tarjan遍历到该节点的时候,直接从vector中找到该节点相关的查询的节点。
然后对于每个查询对 person1,person2,映射到一个key(person1.id * MAX + person2.id), 然后对应到一个value(即查询的序号),想着这样在进行Tarjan遍历到节点时候,通过节点person1,找到它相关的各个person2,然后找到key,再找到查询的序号 num,将查到的结果放到 resultt[num]中。
这样想法挺好啊,可是如果多个查询的内容相同,则歇菜了。。。修改的方法是,对于每个查询对,维护一个vector,存放和它相关的各个查询的序号。改动比较麻烦,就换了另外一种存储方法。
#include<iostream> #include<string.h> #include<iostream> #include<queue> #include<unordered_map> #include<unordered_set> #include<string> #include<vector> using namespace std; unordered_map<string, int> gName2node; unordered_map<int, string> gNode2name; unordered_map<int, vector<int>> gNodeQueryIds; //对应每个节点,它所相关的查询的id vector<pair<int, int>> gQueries; //查询,表示查询的两个人的id vector<string> gQueryResult; const int kMax = 200005; int gRoot[kMax]; struct Edge{ int to; int next; }; Edge gEdges[kMax]; int gEdgeIndex; int gHead[kMax]; int gNodeColor[kMax]; void InsertEdge(int u, int v){ int e = gEdgeIndex++; gEdges[e].to = v; gEdges[e].next = gHead[u]; gHead[u] = e; } int GetRoot(int a){ if (gRoot[a] == a) return a; return gRoot[a] = GetRoot(gRoot[a]); } void Union(int a, int b){ int p1 = GetRoot(a); int p2 = GetRoot(b); gRoot[p2] = p1; } void AddPerson(string person){ if (gName2node.find(person) == gName2node.end()){ int node = gName2node.size(); gName2node[person] = node; gNode2name[node] = person; } } void Init(int n){ gEdgeIndex = 0; memset(gEdges, -1, sizeof(gEdges)); memset(gHead, -1, sizeof(gHead)); memset(gNodeColor, 0, sizeof(gNodeColor)); for (int i = 0; i <= 2*n; i++){ gRoot[i] = i; } } void Tarjan(int node){ gNodeColor[node] = 1; for (int e = gHead[node]; e != -1; e = gEdges[e].next){ int v = gEdges[e].to; Tarjan(v); gRoot[v] = node; } if (! gNodeQueryIds[node].empty()){ for (auto it = gNodeQueryIds[node].begin(); it != gNodeQueryIds[node].end(); ++it){ int query_id = *it; int node2; if (node == gQueries[query_id].first) node2 = gQueries[query_id].second; else node2 = gQueries[query_id].first; if (gNodeColor[node2] == 0) //还没有被访问过 continue; if (gNodeColor[node2] == 1){ //节点node2在节点node之前被访问,且访问未结束,则可以确定node2在node到根节点的路径上 gQueryResult.at(query_id) = gNode2name[node2]; //cout << "assign, = " << gQueryResult.at(gQueryResultIndex[node*kMax + node2]) << endl; } else{//节点node2已经被访问过,且访问结束,那么node2节点所在集合的根节点(并查集的根)就是最低公共祖先 int lca = GetRoot(node2); gQueryResult.at(query_id) = gNode2name[lca]; } } } gNodeColor[node] = 2; } int main(){ int n, n1, n2; string person1, person2; cin >> n; Init(n); for (int i = 0; i < n; i++){ cin >> person1 >> person2; AddPerson(person1); AddPerson(person2); n1 = gName2node[person1]; n2 = gName2node[person2]; InsertEdge(n1, n2); } int m; cin >> m; gQueryResult.assign(m, ""); for (int i = 0; i < m; i++){ cin >> person1 >> person2; n1 = gName2node[person1]; n2 = gName2node[person2]; gQueries.push_back(pair<int, int>(n1, n2)); gNodeQueryIds[n1].push_back(i); gNodeQueryIds[n2].push_back(i); } Tarjan(0); for (int i = 0; i < m; i++){ cout << gQueryResult[i] << endl; } return 0; }