关系规范化之求最小函数依赖集(最小覆盖)

最小函数依赖集

一、等价和覆盖

  定义:关系模式R<U,F>上的两个依赖集F和G,如果F+=G+,则称F和G是等价的,记做F≡G。若F≡G,则称G是F的一个覆盖,反之亦然。两个等价的函数依赖集在表达能力上是完全相同的。

  

二、最小函数依赖集

  定义:如果函数依赖集F满足下列条件,则称F为最小函数依赖集或最小覆盖。

  ① F中的任何一个函数依赖的右部仅含有一个属性;

  ② F中不存在这样一个函数依赖X→A,使得F与F-{X→A}等价;

  ③ F中不存在这样一个函数依赖X→A,X有真子集Z使得F-{X→A}∪{Z→A}与F等价。

  算法:计算最小函数依赖集。

  输入 一个函数依赖集

  输出 F的一个等价的最小函数依赖集G

  步骤:① 用分解的法则,使F中的任何一个函数依赖的右部仅含有一个属性;

     ② 去掉多余的函数依赖:从第一个函数依赖X→Y开始将其从F中去掉,然后在剩下的函数依赖中求X的闭包X+,看X+是否包含Y,若是,则去掉X→Y;否则不能去掉,依次做下去。直到找不到冗余的函数依赖;

     ③去掉各依赖左部多余的属性。一个一个地检查函数依赖左部非单个属性的依赖。例如XY→A,若要判Y为多余的,则以X→A代替XY→A是否等价?若A

(X)+,则Y是多余属性,可以去掉。

  举例:已知关系模式R<U,F>,U={A,B,C,D,E,G},F={AB→C,D→EG,C→A,BE→C,BC→D,CG→BD,ACD→B,CE→AG},求F的最小函数依赖集。

  

解1:利用算法求解,使得其满足三个条件

  

① 利用分解规则,将所有的函数依赖变成右边都是单个属性的函数依赖,得F为:F={AB→C,D→E,D→G,C→A,BE→C,BC→D,CG→B,CG→D,ACD→B,CE→A,CE→G}

  

② 去掉F中多余的函数依赖

  

A.设AB→C为冗余的函数依赖,则去掉AB→C,得:F1={D→E,D→G,C→A,BE→C,BC→D,CG→B,CG→D,ACD→B,CE→A,CE→G}

  计算(AB)F1+:设X(0)=AB

  计算X(1):扫描F1中各个函数依赖,找到左部为AB或AB子集的函数依赖,因为找不到这样的函数依赖。故有X(1)=X(0)=AB,算法终止。

  (AB)F1+= AB不包含C,故AB→C不是冗余的函数依赖,不能从F1中去掉。

  

B.设CG→B为冗余的函数依赖,则去掉CG→B,得:F2={AB→C,D→E,D→G,C→A,BE→C,BC→D,CG→D,ACD→B,CE→A,CE→G}

  计算(CG)F2+:设X(0)=CG

  计算X(1):扫描F2中的各个函数依赖,找到左部为CG或CG子集的函数依赖,得到一个C→A函数依赖。故有X(1)=X(0)∪A=CGA=ACG。

  计算X(2):扫描F2中的各个函数依赖,找到左部为ACG或ACG子集的函数依赖,得到一个CG→D函数依赖。故有X(2)=X(1)∪D=ACDG。

  计算X(3):扫描F2中的各个函数依赖,找到左部为ACDG或ACDG子集的函数依赖,得到两个ACD→B和D→E函数依赖。故有X(3)=X(2)∪BE=ABCDEG,因为X(3)=U,算法终止。

  (CG)F2+=ABCDEG包含B,故CG→B是冗余的函数依赖,从F2中去掉。

  

C.设CG→D为冗余的函数依赖,则去掉CG→D,得:F3={AB→C,D→E,D→G,C→A,BE→C,BC→D,ACD→B,CE→A,CE→G}

  计算(CG)F3+:设X(0)=CG

  计算X(1):扫描F3中的各个函数依赖,找到左部为CG或CG子集的函数依赖,得到一个C→A函数依赖。故有X(1)=X(0)∪A=CGA=ACG。

  计算X(2):扫描F3中的各个函数依赖,找到左部为ACG或ACG子集的函数依赖,因为找不到这样的函数依赖。故有X(2)=X(1),算法终止。(CG)F3+=ACG。

  (CG)F3+=ACG不包含D,故CG→D不是冗余的函数依赖,不能从F3中去掉。

  

D.设CE→A为冗余的函数依赖,则去掉CE→A,得:F4={AB→C,D→E,D→G,C→A,BE→C,BC→D,CG→D,ACD→B,CE→G}

  计算(CG)F4+:设X(0)=CE

  计算X(1):扫描F4中的各个函数依赖,找到左部为CE或CE子集的函数依赖,得到一个C→A函数依赖。故有X(1)=X(0)∪A=CEA=ACE。

  计算X(2):扫描F4中的各个函数依赖,找到左部为ACE或ACE子集的函数依赖,得到一个CE→G函数依赖。故有X(2)=X(1)∪G=ACEG。

  计算X(3):扫描F4中的各个函数依赖,找到左部为ACEG或ACEG子集的函数依赖,得到一个CG→D函数依赖。故有X(3)=X(2)∪D=ACDEG。

  计算X(4):扫描F4中的各个函数依赖,找到左部为ACDEG或ACDEG子集的函数依赖,得到一个ACD→B函数依赖。故有X(4)=X(3)∪B=ABCDEG。因为X(4)=U,算法终止。

  (CE)F4+=ABCDEG包含A,故CE→A是冗余的函数依赖,从F4中去掉。

  

③ 去掉F4中各函数依赖左边多余的属性(只检查左部不是单个属性的函数依赖)由于C→A,函数依赖ACD→B中的属性A是多余的,去掉A得CD→B。

  故最小函数依赖集为:F={AB→C,D→E,D→G,C→A,BE→C,BC→D,CG→D,CD→B,CE→G}

  

解2:利用Armstrong公理系统的推理规则求解

  ① 假设CG→B为冗余的函数依赖,那么,从F中去掉它后能根据Armstrong公理系统的推理规则导出。

  因为CG→D (已知)

  所以CGA→AD,CGA→ACD (增广律)

  因为ACD→B (已知)

  所以CGA→B (传递律)

  因为C→A (已知)

  所以CG→B (伪传递律)

  故CG→B是冗余的。

  ② 同理可证:CE→A是多余的。

  ③ 又因C→A,可知函数依赖ACD→B中的属性A是多余的,去掉A得CD→B。

  故最小函数依赖集为:F={AB→C,D→E,D→G,C→A,BE→C,BC→D,CG→D,CD→B,CE→G}

//数据库编程实验
//求最小覆盖Fm
//输入:属性全集U,U上的函数依赖集F
//输出:函数依赖集F的最小覆盖Fm
#include <iostream>
#include <string>
using namespace std;

struct FunctionDependence//函数依赖
{
	string X;//决定因素
	string Y;
};

void Init (FunctionDependence FD[],int n)
{
	//函数依赖关系初始化
	int i;
	string x,y;
	cout<<"请输入F中的函数依赖(决定因素在左,被决定因素在右)"<<endl;
	//输入函数依赖集合F
	for (i=0;i<n;i++)
	{
		cin>>x>>y;
		FD[i].X=x;
		FD[i].Y=y;
	}
	cout<<"函数依赖集合";
	cout<<"F={" ;
	for (i=0;i<n;i++)
	{
		//显示已知的函数依赖集合F
		cout<<FD[i].X<<"->"<<FD[i].Y;
		if (i<n-1)cout<<", ";
	}
	cout<<"}"<<endl;
}
bool Match(string a,string b)//判断两个字符串是否匹配
{
	bool flag=false;
	int length1=a.length();
	int length2=b.length();
	int count=0;
	if (length1==length2)
	{
		int i=0,j=0;
		//字符串每一位是否相等
		for (i=0;i<length1;i++)
		{
			if(a[i]==b[i])count++;
		}
		if (count==length1)
		flag=true;
	}
	return flag;
} 

string CutAndSort(string mm)//将最终得到的闭包去除其中重复的元素,并且进行排序
{
	int size=mm.length();
	string ss="\0";
	int kk=0,ii=0;;
	int a[200]={0};//用来记录各个命题出现的次数
	for(kk=0;kk<size;kk++)
	{
		a[(int)mm[kk]]++;//强制转换类型,储存各个因素的次数
	}

	for (ii=0;ii<200;ii++)
	{
		if (a[ii]>=1)
		ss+=(char)ii;
	}
	return ss;
} 

bool IsIn(string f,string zz)//能够判断F中决定因素f里所有的因素是否在X中,但这样可能导致结果出现重复
{
	bool flag1=false;
	int len1=f.length();
	int len2=zz.length();
	int k=0,t=0,count1=0;
	for (k=0;k<len1;k++)
	{
		for (t=0;t<len2;t++)
		{
			if (f[k]==zz[t])
			{
				//flag1=true;break;
				count1++;
			}
		}
	}
	if (count1==len1)
	{
		flag1=true;
	}
	else flag1=false;
	return flag1;
}

string FD_Fun(FunctionDependence FD[],int n,string xx)
{

	int i;

	//求X关于F的闭包
	for (i=0;i<n;i++)
	{
		if (Match(FD[i].X,xx)==true)
		{
			xx+=FD[i].Y;
		}
		else if (IsIn(FD[i].X,xx)==true)
		{
			if (IsIn(FD[i].Y,xx)==false)//避免加上重复的元素
			xx+=FD[i].Y;
		}
	}
	CutAndSort(xx);

	return CutAndSort(xx);
}

//从函数依赖集F中删除某个依赖关系 left->right
void  Cut(FunctionDependence FD[],int n,string left,string right,FunctionDependence Dyna[])
{
	int i=0,j=0,count=0;
	for (i=0;i<n;i++)
	{
		if((FD[i].X==left)&&(FD[i].Y==right))
		{
		}
		else
		{
			Dyna[count].X=FD[i].X;
			Dyna[count].Y=FD[i].Y;
			count++;
		}
	}
	cout<<"\n去掉"<<left<<"->"<<right;
	cout<<"后的函数依赖集F:"<<endl;
	cout<<"F={" ;
	for(j=0;j<count;j++)
	{
		cout<<Dyna[j].X<<"->"<<Dyna[j].Y;
		if (j<count-1)cout<<",";
	}
	cout<<"}"<<endl;	

}

bool RA(FunctionDependence a,FunctionDependence b)//判断冗余属性
{
	if ((IsIn(a.X,b.X)==true)&&(a.Y==b.Y))
	{
		return true;
	}
	else return false;
} 

void CutSameFD(FunctionDependence FD[],int n)//除去重复的函数依赖
{
	FunctionDependence Dyna1[n+20];
	FunctionDependence Dyna2[n+20];
	FunctionDependence Dyna3[n+20];
	FunctionDependence Dyna4[n+20];
	int i=0,j=0,k=0,count=0,count1=0,count2=0;
	for (i=0;i<n;i++)
	{
			for (j=0;j<count;j++)
			{
				if((FD[i].X==FD[j].X)&&(FD[i].Y==FD[j].Y))//有函数依赖重复
				{
					break;//跳过当前的函数依赖
				}
			}
			if (j==count)
			{
				Dyna1[count].X=FD[i].X;
				Dyna1[count].Y=FD[i].Y;
				count++;
			}
	}
	cout<<"去掉重复后的函数依赖集F="<<"{";
	for (k=0;k<count;k++)
	{
		//去掉重复后的函数依赖集
		cout<< Dyna1[k].X<<"->"<<Dyna1[k].Y;
		if (k<count-1)cout<<",";
	}
	cout<<"}"<<endl;

	for (k=0;k<count;k++)
	{
		//从第一个函数依赖X→Y开始将其从F中去掉,
		Cut( Dyna1,count,Dyna1[k].X,Dyna1[k].Y,Dyna2);
		//然后在剩下的函数依赖中求X的闭包X+,看X+是否包含Y
		cout<<Dyna1[k].X<<"关于F的闭包:";
		cout<<FD_Fun(Dyna2,count,Dyna1[k].X);//在剩下的函数依赖中求X的闭包X+
		if(IsIn(Dyna1[k].Y,FD_Fun(Dyna2,count,Dyna1[k].X))==true)//在闭包中
		{
			cout<<"\n"<<Dyna1[k].X<<"->"<<Dyna1[k].Y<<"冗余"<<endl;
		}
		else
		{
			cout<<"\n"<<Dyna1[k].X<<"->"<<Dyna1[k].Y<<"不冗余"<<endl;
			Dyna3[count1].X=Dyna1[k].X;
			Dyna3[count1].Y=Dyna1[k].Y;
			count1++;
		}
	}
	cout<<"去冗余函数依赖后的函数依赖集F={";
	for (i=0;i<count1;i++)
	{
			cout<<Dyna3[i].X<<"->"<<Dyna3[i].Y;
			if (i<count1-1)cout<<",";
	}
	cout<<"}"<<endl;
	//去掉冗余属性
	for (i=0;i<count1;i++)
	{
		for (j=0;j<count1;j++)
		{
			if(RA(Dyna3[i],Dyna3[j])==true)
			{
				break;
			}
		}

			Dyna4[count2].X=Dyna3[i].X;
			Dyna4[count2].Y=Dyna3[i].Y;
			count2++;

	}
	//求得最小覆盖
	cout<<endl;
	cout<<"最小覆盖Fm="<<"{";
	for (k=0;k<count2;k++)
	{
			cout<<Dyna4[k].X<<"->"<<Dyna4[k].Y;
			if (k<count2-1)cout<<",";
	}
	cout<<"}"<<endl;
} 

void SingleR(FunctionDependence FD[],int n) //使F所有函数依赖的右部分解成单一属性
{
	int lengthR=0,i=0,j=0,k=0;
	static int D=n;
	int count=0;
	FunctionDependence  DynamicFD[D+20];//建立新的空间来存储所有的函数依赖
	cout<<"右侧属性单一化后的函数依赖集F为:"<<endl;
	cout<<"F={" ;
	for (i=0;i<n;i++)
	{
			lengthR=(FD[i].Y).size();
			for (j=0;j<lengthR;j++)//将右部分解成单一属性,添加到属性集合的后面
			{
				DynamicFD[count].X=FD[i].X;
				DynamicFD[count].Y= (FD[i].Y)[j];
				count++;
			}

	}
	for (k=0;k<count;k++)
	{
		cout<<DynamicFD[k].X<<"->"<<DynamicFD[k].Y;
		if (k<count-1)cout<<", ";
	}

	cout<<"}"<<endl;
	D=count;
	CutSameFD(DynamicFD,D);

}

void Fmin(FunctionDependence FD[],int n)//求最小覆盖
{
	Init(FD,n);
	SingleR(FD,n);	

}

int main()
{
	int N;
	cout<<"请输入F中函数依赖的组数:";
	cin>>N;

	FunctionDependence fd[N];
	Fmin(fd,N);
//	SingleR(fd,N);
//	CutSameFD(fd,N);
//	FD(fd,N);
	return 0;
} 

很后悔没有用链式结构,导致增加删除节点很麻烦,权当作为概念理解的帮助吧。

时间: 2024-10-12 00:23:58

关系规范化之求最小函数依赖集(最小覆盖)的相关文章

数据库求闭包,求最小函数依赖集,求候选码,判断模式分解是否为无损连接,3NF,BCNF

1.说白话一点:闭包就是由一个属性直接或间接推导出的所有属性的集合. 例如:f={a->b,b->c,a->d,e->f}:由a可直接得到b和d,间接得到c,则a的闭包就是{a,b,c,d} 2. 候选码的求解理论和算法 对于给定的关系R(A1,A2,-An)和函数依赖集F,可将其属性分为4类: L类  仅出现在函数依赖左部的属性. R 类  仅出现在函数依赖右部的属性. N 类  在函数依赖左右两边均未出现的属性. LR类  在函数依赖左右两边均出现的属性. 定理:对于给定的关系

求最小函数依赖集

//新编数据库原理习题与解析 李春葆 例:求F={ABD→AC,C→BE,AD→BF,B→E}的最小函数依赖集Fm 注意:当在函数依赖已经改变的地方开始一个新步骤时,重写函数依赖集很重要,这样可以在下一步中方便引用. 第一步    对F中的函数依赖运用分解原则来创建一个等价函数依赖集H,该集合中每一个函数依赖的右部是单个属性: H={①ABD→A,②ABD→C,③C→B,④C→E,⑤AD→B,⑥AD→F,⑦B→E} 第二步  考察每一个函数依赖是否是必须的,去除非必要的函数依赖 (1)     

函数依赖集闭包、属性集闭包和最小函数依赖集的求法。

函数依赖集的闭包 F:FD的集合称为函数依赖集. F闭包:由F中的所有FD可以推导出所有FD的集合,记为F+. 例1,对于关系模式R(ABC),F={A→B,B→C},求F+. 根据FD的定义,可推出F+={φ→φ,A→φ,A→A,A→B,A→C,A→AB,A→BC,A→ABC,…},共有43个FD.其中,φ表示空属性集. 属性集闭包 属性集闭包定义 :对F,F+中所有X→A的A的集合称为X的闭包,记为X+.可以理解为X+表示所有X可以决定的属性. 属性集闭包的算法: A+:将A置入A+.对每一

POJ 3401 Asteroids 求最小点覆盖集

把行和列都看做是点,小行星看成是边的话,那么这个显然就是求一个最小点覆盖集的问题. 最小点覆盖 == 最大匹配 #include <cstdio> #include <cstring> #include <cmath> #include <algorithm> #include <climits> #include <string> #include <iostream> #include <map> #inc

贪心法求树的最小支配集,最小点覆盖,最大独立集

定义: 最小支配集:对于图G = (V, E) 来说,最小支配集指的是从 V 中取尽量少的点组成一个集合, 使得 V 中剩余的点都与取出来的点有边相连.也就是说,设 V' 是图的一个支配集,则对于图中的任意一个顶点 u ,要么属于集合 V', 要么与 V' 中的顶点相邻. 在 V' 中除去任何元素后 V' 不再是支配集, 则支配集 V' 是极小支配集.称G 的所有支配集中顶点个数最少的支配集为最小支配集,最小支配集中的顶点个数称为支配数. 最小点覆盖:对于图G = (V, E) 来说,最小点覆盖

POJ3659 Cell Phone Network(树上最小支配集:树型DP)

题目求一棵树的最小支配数. 支配集,即把图的点分成两个集合,所有非支配集内的点都和支配集内的某一点相邻. 听说即使是二分图,最小支配集的求解也是还没多项式算法的.而树上求最小支配集树型DP就OK了. 树上的每个结点作为其子树的根可以有三个状态: 不属于支配集且还没被支配 不属于支配集但被其孩子支配 属于支配集 那么就是用dp[u][1\2\3]来表示动归的状态. 123转移该怎么转移就怎么转移..最后的结果就是min(dp[root][2],dp[root][3]). 要注意的是对于有些结点前2

POJ3659 Cell Phone Network【最小支配集】【贪心】

Cell Phone Network Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 5735Accepted: 2053 Description Farmer John has decided to give each of his cows a cell phone in hopes to encourage their social interaction. This, however, requires him to

树的最小支配集、最小点覆盖、最大独立集【模板】

最小支配集:指从所有顶点中取尽量少的点组成一个集合,使得剩下的所有点都与取出来的点有边相连.顶点个数最小的支配集被称为最小支配集.这里用贪心法来求. 1.以1号点深度优先搜索整棵树,求出每个点在DFS中的编号和每个点的父亲节点编号. 2.按DFS的反向序列检查,如果当前点既不属于支配集也不与支配集中的点相连,且它的父亲也不属于支配集,将其父亲点加入支配集,支配集个数加1. 3.标记当前结点.当前结点的父节点(属于支配集).当前结点的父节点的父节点(与支配集中的点相连). #include<ios

ACM/ICPC 之 机器调度-匈牙利算法解最小点覆盖集(DFS)(POJ1325)

//匈牙利算法-DFS //求最小点覆盖集 == 求最大匹配 //Time:0Ms Memory:208K #include<iostream> #include<cstring> #include<cstdio> #include<algorithm> using namespace std; #define MAX 105 #define INF 0x3f3f3f3f int n,m,k; int gp[MAX][MAX]; bool sx[MAX],s