8种常用的关系代数运算_20160928

关系代数:是一种抽象的查询语言,用对关系的运算来表达 查询。关系代数运算的是关系,运算结果亦是关系。

3.1 概述

用表或者数据集合,表示 关系或实体;

用行 表示元组;

用列 表示属性;

3.2 包括:

5个基本操作:并(∪)、差(∪)、广义笛卡儿积(×),选择(π)、投影(σ)

四个组合操作:交(∩)、连接等值联接)、自然连接(RS)、除法(÷)

3.2.1 并――关系的加法和减法,它可以在行的方向上合并两个表中的数据,就像把一个表垒在另一个表之上一样。

3.2.2 交――返回两个数据集合所共有的行。 
3.2.3 差――返回只属于一个数据集合的行。

3.2.4 笛卡尔积――是关系的乘法,它将分别来自两个数据集合中的行以所有可能的方式进行组合。

例如:假设集合A={a,b},集合B={0,1,2},则两个集合的笛卡尔积为{(a,0),(a,1),(a,2),(b,0),(b,1), (b,2)} 。即若R有k1个元组,S有k2个元组,则关系R和S的笛卡尔积有k1*k2个元组。

如下例所示:

      

结果:

由结果分析:笛卡尔积得到的结果元数为r+s即:3+3=6;记录数为:R中的记录数与S中的记录数相乘,即:3×2=6。

(全码:关系模式中所有属性组都是这个关系模式的候选码)

3.2.5 选择――返回满足指定条件的行(水平切割)。

例如 δ2 > ‘4‘(R),表示从R中挑选第二个分量值(也就是R中B列的值)大于4的元组所构成关系。

结果:

   

3.2.6 投影――从数据集合中返回指定的列(垂直切割,消去列)。

关系R上的投影是从R中选择出若干属性列组成新的关系。记作:

ΠA(R) = { t[A] | t∈R },其中A为R中的属性列。

例如:π3,1(R)表示的结果如下:

       

3.2.7 连接――在水平方向上合并两个表,其方法是:从两个关系的笛卡尔积中选取满足条件的元组。(连接运算的操作基础是两个关系的笛卡尔积)

等值连接:从笛卡尔积中,选取的属性列相等的 元组。(条件AθB中的θ为‘=’的连接)

如下有关系R和S,则是什么呢?B(R) = B(S)

    

结果:

自然连接:是一种特殊的 等值连接。它要求两个关系中,进行比较的分量必须是相同的属性组,并且在结果集中把重复属性列去掉。

即一般自然连接使用在R和S有公共属性的时候,如果没有公共属性,自然连接就转为笛卡尔积操作。

例如:关系R和S,则自然连接的结果呢?

    

结果:

3.2.8 除―:―返回两个数据集之间的精确匹配。

给定关系R(X,Y),S(Y,Z),xyz为属性组,满足在X上的分量值x的象集Y,包含关系S在属性组Y上投影的集合。

例子:R÷S

R:                                                 S:

          

结果:

计算过程:

(1)T=π1,2(R),从R中选取除去与S中相同的属性,即选择S#,SName

(2)W=(T ×S)-R,将上面得到的T与S进行笛卡尔积,再减去R,即计算T×S中不在R的元组

(3)V=π1,2(W),从W中选取1,2对应的属性列,即:S#,SName

(4)R ÷ S = T-V

时间: 2024-12-17 02:59:48

8种常用的关系代数运算_20160928的相关文章

结合Scikit-learn介绍几种常用的特征选择方法

作者:Edwin Jarvis 特征选择(排序)对于数据科学家.机器学习从业者来说非常重要.好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点.底层结构,这对进一步改善模型.算法都有着重要作用. 特征选择主要有两个功能: 减少特征数量.降维,使模型泛化能力更强,减少过拟合 增强对特征和特征值之间的理解 拿到数据集,一个特征选择方法,往往很难同时完成这两个目的.通常情况下,我们经常不管三七二十一,选择一种自己最熟悉或者最方便的特征选择方法(往往目的是降维,而忽略了对特征和数据理解的目的).

PHP V5 的五种常用设计模式

设计模式 一书将设计模式引入软件社区,该书的作者是 Erich Gamma.Richard Helm.Ralph Johnson 和 John Vlissides Design(俗称 "四人帮").所介绍的设计模式背后的核心概念非常简单.经过多年的软件开发实践,Gamma 等人发现了某些具有固定设计的模式,就像建筑师设计房子和建筑物一样,可以为浴室的位置或厨房的构造方式开发模板.使用这些模板或者说设计模式 意味着可以更快地设计更好的建筑物.同样的概念也适用于软件. 设计模式不仅代表着更

干货:结合Scikit-learn介绍几种常用的特征选择方法

原文  http://dataunion.org/14072.html 主题 特征选择 scikit-learn 作者: Edwin Jarvis 特征选择(排序)对于数据科学家.机器学习从业者来说非常重要.好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点.底层结构,这对进一步改善模型.算法都有着重要作用. 特征选择主要有两个功能: 减少特征数量.降维,使模型泛化能力更强,减少过拟合 增强对特征和特征值之间的理解 拿到数据集,一个特征选择方法,往往很难同时完成这两个目的.通常情况下,我

关系代数运算

五种基本关系代数运算 集合:某些指定的对象集在一起就成了一个集合,其中每一个对象叫元素. 集合的三特性:确定性.互异性.无序性. (1)确定性:指的是概念清晰,对象描述明确,不能含混不清.不能模棱两可. (2)互异性:对于一个给定的集合,它的任何两个元素都是不同的. (3)无序性:给定的一个集合,集合内的元素间位置关系可以颠倒.调换. 五种基本关系运算:并.差.笛卡尔积.投影.选择. 我们学过集合的运算:并.交.差,求补集. 关系代数运算与集合的运算有相似之处,且不完全相同.尤其讲究位置关系,集

数据挖掘之七种常用的方法

数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的.先前未知的并有潜在价值的信息的非平凡过程 利用数据挖掘进行数据分... 数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的.先前未知的并有潜在价值的信息的非平凡过程 利用数据挖掘进行数据分析常用的方法主要有分类.回归分析.聚类.关联规则.特征.变化和偏差分析.Web页挖掘等, 它们分别从不同的角度对数据

几种常用的设计模式介绍

几种常用的设计模式介绍                                         1.    设计模式的起源 最早提出“设计模式”概念的是建筑设计大师亚力山大Alexander.在1970年他的<建筑的永恒之道>里描述了投计模式的发现,因为它已经存在了千百年之久,而现代才被通过大量的研究而被发现. 在<建筑的永恒之道>里这样描述:模式是一条由三个部分组成的通用规则:它表示了一个特定环境.一类问题和一个解决方案之间的关系.每一个模式描述了一个不断重复发生的问题,

《BI那点儿事》浅析十三种常用的数据挖掘的技术

原文:<BI那点儿事>浅析十三种常用的数据挖掘的技术 一.前沿 数据挖掘就是从大量的.不完全的.有噪声的.模糊的.随机的数据中,提取隐含在其中的.人们事先不知道的但又是潜在有用的信息和知识的过程.数据挖掘的任务是从数据集中发现模式,可以发现的模式有很多种,按功能可以分为两大类:预测性(Predictive)模式和描述性(Descriptive)模式.在应用中往往根据模式的实际作用细分为以下几种:分类,估值,预测,相关性分析,序列,时间序列,描述和可视化等. 数据挖掘涉及的学科领域和技术很多,有

【转】 FPGA设计的四种常用思想与技巧

本文讨论的四种常用FPGA/CPLD设计思想与技巧:乒乓操作.串并转换.流水线操作.数据接口同步化,都是FPGA/CPLD逻辑设计的内在规律的体现,合理地采用这些设计思想能在FPGA/CPLD设计工作种取得事半功倍的效果. FPGA/CPLD的设计思想与技巧是一个非常大的话题,由于篇幅所限,本文仅介绍一些常用的设计思想与技巧,包括乒乓球操作.串并转换.流水线操作和数据接口的同步方法.希望本文能引起工程师们的注意,如果能有意识地利用这些原则指导日后的设计工作,将取得事半功倍的效果! 乒乓操作“乒乓

数据中心两种常用流量模型运用mininet的实现

编者按:在网络性能评估中一个巨大的挑战就是如何生成真实的网络流量,还好可以通过程序来创造人工的网络流量,通过建立测试环境来模拟真实的状况.本文就以数据中心网络为目标场景,来在mininet仿真环境中尽可能地还原数据中心内部的真实流量情况.目前有两种常用的流量模型: ■随机模型:主机向在网络中的另一任意主机以等概率发送数据包 ■概率模型:在网络中,编号为m的主机分别以概率Pt .Pa .Pc .向主机编号为(m+i).(m+j).(m+k)的主机发送数据包 我们使用mininet中的iperf工具