数据冗余

数据冗余是指同一个数据在系统中多次出现重复,在文件系统中,由于文件之间没有联系,有时一个数据在多个文件中出现,而数据库则客服了文件系统的这种缺陷,但仍然有数据冗余问题,消除数据冗余的目的是为了避免更新是可能出现的问题,以便爆出数据的一致性。

数据冗余的类型:

一般而言图像,视频,音频数据中存在的数据冗余类型有以下一些:

第一,空间冗余:图像数据中所经常出现的一种冗余,在同一幅图像中,规则物体和规则背景(有序非杂乱)的表面物理特征具有相关性,数字化图像中表现为数据冗余,例如一幅图像中的一大片蓝天,草地,其中每个像素的数据完全相同,如果逐点存储就会产生所谓的空间冗余,完全一样的数据当然可以压缩,十分接近的数据也可以压缩,因为被压缩的数据恢复后人眼分辨不出和原来的图片的区别,这种压缩是对空间冗余的压缩。

第二、时间冗余,这是序列图像(电视图像、运动图像)和语音数据中所经常包含的冗余,在电视,动画图像中,在相邻帧之间往往包含了相同的背景,只不过运动物体的位置有点变换,因此对于序列图像中的相邻两帧仅记录他们之间的差异,去掉其中重复的,称为时间冗余的那部分信息,同样,由于人在说话时的音频也是连续喝渐变的。因此声音信息中也会存在时间冗余。

第三、结构冗余:有些图像从大体上看存在着非常强的纹理结构,例如草席图像,我们称之为他在结构上存在冗余。

第四、知识冗余,有许多图像的理解与某些基础知识有相当大的相关性,例如:人脸的图像有固定的结构。比如说嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于脸的中线上等,这类规律性的结构可由先验知识和背景知识得到,称之为知识冗余。

第五,视觉冗余,是由于人体器官的不敏感造成的。例如在高亮度下,人的视觉灵敏度下降,对灰度值的表现就可以粗糙一些,对于太强太弱的声音,如果超出了阈值,人们听觉感受也会被掩蔽,利用感官上的这些特性,也可以压缩掉部分数据而不被人们感知(察觉)。

第六、信息熵冗余、又称为编码冗余,是指一组数据携带的平均信息量,正因为多媒体数据中存在着上诉的各种的冗余,所以多媒体数据是可以被压缩的,针对不同的冗余,人们已经提出各种各样的方法实施对于多媒体数据的压缩。

增加数据冗余的目的:

一般情况下,应尽量减少数据冗余,保证数据的一致性,但在某些情况下,也需要适当的增加数据冗余度。

1、重复存储或传输数据以防止数据的丢失。

2、对数据进行冗余性的编码来防止数据的丢失,错误,并提供对错误数据进行反变换得到原始数据的功能。

3、为方便出来而使同一信息在不同地点有不同的表现形式,入一本书的不同语言的版本。

4、为了提高数据的检索速度。

数据冗余或者信息冗余是生产、生活所必然存在的行为,没有好与不好不好的总体倾向。

例子:在数据库中有成绩表A,其有姓名,科目和成绩。

班级表B,有姓名,性别,班级。

A和B中都有姓名字段。可将A中字段去掉,但为了执行效率和空间的划分,这里的冗余还是需要的。

原文详见维基百科

时间: 2024-10-11 11:02:26

数据冗余的相关文章

对数据库新的认识之数据冗余

今天记录一次公司的技术分享,让我明白了,原来数据冗余也是一个利器. 数据库范式 在上学学习数据库的时候肯定都是要讲到范式的,这里简单回顾一下.-第一范式(1NF)所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项,即没有重复域.-第二范式(2NF)在满足第一范式的基础上,要求数据库表中的每个实例或记录必须可以被唯一地区分.-第三范式(3NF)在满足第二范式的基础上,任何非主属性不依赖于其它非主属性. 一定的冗余可以提升性能 冗余是指在一个

数据冗余的定义和几大分类

数据冗余的含义和用途 把视频和音频信号数字化了之后,数据量大的惊人,因此,若存储大量的图像和音频信息需要大大提高系统的存储容量,通常解决的方法是采用大容量磁盘或光盘,但这仅仅是解决海量存储的一个办法,而数据冗余的作用就是将额外的数据或数据信息保存在一个独立的硬盘上,来防止数据丢失,下面详解什么是数据冗余?有哪些类型? 数据与信息虽然经常在一起使用,但概念是不相同的,数据是用来记录和传送信息的,数据是信息的载体.真正有用的不是数据本身,而是数据所携带的信息,信息量与数据量的关系可由下式给出:I=D

Matlab按照彩色图像去除数据冗余

依据实验结果,确定为对于RGB三个分量,每个分量都做差,然后取二范数,如果其中有一个分量大于0.5,这个结果就保留.这应该是我目前编过的最复杂的Matlab程序了,主要是通过这个程序学习到了matlab结构体的好处,数组和cell在处理大量的数据的时候都太麻烦了.结构体加上数组.cell,才是matlab程序语言设计的保存数据的最好的格式.现在知道了为啥matlab读取视频,保存格式为结构体了.fighting! 1 clear;close all;clc; 2 %% 3 %由于程序运行的时间太

数据库介绍与分类

目录 数据库介绍与分类... 1 1.1 数据库介绍... 2 1.1.1什么是数据库... 2 1.2数据库的种类... 2 1.2.1关系型数据库介绍... 2 1.2.2非关系型数据库介绍... 3 1.3 常用关系型数据库产品介绍... 4 1.3.1 Oracle数据库... 4 1.3.2 MySQL数据库... 5 1.3.3 MariaDB数据库... 5 1.3.4 SqlServer数据库... 6 1.3.5 Access数据库... 6 1.3.6 其他不常用数据库...

ElasticSearch

一.概述 1.简介 ElasticSearch是一个基于Lucene实现的开源.分布式.Restful的全文本搜索引擎:此外,它还是一个分布式实时文档存储,其中每个文档的每个field均是被索引的数据,且可被搜索:也是一个带实时分析功能的分布式搜索引擎,能够扩展至数以百计的节点实时处理PB级的数据. 应用场景:当我们建立一个网站或应用程序,并要添加搜索功能,但是想要完成搜索工作的创建是非常困难的.我们希望搜索解决方案要运行速度快.能有一个零配置和一个完全免费的搜索模式.能够简单地使用JSON通过

几道 SQL 笔试题、面试题总结

2017-08-01 最近一个星期面试了四五家公司,面试的岗位是 Java 实习生.发现每家公司的 SQL 知识考察的内容都不尽相同,而且自己的 SQL 知识更是弱项.为此在菜鸟教程上复习了 SQL 知识,也总结了这几天来的面试题目. 笔试整理 1.给类似如下的表,要求用 SQL 求各班不同性别成绩超过80分的平均数: 表:test_avg NAME SCORE SEX CLASS A 66 男 1 B 86 女 2 C 90 男 1 D 82 女 2 考察知识点: 1)AVG() 函数.AVG

RH124-14 文件系统和磁盘设备管理

第十四章 文件系统和磁盘设备管理 14.1 文件系统和磁盘设备的管理与使用 磁盘设备 磁盘设备是支持随机读写数据的设备. 在物理机器上,设备文件默认都存放在/dev/目录下,第一个硬盘是/dev/sda,第二个硬盘是/dev/sdb,如此类推.第一个硬盘的第一个分区是/dev/sda1,第二个分区是/dev/sda2,如此类推. 在xen或kvm的虚拟机上,硬盘的名字则是/dev/xvda或/dev/vda等,如此类推 有些存放数据的设备并不是直接硬件对应的设备文件,而是通过软件生成的块设备文件

软件RAID 0

软件RAID 0的实现 RAID 0又称为Stripe或Striping,它代表了所有RAID级别中最高的存储性能.RAID 0提高存储性能的原理是把连续的数据分散到多个磁盘上存取,这样,系统有数据请求就可以被多个磁盘并行的执行,每个磁盘执行属于它自己的那部分数据请求.这种数据上的并行操作可以充分利用总线的带宽,显著提高磁盘整体存取性能. RAID 0的缺点是不提供数据冗余,因此一旦用户数据损坏,损坏的数据将无法得到恢复.RAID0运行时只要其中任一块硬盘出现问题就会导致整个数据的故障.一般不建

CRS和ASM有啥关系

CRS和ASM没有关系 CRS是Oracle 10gR1 RAC后推出了自身的集群软件,这个软件的名称叫做Oracle Cluster Ready Service(Oracle集群就绪服务),简称CRS ASM是Oracle 10g R2后为了简化Oracle数据库的管理而推出来的一项新功能,这是Oracle自己提供的卷管理器,主要用于替代操作系统所提供的LVM,它不仅支持单实例,同时对RAC的支持也是非常好.ASM可以自动管理磁盘组并提供有效的数据冗余功能. 总上所述,CRS是一个集群软件,只