http://blog.sina.com.cn/s/blog_6b218a3b0100mdye.html
一、 数据融合。所谓数据融合,就是将多份数据或信息进行处理,组合出更有效、更符合用户需求的结果的过程。在无线传感器网络的研究中,数据融合起着十分重要的作用,主要表现在以下三个方面:
1.节省能量
在部署无线传感器网络时,需要使传感器节点达到一定的密度以增强整个网络的鲁棒性和监测信息的准确性,有时甚至需要使多个节点的监测范围互相交叠。这种监测区域的相互重叠导致了邻近节点报告的信息存在一定程度的冗余。数据融合就是要针对这种情况对冗余数据进行网内处理,即中间节点在转发传感器数据之前,首先对数据进行综合,去掉冗余信息,在满足应用需求的前提下将需要传输的数据量最小化。
2.获得更准确的信息
由于无线传感器网络由大量低廉的传感器节点组成,部署在各种各样复杂的环境中,因而从传感器节点获得的信息存在较高的不可靠性。由此可见,仅收集少数几个分散的传感器节点的数据较难确保得到信息的正确性,需要通过对监测同一对象的多个传感器所采集的数据进行综合,来有效地提高所获得信息的精度和可信度。
3.提高数据的收集效率
在网内进行数据融合,可以在一定程度上提高网络收集数据的整体效率。数据融合减少了需要传输的数据量,可以减轻网络的传输拥塞,降低数据的传输延迟;即使有效数据量并未减少,但通过对多个数据分组进行合并减少了数据分组的个数,可以减少传输中的冲突碰撞现象,所以也能够提高无线信道的利用率。
二、无线传感器网络应用层数据融合
数据融合技术可以在传感器网络协议栈的多个层次中实现,既可以在MAC协议中实现,也可以在路由协议或应用层协议中实现。传感器网络中的数据融合技术可以从不同的角度进行分类,介绍三种分类方法:依据融合前后数据的信息含量分类;依据数据融合与应用数据语义的关系分类;依据融合操作的级别进行分类。
1、根据数据进行融合操作前后的信息含量,可以将数据融合分为无损失融合和有损失融合两类。
(1)无损失融合
无损失融合中,所有的细节信息均被保留。此类融合的常见做法是去除信息中的冗余部分。根据信息理论,在无损失融合中,信息整体缩减的大小受到其熵值的限制。将多个数据分组打包成一个数据分组,而不改变各个分组所携带的数据内容的方法属于无损失融合。这种方法只是缩减了分组头部的数据和为传输多个分组而需要的传输控制开销,而保留了全部数据信息。
时间戳融合是无损失融合的另一个例子。在远程监控应用中,传感器节点汇报的内容可能在时间属性上有一定的联系,可以使用一种更有效的表示手段融合多次汇报。比如一个节点以一个短时间间隔进行了多次汇报,每次汇报中除时间戳不同外,其他内容均相同;收到这些汇报的中间节点可以只传送时间戳最新的一次汇报,以表示在此时刻之前,被监测的事物都具有相同的属性。
(2)有损失融合
有损失融合通常会省略一些细节信息或降低数据的质量,从而减少需要存储或传输的数据量,以达到节省存储资源或能量资源的目的。有损失融合中,信息损失的上限是要保留应用所需要的全部信息量。
很多有损失融合都是针对数据收集的需求而进行网内处理的必然结果。比如温度监测应用中,需要查询某一区域范围内的平均温度或最低,最高温度时,网内处理将对各个传感器节点所报告的数据进行运算,并只将结果数据报告给查询者。从信息含量角度看,这份结果数据相对于传感器节点所报告的原始数据来说,损失了绝大部分的信息,仅能满足数据收集者的要求。
2、根据数据融合是否基于应用数据的语义,将数据融合技术分为三类:依赖于应用的数据融合(ADDA),独立于应用的数据融合(AIDA),以及结合以上两种技术的数据融合。
(1)依赖于应用的数据融合
通常数据融合都是对应用层数据进行的,即数据融合需要了解应用数据的语义。从实现角度看,数据融合如果在应用层实现,则与应用数据之间没有语义间隔,可以直接对应用数据进行融合;如果在网络层实现,则需要跨协议层理解应用层数据的含义。
ADDA技术可以根据应用需求获得最大限度的数据压缩,但可能导致结果数据中损失的信息过多。另外,融合带来的跨层理解语义问题给协议栈的实现带来困难。
(2)独立于应用的数据融合
鉴于ADDA的语义相关性问题,有人提出独立于应用的数据融合。这种融合技术不需要了解应用层数据的语义,直接对数据链路层的数据包进行融合。例如,将多个数据包拼接成一个数据包进行转发。这种技术把数据融合作为独立的层次实现,简化了各层之间的关系。AIDA作为一个独立的层次处于网络层与MAC层之间。
AIDA保持了网络协议层的独立性,不对应用层数据进行处理,从而不会导致信息丢失,但是数据融合效率没有ADDA高。
(3)结合以上两种技术的数据融合
这种方式结合了上面两种技术的优点,同时保留AIDA层次和其他协议层内的数据融合技术,因此可以综合使用多种机制得到更符合应用需求的融合效果。
3、根据对传感器数据的操作级别,可将数据融合技术也分为以下三类:
1)数据级融合
数据级融合是最底层的融合,操作对象是传感器通过采集得到的数据,因此是面向数据的融合。这类融合大多数情况下仅依赖于传感器类型,不依赖于用户需求。在目标识别的应用中,数据级融合即为像素级融合,进行的操作包括对像素数据进行分类或组合,去除图像中的冗余信息等。
2)特征级融合
特征级融合通过一些特征提取手段将数据表示为一系列的特征向量,以反映事物的属性,是面向监测对象特征的融合。比如在温度监测应用中,特征级融合可以对温度传感器数据进行综合,表示成(地区范围,最高温度,最低温度)的形式;在目标监测应用中,特征级融合可以将图像的颜色特征表示为RGB值。
3)决策级融合
决策级融合根据应用需求进行较高级的决策,是最高级的融合。决策级融合的操作可以依据特征级融合提取的数据特征,对监测对象进行判别,分类,并通过简单的逻辑运算,执行满足应用需求的决策。因此,决策级融合是面向应用的融合。比如在灾难监测应用中,决策级融合可能需要综合多种类型的传感器信息,包温度,湿度或震动等,进而对是否发生了灾难事故进行判断;在目标监测应用中,决策级融合需要综合监测目标的颜色特征和轮廓特征,对目标进行识别,最终只传输识别结果。
三、网络层中的数据融合
无线传感器网络中的路由方式可以根据是否考虑数据融合分为两类:
1.以地址为中心的路由(address-centric routing,AC路由):每个源节点沿着到汇聚节点最短的路径发送数据,是不考虑数据融合的路由,如图a所示。
2. 以数据为中心的路由(data-centric routing,DC路由):数据在转发的过程中,中间节点根据数据的内容,对来自多个数据源的数据进行融合操作。如图b所示,源节点并没有各自寻找最短路径,而是在中间节点B处对数据进行融合,然后再继续转发。
AC路由与DC路由对能量消耗的影响与数据的可融合度有关。如果原始信息存在冗余度,由于DC路由可以减少网络中的转发数据量,因此将表现出很好的节能效果。在所有原始数据完全相同的极端情况下,AC路由可以通过简单修改达到DC.路由的效果甚至更节省能量。
DC路由中的数据融合:
1.基于DD路由的融合
定向扩散(Directed diffusion)路由中的数据融合包括路径建立阶段的任务融合和数据发送阶段的数据融合,这两种融合都是通过缓存机制实现的。定向扩散路由中的任务融合得益于它基于属性的命名方式,类型相同、监测区域完全覆盖的任务在某些情况下就可以融合成一个任务。定向扩散路由的数据融合采用的是“抑制副本”的方法,即对转发过的数据进行缓存,发现重复的数据将不予转发。这种方法不仅简单,与路由技术相结合还能够有效地减少网络中的数据量。
2.基于层次路由的融合
LEACH与TEEN都是基于层次的路由,它们的核心思想是使用分簇的方法使得数据融合的地位突显出来。它包括周期性的循环过程,LEACH的操作分成“轮”来进行,每一轮具有两个运行阶段,包括簇建立阶段和数据通讯阶段。为了减少协议的开销,稳定运行阶段的持续时间要长于簇建立阶段。在簇建立阶段,相邻节点动态的自动形成簇,随机产生簇首,随机性确保簇头与汇聚节点之间数据传输的高能耗成本均匀地分摊到所有的传感器节点,具体产生机制是:一个传感器节点生成0,l之间的随机数,如果大于阈值T,就选择这个节点为簇头。T的计算方法如下:
其中P为节点中成为簇头的百分数,,是当前的轮数。一旦簇头节点被选定,它们便主动向所有节点广播这个消息。根据接收信号的强度,节点选择它所要加入的簇,并告知相应的簇头节点。
在数据通信阶段,簇内节点把数据发给簇首,簇首进行数据融合并把结果发送给汇聚节点。由于簇首承担了很多耗能的工作,如数据融合、与汇聚节点通信等,各节点需要等概率地轮流担任簇首,来达到网络能量消耗的平衡。LEACH协议的特点是分簇和数据融合,分簇有利于网络的扩展性,数据融合可以节约功耗。LEACH协议对于节点分布较密的情况有较高的效率,因为节点密度大会导致在小范围内冗余数据较多,LEACH协议可以有效地消除数据的冗余性。然而LEACH算法仅仅强调了数据融合的重要性,并没有给出具体的融合方法。TEEN是LEACH的一种改进,应用于事件驱动的传感器网络。TEEN与定向扩散路由一样通过缓存机制抑制不需要转发的数据,但是它利用阈值的设置使抑制操作更加灵活,对于前一次监测结果差值较小的数据也进行了抑制。
3.基于链的融合
PEGASIS及其高阶算法是对LEACH融合方式的改进。它基于两个假设:一是所有节点距离汇聚节点都很远;二是每个节点都能将接收到的数据分组与自己的数据融合成一个大小不变的分组。PEGASIS算法是在收集数据前,首先利用贪心算法将网络中的所有节点连接成一条单链,然后随机选取一个节点作为首领。首领向链的两端发出收集数据的请求,数据从单链的两个端点向首领流动。中间节点在传递数据前要执行融合操作,最终由首领节点将结果传送给汇聚节点。
PEGASIS算法的优点在于单链的结构使得每个节点发送数据的距离几乎都是最短的,而且最终只有一个节点进行远距离的数据传输,因此这个算法比LEACH算法更节省能量。
单链结构的PEGASIS算法主要有以下两个缺点:
1)平均延迟比较大:数据需要沿着单链结构顺序传送,收集数据的延迟取决于首领节点与单链端节点的距离,因此平均延迟与节点数成正比。
2)鲁棒性较差:由于传感器节点容易失效,如果不采取适当的修复策略,单链结构的传输路径容易增大数据收集请求的失败率。
4.基于安全模式的融合
ESPDA(Energy-efficient and Secure Pattern-based Data Aggregation)也是一种基于分簇的路由协议。不同的是每个节点收集到数据后,并不是直接将数据包发送给簇头,而是将反映数据特征的模式编码(Pattern Code)发给簇头节点,簇头节点根据模式编码判断是否对该节点的数据感兴趣或该节点数据是否冗余。这样簇头节点就不用收集簇内所有节点的数据,可以根据需要有选择的收集。ESPDA既减少了簇内节点和簇头的通信量,也增加了无线传感器网络的安全性。因为模式编码是经过安全加密和压缩的,而且大小也小于数据包的大小。