大数据挖掘技术在电网状态监测与诊断中的应用

大数据挖掘技术在电网状态监测与诊断中的应用

吴振扬
( 国网吉林省电力有限公司 , 吉林 长春 130000)
[ 摘要 ] 大数据是目 前国内外各个领域的一个研究应用热点。 本文基于大数据技术, 阐述了 大数据技术对于电网发展的重要意义,
大数据挖掘技术的发展状况; 分析了 大数据挖掘技术的几种算法特点, 并通过比较选择聚类方法作为在电网状态监测与诊断中应
用的方法; 运用聚类算法展望将大数据挖掘技术应用于电网状态监测中的可能。
[ 关键词 ] 大数据; 电网; 挖掘; 数据; 监测; 预警; 诊断
[ 中图分类号 ] S222.5+5     [ 文献标识码 ] C    [ 文章编号 ] 2096-1995(2018)04-0032-01
作者简介: 吴振扬( 1987.08-) , 男, 吉林市人, 汉, 研究生, 工程师 , 特高压与电网调度。

电网状态检修可及时解决并消除安全隐患, 对于查找故障原因, 不断完善此项工作, 可提高电网的运行安全 , 以及降低故障发生频率。 当前的电网状态监测与诊断主要仍侧重于个别重点设备的数据监测, 对于采集的信息无法完成区域外的共享,不同设备间的运行状况以及参数的改变仍无法进行统筹考虑,可能会影响分析判断的数据不能及时辨别, 无法满足未来智能电网对全系统状态信息监测的要求[1] 。 而智能电网运行状态的数据量远远超过传统电网状态监测的数据, 其中包括了一次、二次设备的运行工况; 重要设备的实时在线状态数据; 设备的基本信息、 试验数据、 运行数据、 缺陷数据、 巡检记录等的收集。 面对这些海量的、 分布式的、 异构的状态数据, 常规的数据存储与分析方法会遇到极大的困难。 而大数据的云计算技术使得解决上述问题成为可能[2] 。 下面, 通过介绍大数据挖掘技术的发展情况, 大数据挖掘技术的研究状况, 通过分析设备之前的历史运行情况, 对比现在出现的数据信息, 使设备故障状态能提前预警, 提前被监测到故障点, 找到故障原因。

1 大数据挖掘技术的发展情况

通常, 这些算法必须要以最快的速度处理海量的数据, 以满足需要, 从而在所提取的最有用的信息中找到问题的关键点,及时解决[3] 。 在电力领域, 生产控制系统产生的数据周期都是秒级甚至毫秒级的, 数据量大, 互相联系非常紧密, 要求的处理时间尽可能短[4] 。 要想通过数据挖掘, 攫取这些生产数据的核心价值, 首先要选取合适算法。

2 大数据挖掘技术的研究

电力生产领域的数据大都是时序数据, 将大数据分析技术与设备状态在线监测技术相结合, 分析其历史数据, 通过比较差别, 找出运行中的潜在问题, 从而对其规律进行深入研究。数据挖掘有多种算法, 对于每一种算法均有其自身的特点[5] 。
2.1 回归分析
是把数据的属性用数学函数的形式表征, 对数据之间的联系以公式的形式清晰的表示出来, 这是对数据时序序列的预测及相关关系的研究, 可以从中确定数据之间的属性关系。
2.2 神经网络方法
非常适用于一些表征不完整, 数据需要模糊处理的分析方法, 它具有非线性的特点, 可以分布存储相关数据信息, 优化处理数据的广度。
2.3 关联规则
对于数据采用推导的方法, 通过判断所需数据出现的概率得出各个数据之间的关联程度。 数据判断分两个阶段, 首先是从原始数据之中检测出频率出现较高的数据组, 然后对于这些数据组从中找出相互之间的关联。
2.4 聚类
通过对大数据进行相关大类的区分, 将数据之间的差别分别统计到不同类别中, 再分析各个类别中的数据差别, 对于同类别中的差别较大数据进行分析, 找出原因。 同类别差异较小的或者不同类别间的数据可以忽略, 从而加快数据分析的速度和有效性。
2.5 分类
将海量数据一一找出相应的特征, 给予合理的表征描述,将这些特点根据不同的分类方式归结在不同的模块中, 当需要调取相关信息时, 从模块中提取数据, 主要应用于信息分类和趋势预测。

电力设备状态监测的实时性与复杂性, 决定了其数据挖掘必须以快速处理并实时筛选为先决条件。 回归分析运用的数学函数无法表征电力设备中的异构体状态数据; 神经网络法属于非线性处理技术, 对于电力实时数据无法做到连续读取; 关联规则是从高频数据中找出相互关联, 对于分散的电力设备无法做到全局性监测; 分类方法作为一种趋势预测, 对于电力设备的精准性要求不够。 从而选择了聚类方法, 将不同设备发出的数据进行整合, 归为不同大类, 根据重要程度在不同窗口展示于运行人员。

3 大数据挖掘技术的应用展望

(1) 基于数据挖掘技术可以将自动发现的不正常数据分类,将不同类别对应不同等级, 从而暴露设备异常变化的严重程度,协助调度人员预测电网状态 ;

(2) 基于数据挖掘技术的决策支持和控制, 其定性模糊分析能力, 可以从大量数据中去除冗余数据, 将故障特征分类提取, 加快设备状态判别 ;

(3) 基于数据挖掘技术的电力设备状态检修, 将缺陷数据与历史运行数据比对分析, 得到的信息与设备当前运行情况比较,可快速判断当前运行状态异常情况。

总之, 大数据技术是电网发展的方向, 而电力企业积累了大量的时序型历史数据, 将这些数据充分快速利用是电力运行人员应该发掘的区域。 本文通过比较大数据挖掘技术的不同算法, 找到合适的算法应用在设备状态在线监测与预警诊断领域,探索出设备海量数据应用的新模式。 通过介绍数据挖掘技术的几种常用算法, 并通过分析各种算法, 得出大数据技术应用于电力设备的算法是聚类方法; 并运用聚类方法, 将大数据挖掘技术应用于电网中, 对几种应用技术做了前景展望。

【参考文献】
[1] 白红伟, 马志伟, 朱永利 . 基于云计算的绝缘子状态监测数据的处理 [J]. 电磁避雷器 , 2011( 4) : 19-22.
[2] 李振元, 李宝聚, 王泽一 . 大数据技术对我国电网未来发展的影响研究 [J]. 吉林电力 , 2014, 42(2): 10-13.
[3] 苏剑飞, 赵捍东. 神经网络在旋转机械故障诊断中的应用 [J].微计算机息. 2007( 130: 221-225 )

原文地址:https://www.cnblogs.com/jingsupo/p/12198167.html

时间: 2024-08-28 13:30:17

大数据挖掘技术在电网状态监测与诊断中的应用的相关文章

灵玖软件:大数据挖掘技术比数据更重要

数据与信息是重要的生产要素和战略资产,已在全球达成共识.然而,失去控制和无组织的数据和信息却不能很好地发挥战略资产的作用.信息挖掘是对文献.数据等信息资源对象进行分类.标引.描述.揭示,使之有序化.系统化的过程,其目的恰好是将无序的.分散的数据和信息整理成有序的信息资源,保证用户的有效获取和利用.因此,信息挖掘对于大数据资源的管理与利用具有重要作用. 同时,当前的大数据环境给信息挖掘带来了巨大的影响.正确地识别这些影响,对于凝练信息挖掘的研究方向.使其适应当前的发展环境.与国家的重大需求对接.为

玩转大数据:深入浅出大数据挖掘技术(Apriori算法、Tanagra工具、决策树)

一.本课程是怎么样的一门课程(全面介绍) 1.1.课程的背景 “大数据”作为时下最火热的IT行业的词汇,随之而来的数据仓库.数据分析.数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点. “大数据” 其实离我们的生活并不遥远,大到微博的海量用户信息,小到一个小区超市的月销售清单,都蕴含着大量潜在的商业价值. 正是由于数据量的快速增长,并且已经远远超过了人们的数据分析能力.因此,科学.商用等领域都迫切需要智能化.自动化的数据分析工具.在这样的背景下,数据挖掘技术应用而生,使得

大数据技术:让看病更加靠谱!

在早期,大部分医疗相关数据以纸质形式存在,而非电子数据存储,如正式医疗记录.费用记录.护士和医生书写的病例记录.处方药记录.X光记录.磁共振成像(MRI)记录.CT图像记录等.随着强大的数据存储.计算平台和移动互联网的发展,医疗数据的爆炸式增长和快速的电子数字化成为趋势.上述医疗数据在不同程度上转化为数字.移动互联网.大数据.云计算等领域的技术与医疗领域的跨境整合.新兴的技术和新的服务模式迅速到医疗的各个方面,使人们的医疗方式发生了重大变化.为我国医疗事业带来了新的发展机遇. 大医疗数据应用 大

基于大数据技术的手机用户画像与征信研究

内容提要:手机用户画像是电信运营商实现“数据驱动业务与运营”的重要举措.首先,介绍了手机用户画像过程中对个人隐私保护的方法,然后分析手机用户画像的数据来源与大数据实现技术,最后,通过数据样本实例分析手机用户画像在个人征信中的应用. 引言 随着计算机网络技术的不断发展,“数据即资源”的大数据时代已经来临.用户画像是电信运营商为了避免管道化风险,实现“数据驱动业务与运营”的重要举措.用户画像与应用大数据技术对客户分类密切相关,是单个客户的众多属性标签的累积:另一方面,在运营商涉足的消费金融领域,对手

移动互联网时代的大数据挖掘和精准营销

中国的这些年喜欢搞概念,什么云计算大数据啊,国家支持,专家鼓吹,各大会议论坛精彩纷呈,热闹过后发现还是默默地在用国外的技术和平台,就如同PC操作系统没有我们的份,手机操作系统也没有我们的份,虽然我们是世界上电脑和手机拥有量最多并且人们最喜欢玩手机的国家,感觉我们的学术专家和行业大佬们就只会扯蛋,扯多了会痛,痛定思痛,痛何如哉!吃饱喝足后还是继续扯蛋.相当可悲,若大个中国,真正心平静气地去做研究和开发的专家或企业应该是极少的或者很快就挂掉了,我们都太心急太功利太浮躁,政策是支持的,目标是巨大的,口

php学习不得不掌握的10大缓存技术

在php开发中,我们常常用到缓存技术,以提高开发.运行效率.那php常用缓存技术有哪些呢?它们是怎么使用的呢?下面小编就为大家分享php学习中不得不掌握的10大缓存技术,希望对php初学者有所帮助. 1.全页面静态化缓存 所谓全页面静态化缓存,就是将页面全部生成html静态页面,用户访问时直接访问的静态页面,而不会去走php服务器解析的流程.此种方式,在CMS系统中比较常见,比如dedecms: 这种缓存,比较常用的实现方式是输出缓存: Ob_start() ******要运行的代码******

安防大数据挖掘的利刃:模式识别和深度学习技术

人工智能的概念提出已经很多年,但最近一次大热是在“人机大战”战胜世界围棋高手李世石的AlphaGo.同样,近几年安防行业热门的深度学习和模式识别的概念也频频出现在公众的视野当中,那么它们是如何应用在安防领域中?目前最前沿的应用又有哪些?以下将为您一一解答. 安防大数据挖掘 平安城市从2010年在全国推广至今已经6年,目前各地平安城市建设即将进入扩容改建期,需要更加综合与智能的整体解决方案.公共安防已不再局限于扩张视频监控覆盖广度和密度以及清晰度,而是由扩密度的传统安防时代向注重视频大数据挖掘.使

大数据分享常用的数据挖掘技术,新人学起来就可以用

对大数据开发技术感兴趣的小伙伴对数据挖掘技术有多少了解呢?本篇文章大数据小编就给喜欢大数据开发的小伙伴分享一下常用的数据挖掘技术,希望对小伙伴们有所帮助. 1.统计技术 数据挖掘涉及的科学领域和技术很多,如统计技术.统计技术对数据集进行挖掘的主要思想是:统计的方法对给定的数据集合假设了一个分布或者概率模型(例如一个正态分布)然后根据模型采用相应的方法来进行挖掘. 在这里还是要推荐下我自己建的大数据学习交流群:529867072,群里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家

大数据技术词汇表

Anomaly:见异常值词条. Apache Software Foundation(ASF):专门为支持开源软件项目而办的一个非盈利性组织. ARPU(Average revenue per user):每个用户的平均收入. Artificial neural network:人工神经网络,通常简称神经网络. Avro:一个在Hadoop上的数据序列化系统,设计用于支持大批量数据交换应用. 贝叶斯分析方法(Bayesian Analysis):提供了一种计算假设概率的方法,这种方法是基于假设的