一,论文研读总结

  • 研究对象
    本篇论文是关于时间序列数据挖掘中特征表示与相似性度量的一篇研究综述。
  • 研究动机
    时间序列数据挖掘中问题
    分析了时间序列特征表示和相似性度量在数据挖掘中的作用,意义,对目前已有的主要方法进行综述,分析各自存在的优缺点;此外探讨了一些值得关注的问题。
  • 文献综述
    主要论述了特征研究现状及方法;相似性度量的研究现状及方法。
    特征表示
    1.1分段线性表示方法
    1.2分段聚合表示方法
    1.3符号化表示方法
    1.4基于域变换的表示方法
    1.5奇异值分解表示方法
    1.6基于模型的表示方法
    相似性度量
    1.1欧氏距离
    1.2动态时间弯曲
    1.3符号化距离
    1.4基于模型和压缩距离变量
    1.5其他距离度量方法
  • 研究方案设计
  • 使用数据集
  • 研究结论
  • 学习心得
    由于时间序列通常是一种高维且随时间变化的而变化的的数据,产生过程极易受到环境因素的影响,并存在一定的噪声。针对此类复杂的数据,研究如何从中获取有效的信息和知识,,对社会生产实践和科学研究有非常重要的理论研究价值和重要意义。
    时间序列的高维特性,需要我们对时间序列进行局部特征提取或全局分解,降低原时间序列维度,并结合时间序列相似性度量方法有效合理的进行时间序列数据挖掘。
    特征表示方法就是将高维空间中的时间序列映射到低维特征空间,实现数据降维,还可以反应时间序列的基本形态和重要信息,提高时间序列数据挖掘效率。
    相似性度量方法进行相似性比较,有效反应时间序列之间的关系。

原文地址:https://www.cnblogs.com/zaw-315/p/11220255.html

时间: 2024-10-13 15:36:08

一,论文研读总结的相关文章

论文研读与下载地址

1.Using the cross-entropy method to re-rank search results 下载:http://iew3.technion.ac.il/~kurland/crossEnt.pdf 论文研读与下载地址

AD预测论文研读系列1

A Deep Learning Model to Predict a Diagnosis of Alzheimer Disease by Using 18F-FDG PET of the Brain 原文链接 提要 目的 开发并验证一种深度学习算法,该算法可以基于脑部18F FDG PET来预测AD.轻度认知障碍或者二者均不是的诊断结果,并将其性能与放射学阅读器的性能进行比较 材料和方法 来自ADNI的18F-FDG PET脑图(含2109张图片,包括1002个病人)用于训练.验证,40张来自4

Automatic Generation of Animated GIFs from Video论文研读及实现

论文地址:Video2GIF: Automatic Generation of Animated GIFs from Video 视频的结构化分析是视频理解相关工作的关键.虽然本文是生成gif图,但是其中对场景RankNet思想值得研究. 文中的视频特征表示也是一个视频处理值得学习的点.以前做的视频都是基于单frame,没有考虑到时空域,文中的参考文献也值得研读一下. 以下是对本文的研读,英语水平有限,有些点不知道用汉语怎么解释,直接用的英语应该更容易理解一些. Abstract 从源视频当中提

五,论文研读

论文名称:陈子健,朱晓亮.基于教育数据挖掘的在线学习者学业成绩预测建模模型. 研究对象从教育数据中挖掘影响在线学习者成绩学业成绩的因素并构建分类预测模型. 研究动机学业成绩的预测和评价是全世界教育研究者共同关注的话题,如何对在线学习者的学业成绩进行预测便于提供预警和其他干预措施. 文献综述该研究中的学业成绩预测模型主要是利用已知学生学业成绩类别的训练数据得到一个分类函数或分类模型(分类器),并评估模型的性能. 研究方案设计 预测算法研究主要是预测在学习结束时学业成绩的类别,为预测离散的值,故采用

论文研读《Highly Accurate Machine Fault Diagnosis Using Deep Transfer Learning》采用深度转移学习的高精度机械故障诊断——2019

开发了一种新的深度学习框架,以实现高精度的机器故障诊断,使用转移学习,以启用和加速训练的深度神经网络.与现有方法相比,该方法训练速度更快,精度更高.首先,通过进行小波变换,将原始传感器数据转换成图像以获得时间-频率分布.接下来,使用一个预训练的网络来提取较低层次的特征.标记的时频图像然后被用来微调更高水平的神经网络体系结构.本文建立了一个机械故障诊断流水线,并在三个主要的机械数据集(包括感应电机.齿轮箱和6000, 9000个尺寸的轴承和5000个时间样本)上验证了流水线的有效性和通用性.我们在

论文研读1.0 基于神经网络与因子分解机的点击率预估应用研究(陈检)

基于神经网络与因子分解机的点击率预估应用研究(陈检) 摘要 长久以来广告点击预估率问题属于用户行为预测研究问题,其主要解决是特征工程问题. 深度神经网络主要提取高阶特征,因子分解机提取二阶以下特征 注改:因子分解机实际应用中受限于计算复杂度,一般只考虑到2阶交叉特征(FM预测时间复杂度O(kn),FFM预测时间复杂度O(kn^2),FM提取低阶组合特征,Deep提取低阶组合特征,同时学习低阶和高阶的组合特征. FM与Deep共享同样的输入. 通过对比试验发现:基于深度神经网络和因子分解机的组合模

Google 三大经典论文研读:GFS、BigTable、MapReduce

一.GFS Google File System就是HDFS的前身 HDFS 参照了GFS的设计理念,大部分架构设计概念是类似的,比如 HDFS NameNode 相当于 GFS Master,HDFS DataNode 相当于 GFS chunkserver\ 1.设计目标: 多个客户端可以在不需要额外的同步锁定的 情况下,同时对一个文件追加数据 高性能的稳定网络带宽远比低延迟重要.目标程序绝大部分要求能够高速率的.大批量的处理数 据,极少有程序对单一的读写操作有严格的响应时间要求 2.架构:

论文研读《Deep Learning and Its Applications to MachineHealth Monitoring: A Survey》

machine health monitoring 机械健康诊断 数据驱动的机器健康监测系统提供了一种自下而上的解决方案,用于在发生某些故障(诊断)后检测故障,并预测未来工作条件和剩余使用寿命(预测). 众所周知,复杂的工作环境和噪声的存在阻碍了物理模型的建立.而这些基于物理的模型大多无法用在线测量数据进行更新,这限制了它们的有效性和灵活性.另一方面,随着传感器.传感器网络和计算系统的飞速发展,数据驱动的机器健康监测模型越来越受到人们的关注,为了从大数据中提取有用的知识并做出适当的决策,机器学习

论文研读《Virtualization and deep recognition for system fault classi?cation》_系统故障分类的虚拟化与深度识别_2017

研究内容为齿轮变速箱. 变速箱健康监测和动力系统诊断结果的有效表示仍然具有挑战性.本文以齿轮箱为例,提出了一种利用深度学习将一维时间序列分析诊断结果转化为故障类型和图形说明的图形图像的新方法.具体地说,小波分析将时间序列转换为时频图像.接着,深度卷积神经网络(DCNN)从这些图像中学习时间-频率域中的基本特征并执行故障分类.齿轮箱试验结果表明,该方法的精度和效率优于99.5%. 文献中报道的大多数技术利用由传感器获得的振动信号进行故障分析. 齿轮箱振动谱中最重要的组成部分是齿面啮合频率及其谐波,