五，论文研读

论文名称：陈子健，朱晓亮.基于教育数据挖掘的在线学习者学业成绩预测建模模型.
研究对象
从教育数据中挖掘影响在线学习者成绩学业成绩的因素并构建分类预测模型。
研究动机
学业成绩的预测和评价是全世界教育研究者共同关注的话题，如何对在线学习者的学业成绩进行预测便于提供预警和其他干预措施。
文献综述
该研究中的学业成绩预测模型主要是利用已知学生学业成绩类别的训练数据得到一个分类函数或分类模型（分类器），并评估模型的性能。
研究方案设计
- 预测算法
  研究主要是预测在学习结束时学业成绩的类别，为预测离散的值，故采用分类策略。
  常用分类算法
  BN，DT，ANN，SVM（训练单一分类器）
- 集成学习
  集体决策优于个体决策（装袋，提升，随机森林）
- 实验设计
  上述四种分类算法在训练集上训练单一分类器，然后分别以四种算法训练基分类器，再利用三种集成学习构成集成分类器。
  对比单一分类器和集成分类器的性能。
- 实验结果分析
  BN，DT，ANN，通过构建集成分类器都能不同程度的提升分类性能，SVM并不明显。
使用数据集
研究使用的约旦大学e-Learning学业成绩数据集（xAPI-Edu-Date）
研究结论
学习心得
很好的一篇文献，读的时候结合了数据挖掘第八章8.6节“提高分类准确率技术”，文献中明确给出了数据集来源，不过网址打开出现404，此外对文献作者有进一步了解。

原文地址：https://www.cnblogs.com/zaw-315/p/11234493.html

时间： 2024-09-29 02:45:06

五，论文研读的相关文章

论文研读与下载地址

1.Using the cross-entropy method to re-rank search results 下载:http://iew3.technion.ac.il/~kurland/crossEnt.pdf 论文研读与下载地址

A Deep Learning Model to Predict a Diagnosis of Alzheimer Disease by Using 18F-FDG PET of the Brain 原文链接提要目的开发并验证一种深度学习算法,该算法可以基于脑部18F FDG PET来预测AD.轻度认知障碍或者二者均不是的诊断结果,并将其性能与放射学阅读器的性能进行比较材料和方法来自ADNI的18F-FDG PET脑图(含2109张图片,包括1002个病人)用于训练.验证,40张来自4

Automatic Generation of Animated GIFs from Video论文研读及实现

论文地址:Video2GIF: Automatic Generation of Animated GIFs from Video 视频的结构化分析是视频理解相关工作的关键.虽然本文是生成gif图,但是其中对场景RankNet思想值得研究. 文中的视频特征表示也是一个视频处理值得学习的点.以前做的视频都是基于单frame,没有考虑到时空域,文中的参考文献也值得研读一下. 以下是对本文的研读,英语水平有限,有些点不知道用汉语怎么解释,直接用的英语应该更容易理解一些. Abstract 从源视频当中提

一，论文研读总结

研究对象本篇论文是关于时间序列数据挖掘中特征表示与相似性度量的一篇研究综述. 研究动机时间序列数据挖掘中问题分析了时间序列特征表示和相似性度量在数据挖掘中的作用,意义,对目前已有的主要方法进行综述,分析各自存在的优缺点:此外探讨了一些值得关注的问题. 文献综述主要论述了特征研究现状及方法:相似性度量的研究现状及方法.特征表示1.1分段线性表示方法1.2分段聚合表示方法1.3符号化表示方法1.4基于域变换的表示方法1.5奇异值分解表示方法1.6基于模型的表示方法相似性度量1.1欧氏距离1.2动态时

论文研读《Highly Accurate Machine Fault Diagnosis Using Deep Transfer Learning》采用深度转移学习的高精度机械故障诊断——2019

开发了一种新的深度学习框架,以实现高精度的机器故障诊断,使用转移学习,以启用和加速训练的深度神经网络.与现有方法相比,该方法训练速度更快,精度更高.首先,通过进行小波变换,将原始传感器数据转换成图像以获得时间-频率分布.接下来,使用一个预训练的网络来提取较低层次的特征.标记的时频图像然后被用来微调更高水平的神经网络体系结构.本文建立了一个机械故障诊断流水线,并在三个主要的机械数据集(包括感应电机.齿轮箱和6000, 9000个尺寸的轴承和5000个时间样本)上验证了流水线的有效性和通用性.我们在

论文研读1.0 基于神经网络与因子分解机的点击率预估应用研究（陈检）

基于神经网络与因子分解机的点击率预估应用研究(陈检) 摘要长久以来广告点击预估率问题属于用户行为预测研究问题,其主要解决是特征工程问题. 深度神经网络主要提取高阶特征,因子分解机提取二阶以下特征注改:因子分解机实际应用中受限于计算复杂度,一般只考虑到2阶交叉特征(FM预测时间复杂度O(kn),FFM预测时间复杂度O(kn^2),FM提取低阶组合特征,Deep提取低阶组合特征,同时学习低阶和高阶的组合特征. FM与Deep共享同样的输入. 通过对比试验发现:基于深度神经网络和因子分解机的组合模

Google 三大经典论文研读：GFS、BigTable、MapReduce

一.GFS Google File System就是HDFS的前身 HDFS 参照了GFS的设计理念,大部分架构设计概念是类似的,比如 HDFS NameNode 相当于 GFS Master,HDFS DataNode 相当于 GFS chunkserver\ 1.设计目标: 多个客户端可以在不需要额外的同步锁定的情况下,同时对一个文件追加数据高性能的稳定网络带宽远比低延迟重要.目标程序绝大部分要求能够高速率的.大批量的处理数据,极少有程序对单一的读写操作有严格的响应时间要求 2.架构:

论文研读《Deep Learning and Its Applications to MachineHealth Monitoring: A Survey》

machine health monitoring 机械健康诊断数据驱动的机器健康监测系统提供了一种自下而上的解决方案,用于在发生某些故障(诊断)后检测故障,并预测未来工作条件和剩余使用寿命(预测). 众所周知,复杂的工作环境和噪声的存在阻碍了物理模型的建立.而这些基于物理的模型大多无法用在线测量数据进行更新,这限制了它们的有效性和灵活性.另一方面,随着传感器.传感器网络和计算系统的飞速发展,数据驱动的机器健康监测模型越来越受到人们的关注,为了从大数据中提取有用的知识并做出适当的决策,机器学习

论文研读《Virtualization and deep recognition for system fault classi?cation》_系统故障分类的虚拟化与深度识别_2017

研究内容为齿轮变速箱. 变速箱健康监测和动力系统诊断结果的有效表示仍然具有挑战性.本文以齿轮箱为例,提出了一种利用深度学习将一维时间序列分析诊断结果转化为故障类型和图形说明的图形图像的新方法.具体地说,小波分析将时间序列转换为时频图像.接着,深度卷积神经网络(DCNN)从这些图像中学习时间-频率域中的基本特征并执行故障分类.齿轮箱试验结果表明,该方法的精度和效率优于99.5%. 文献中报道的大多数技术利用由传感器获得的振动信号进行故障分析. 齿轮箱振动谱中最重要的组成部分是齿面啮合频率及其谐波,