数据挖掘与机器学习的相关理解

加州理工学院公开课:机器学习与数据挖掘:http://open.163.com/special/opencourse/learningfromdata.html

机器学习:那些具体的算法,得到精确模型,统行学家又称为统计学习

数据挖掘:数据库,数据清洗,数据可视化

深度学习:在图像,语音,富媒体取得较好表现,是机器学习的一个分支,伴随着大量的计算

学习方法:参考http://www.dataguru.cn/thread-316889-1-1.html

1、监督式学习:

  输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果。如西瓜的品质,好吃,一般,不好吃。通过训练建立预测模型,通过预测结果与“训练数据”的实际结果比较,不断的调整预测模型,直到预测结果达到一个预期的准确率。应用场景如分类和回归等问题。常见算法有逻辑回归(Logistic Regression)和反向传递神经网络(Back Propagation Neural Network)。

2、半监督式学习:

  输入数据部分被标识,部分没被标识,这种学习模型可以用来预测,但是模型首先需要学习数据的内在结构以便合理的组织数据进行预测。先对未标识的数据进行建模,然后再在这个基础上再对标识的数据进行预测。如图论推理算法(Graph Inference)或者拉普拉斯支持向量机(Laplacian SVM.)等。

3、非监督式学习:

  数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。常见的应用场景包括关联规则的学习以及聚类等。常见算法包括Apriori算法以及k-Means算法。

4、强化学习:

  数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。常见的应用场景包括关联规则的学习以及聚类等。常见算法包括Apriori算法以及k-Means算法。

  http://www.dataguru.cn/thread-316889-1-1.html

  在企业数据应用的场景下, 人们最常用的可能就是监督式学习和非监督式学习的模型。 在图像识别等领域,由于存在大量的非标识的数据和少量的可标识数据, 目前半监督式学习是一个很热的话题。 而强化学习更多的应用在机器人控制及其他需要进行系统控制的领域。

时间: 2024-10-25 16:38:48

数据挖掘与机器学习的相关理解的相关文章

推荐数据挖掘入门教材《数据挖掘与机器学习 WEKA应用技术与实践》

该书由于去年刚出比较新,所以很难在网上下载到电子书,本人很幸运找到了前两章的电子版,而第二章又是本书的关键,所以建议大家先看看第二章,如果觉的写的好,可以再买书,或寻求电子版的全书,下载前两章请到:http://download.csdn.net/detail/u010968153/8686369 图书简介: 本书借助代表当今数据挖掘和机器学习最高水平的著名开源软件Weka,通过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,拉近理论与实践的距离.全书共分8章,主要内容包括Weka

【目录】数据挖掘与机器学习相关算法文章总目录

本博客所有文章分类的总目录链接:http://www.cnblogs.com/asxinyu/p/4288836.html 数据挖掘与机器学习相关算法文章目录 1.数据挖掘之—基于ReliefF和K-means算法的医学应用实例  2.彩票数据预测算法(一):离散型马尔可夫链模型实现[附C#代码] 

文本分类,数据挖掘和机器学习

转自:http://blog.chinaunix.net/uid-446337-id-94440.html 分类: 机器学习的有概率分类器(probabilistic) ,贝叶斯推理网络(bayesian inference networks) , 决策树分类器(decision tree) ,决策规则分类器(decision rule) ,基于回归的线性最小二乘llsf(regression based on linearleast squares fit ) , 符号规则归纳法( symbo

Python数据挖掘与机器学习技术入门实战

摘要: 什么是数据挖掘?什么是机器学习?又如何进行Python数据预处理?本文将带领大家一同了解数据挖掘和机器学习技术,通过淘宝商品案例进行数据预处理实战,通过鸢尾花案例介绍各种分类算法. 课程主讲简介:韦玮,企业家,资深IT领域专家/讲师/作家,畅销书<精通Python网络爬虫>作者,阿里云社区技术专家. 以下内容根据主讲嘉宾视频分享以及PPT整理而成. 本次课程包含了五个知识点:1.数据挖掘与机器学习技术简介 2.Python数据预处理实战 3.常见分类算法介绍 4.对鸢尾花进行分类案例实

详解数据挖掘与机器学习的区别与联系

1.大数据 (海量数据的存取,会设计到数据库技术) 大数据就是许多数据的聚合: 大数据的特征: 1.数据量大 2.结构复杂 3.数据更新速度快 2.机器学习 (理论和工具) 机器学习是人工智能的核心,要对大数据进行发掘,靠人工肯定是做不到的,要通过一个模型让计算机按照模型去执行,就是机器学习. 3.数据挖掘 (用机器学习对大数据进行分析,挖掘出有用的知识) 机器学习方法在大型数据库中的应用称为数据挖掘(Data Mining) 数据挖掘就是把大数据的价值发掘出来,比如根据过去30年的气象数据,通

机器学习的相关书籍

<Introduction to Data Mining> <Data Mining : Concepts and Techniques> <Introduction to Machine Learning> <机器学习:实用案例解析> <Pattern Recognition and Machine Learning> <The Elements of Statistical Learning> <Machine Learni

数据挖掘和机器学习

机器学习: 是人工智能的核心研究领域,目前把他定义为:利用经验来改善计算机系统性能. 对于“经验”,实际上在计算机中,“经验”是以数据的形式存在的,所以机器学习需要对数据进行分析运用.     提高泛化能力(generalization ability)是机器学习中最重要的问题之一.泛化能力表征了机器学习系统对新事件的适应能力,简单来说泛化能力越强,系统对事件做出的预测就越准确. 数据挖掘: “数据挖掘”和“知识发现”通常被认为是一样的.在许多场合是可替代的术语. 数据挖掘顾名思义:从海量数据中

.NET数据挖掘与机器学习开源框架

1.    数据挖掘与机器学习开源框架 1.1 框架概述 1.1.1 AForge.NET AForge.NET是一个专门为开发者和研究者基于C#框架设计的,他包括计算机视觉与人工智能,图像处理,神经网络,遗传算法,机器学习,模糊系统,机器人控制等领域.这个框架由一系列的类库组成.主要包括有: AForge.Imaging -- 一些日常的图像处理和过滤器 AForge.Vision -- 计算机视觉应用类库 AForge.Neuro -- 神经网络计算库AForge.Genetic -进化算法

数据挖掘与机器学习介绍

数据挖掘 1.定义: 数据挖掘(Data Mining)是有组织有目的地收集数据,通过分析数据使之成为信息,从而在大量数据中寻找潜在规律以形成规则或知识的技术. 2.数据挖掘与机器学习的关系: 机器学习可以用来作为数据挖掘的一种工具或手段: 数据挖掘的手段不限于机器学习,譬如还有诸如统计学等众多方法: 但机器学习的应用也远不止数据挖掘,其应用领域非常广泛,譬如人工智能: 机器学习 1.定义: 机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论.统计学.逼近论.凸