数据挖掘与机器学习之间有什么联系?

  谈到对数据进行分析利用,很多人会想到“数据挖掘”(data mining),这里简单探讨一下数据挖掘和机器学习的联系。

  数据挖掘领域是在二十世纪九十年代左右形成,他收到很多学科的影响,其中数据库、机器学习、统计学无疑是影响最大的。数据挖掘是从海量数据中发掘知识,这就必然涉及到对“海量数据”的管理和分析。大体来说,数据库领域的研究为数据挖掘提供了数据管理技术,而机器学习和统计学的研究为数据挖掘提供了数据分析技术。

  由于统计学届的研究成果通常需要机器学习研究来形成有效的学习算法,之后再进入数据挖掘领域,因此从这个意义上来说,统计学主要是通过机器学习对数据挖掘发挥影响,而机器学习领域和数据库领域则是数据挖掘的两大技术支撑。

时间: 2024-08-29 21:22:43

数据挖掘与机器学习之间有什么联系?的相关文章

详解数据挖掘与机器学习的区别与联系

1.大数据 (海量数据的存取,会设计到数据库技术) 大数据就是许多数据的聚合: 大数据的特征: 1.数据量大 2.结构复杂 3.数据更新速度快 2.机器学习 (理论和工具) 机器学习是人工智能的核心,要对大数据进行发掘,靠人工肯定是做不到的,要通过一个模型让计算机按照模型去执行,就是机器学习. 3.数据挖掘 (用机器学习对大数据进行分析,挖掘出有用的知识) 机器学习方法在大型数据库中的应用称为数据挖掘(Data Mining) 数据挖掘就是把大数据的价值发掘出来,比如根据过去30年的气象数据,通

数据挖掘与机器学习介绍

数据挖掘 1.定义: 数据挖掘(Data Mining)是有组织有目的地收集数据,通过分析数据使之成为信息,从而在大量数据中寻找潜在规律以形成规则或知识的技术. 2.数据挖掘与机器学习的关系: 机器学习可以用来作为数据挖掘的一种工具或手段: 数据挖掘的手段不限于机器学习,譬如还有诸如统计学等众多方法: 但机器学习的应用也远不止数据挖掘,其应用领域非常广泛,譬如人工智能: 机器学习 1.定义: 机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论.统计学.逼近论.凸

数据挖掘与机器学习——weka应用技术与实践

第一章 weka介绍 1.1 weka简介 weka是怀卡托智分析环境(Waikato Environment for Knowledge Analysis)的英文缩写,官方网址为:<http://www.cs.waikato.ac.nz/ml/weka/>,在该网站可以免费下载可运行软件和代码,还可以获得说明文档.常见问题解答.数据集和其他文献等资源. 1.1.1 Weka的历史 团队宣称:我们的目标是要建立最先进的软件开发机器学习技术,并将其应用于解决现实世界的数据挖掘问题.目标:是机器学

文本分类,数据挖掘和机器学习

转自:http://blog.chinaunix.net/uid-446337-id-94440.html 分类: 机器学习的有概率分类器(probabilistic) ,贝叶斯推理网络(bayesian inference networks) , 决策树分类器(decision tree) ,决策规则分类器(decision rule) ,基于回归的线性最小二乘llsf(regression based on linearleast squares fit ) , 符号规则归纳法( symbo

Python数据挖掘与机器学习技术入门实战

摘要: 什么是数据挖掘?什么是机器学习?又如何进行Python数据预处理?本文将带领大家一同了解数据挖掘和机器学习技术,通过淘宝商品案例进行数据预处理实战,通过鸢尾花案例介绍各种分类算法. 课程主讲简介:韦玮,企业家,资深IT领域专家/讲师/作家,畅销书<精通Python网络爬虫>作者,阿里云社区技术专家. 以下内容根据主讲嘉宾视频分享以及PPT整理而成. 本次课程包含了五个知识点:1.数据挖掘与机器学习技术简介 2.Python数据预处理实战 3.常见分类算法介绍 4.对鸢尾花进行分类案例实

搞了个微信号,关注数据挖掘,机器学习

我搞了个微信号(data_bird),关注大数据,数据挖掘,机器学习,深度学习. 与大家共同与时俱进! 本文作者:linger 本文链接:http://blog.csdn.net/lingerlanlan/article/details/41297033

推荐数据挖掘入门教材《数据挖掘与机器学习 WEKA应用技术与实践》

该书由于去年刚出比较新,所以很难在网上下载到电子书,本人很幸运找到了前两章的电子版,而第二章又是本书的关键,所以建议大家先看看第二章,如果觉的写的好,可以再买书,或寻求电子版的全书,下载前两章请到:http://download.csdn.net/detail/u010968153/8686369 图书简介: 本书借助代表当今数据挖掘和机器学习最高水平的著名开源软件Weka,通过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,拉近理论与实践的距离.全书共分8章,主要内容包括Weka

数据挖掘和机器学习

机器学习: 是人工智能的核心研究领域,目前把他定义为:利用经验来改善计算机系统性能. 对于“经验”,实际上在计算机中,“经验”是以数据的形式存在的,所以机器学习需要对数据进行分析运用.     提高泛化能力(generalization ability)是机器学习中最重要的问题之一.泛化能力表征了机器学习系统对新事件的适应能力,简单来说泛化能力越强,系统对事件做出的预测就越准确. 数据挖掘: “数据挖掘”和“知识发现”通常被认为是一样的.在许多场合是可替代的术语. 数据挖掘顾名思义:从海量数据中

【目录】数据挖掘与机器学习相关算法文章总目录

本博客所有文章分类的总目录链接:http://www.cnblogs.com/asxinyu/p/4288836.html 数据挖掘与机器学习相关算法文章目录 1.数据挖掘之—基于ReliefF和K-means算法的医学应用实例  2.彩票数据预测算法(一):离散型马尔可夫链模型实现[附C#代码]