数据挖掘之功能

  

  数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能。

  1、自动预测趋势和行为

  数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。一个典型的例子是市场预测问题,数据挖掘使用过去有关促销的数据来寻找未来投资中回报最大的用户,其它可预测的问题包括预报破产以及认定对指定事件最可能作出反应的群体。

  2、关联分析

  数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。

  3、聚类

  数据库中的记录可被化分为一系列有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学。80年代初,Mchalski提出了概念聚类技术牞其要点是,在划分对象时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技术的某些片面性。

  4、概念描述

  概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性描述只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。

  5、偏差检测

  数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是,寻找观测结果与参照值之间有意义的差别。 数据挖掘与传统分析方法的区别

  数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识.数据挖掘所得到的信息应具有先未知,有效和可实用三个特征.

  先前未知的信息是指该信息是预先未曾预料到的,既数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值.在商业应用中最典型的例子就是一家连锁店通过数据挖掘发现了小孩尿布和啤酒之间有着惊人的联系。

数据挖掘之功能,布布扣,bubuko.com

时间: 2024-11-08 19:56:50

数据挖掘之功能的相关文章

数据挖掘第一天

---恢复内容开始--- 在看了大话数据挖掘这本书前36页后,学到的知识. 数据挖掘(Data Mining)和数据库中的知识发现(KDD)互为别名. 数据挖掘的实例:啤酒与尿布.流量套餐用户群.套餐用户流失量原因.捆绑销售.零件维修费用的节制. 数据挖掘的概念:基于大量的.不完全的.有噪音的.模糊的.随机的数据中发现隐藏的有价值的知识.不完全的意思是在收集相应数据有缺失的,有噪音是获得的数据偏离了真实值,比如外界的干扰.测量仪器的故障.人工输入或抄写时的误差等.模糊性是指事物本身从属概念的不确

《数据挖掘概念与技术》——第四章 数据仓库与联机分析处理

一.基本概念 1.宽泛概念:数据仓库是一种数据库,它与的那位的操作数据库分别维护.数据仓库系统允许将各种应用系统集成在一起,为同一的历史数据分析提供坚实的平台,对信息处理提供支持. 另一种说法: 数据仓库是一个面向主题的.集成的.时变的.非易失的数据集合,支持管理者的决策过程. 1)面向主题的:数据仓库围绕一些重要的主题,如顾客.供应商.产品和销售组织.关注点是决策者的数据建模与分析,不是在日常操作和事务处理上. 2)集成的:构造数据仓库是将多个易购数据源,如关系数据库.一般文件.联机事务处理记

《大话数据挖掘》学习笔记——案例教学法

"我们沉浸在数据的海洋里,却渴望着知识的淡水." 数据挖掘的最高境界就是"从数据中获取知识,辅助科学决策". 历史使命:"建设创新型国家" 第一章 故事一:课外知识: 萨姆.沃尔顿(沃尔玛创始人) (1)服务理念:"日落原则"."十英尺态度"."三米微笑". (2)营销策略:"女裤理论"(薄利多销)."啤酒与尿布"(关联规则分析,数据挖掘经典案例)

BI-SSAS简介篇

一.是什么? SSAS是用于SQLServer数据库用于BI的组件,通过SSAS可以创建多维数据库,并在之上进行数据挖掘操作.本文我们主要介绍一些关于SSAS数据分析的知识.接下来就让我们来一起了解一下吧. 商业智能提供的解决方案能够从多种数据源获取数据并且能够把各种数据转化成同一格式数据进行存储,最终达到让用户可以快速访问解读数据,为用户分析和制定决定提供有效的数据支持,那么SSAS就是通过建立多维的数据集来为数据的分析提供更快捷更高校的数据挖掘. 二.结构 SSAS又称挖掘结构,定义生成挖掘

Windbg Extension NetExt 使用指南 【1】 ---- NetExt 介绍

摘要 : 在使用WINDBG做debugging的时候,需要一个好的工具帮助进行数据分析. 最常见的extension包括SOS, PSSCOR.  NetExt则是另外一种提供了丰富命令功能的debugging extension. NetExt主要用于Managed Code的分析功能, 对ASP.NET, WCF, WIF有良好的支持, 并且提供了很多常用的分析命令. 它涵盖了SOS以及PSSCOR的绝大部分命令, 并且提供了更为强大的数据挖掘的功能. 在这个系列里面, 我将一一介绍这个功

探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类

聚类分析 什么是聚类分析? 聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大.所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量. 其实聚类是一个人们日常生活的常见行为,即所谓"物以类聚,人以群分",核心的思想也就是聚类.人们总是不断地改进下意识中的聚类模式来学习如何区分各个事物和人.同时,聚类分析已经广泛的应用在许多应用中,包

数据库 chapter 17 数据仓库与联机分析处理技术

第十七章 数据仓库与联机分析处理技术 计算机系统中存在着两类不用的数据处理工作:操作型处理和分析型处理,也称作OLTP(联机事务处理)和OLAP(联机分析处理) 操作型处理是指对数据库联机的日常操作,通常是对一个或一个组记录的查询和修改. 分析型处理是指对数据的查询和分析操作,通常是对海量的历史数据查询和分析. 据(即多维数据)到底存储在什么地方,是怎么存储的.OLAP服务器则必须考虑物理上这些数据的存储问题. 前台工具包括查询报表工具.多维分析工具,数据挖掘工具和分析结果可视化工具等. 联机分

Tableau未必最佳,国内BI也能突破重围!

如今,百度一下商业智能或BI工具,总能看到Tableau的身影.并不是Tableau的营销做得好,而是国内对于商业智能工具的认知和选择似乎都落在了Tableau身上.导致不管业内业外都对商业智能的概念有了偏颇之见,认为就是一个前端展示工具,就是一个做图表的. 这里并不是在否认Tableau.确实,Tableau的可视化,图表制作能力被众人称赞,这点值得国内BI厂商借鉴.但从商业智能的应用来看,企业对于BI的关注,更多的是数据处理的性能(数据量.速度.稳定性).产品的适配性(可开发性.可集成性)以

聚类分析案例

一.数据挖掘的常用方法 利用数据挖掘进行数据分析常用的方法主要有分类.回归分析.聚类.关联规则.特征.变化和偏差分析.Web页挖掘等,它们分别从不同的角度对数据进行挖掘. 分类.分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别.它可以应用到客户的分类.客户的属性和特征分析.客户满意度分析.客户的购买趋势预测等,如一个汽车零售商将客户按照对汽车的喜好划分成不同的类,这样营销人员就可以将新型汽车的广告手册直接邮寄到