数据挖掘十大算法之贝叶斯分类算法

1、引言

贝叶斯分类算法是统计学的一种分类方法，它是一类利用概率统计知识进行分类的算法。在许多场合，朴素贝叶斯(Na?ve Bayes，NB)分类算法可以与决策树和神经网络分类算法相媲美，该算法能运用到大型数据库中，而且方法简单、分类准确率高、速度快。

由于贝叶斯定理假设一个属性值对给定类的影响独立于其它属性的值，而此假设在实际情况中经常是不成立的，因此其分类准确率可能会下降。为此，就衍生出许多降低独立性假设的贝叶斯分类算法，如TAN(tree augmented Bayes network)算法。

2、以一个实例来描述朴素贝叶斯分类算法：

题目：下面的例子分为3类: {Short，Tall，Medium}，Height为连续属性，假定该属性服从高斯分布，数据集如表4-5所示，请用贝叶斯分类方法对例子t=(Adam，M，1.95m)进行分类。

解：

数据样本用属性name,Gender和Height描述。类别标号属性Output具有{Short,Tall,Medium}三个不同值。

设：C1类对应于Output=”Short”，C2类对应于Output=”Tall”，C3类对应于Output=”Medium”

希望分类的已知样本为：t=(Adam,M,1.95m)

3、Word文档下载

（1）http://download.csdn.net/detail/u012339743/8829507

原文作者：Joe Chael

原文地址：http://blog.csdn.net/qingdujun/article/details/46598187

时间： 2024-12-28 17:56:12

数据挖掘十大算法之贝叶斯分类算法的相关文章

数据挖掘十大经典算法

一. C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3 算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足: 2) 在树构造过程中进行剪枝: 3) 能够完成对连续属性的离散化处理: 4) 能够对不完整数据进行处理. C4.5算法有如下优点:产生的分类规则易于理解,准确率较高.其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导

数据挖掘十大算法

大数据时代数据挖掘十大经典算法不不过选中的十大算法,事实上參加评选的18种算法.实际上随便拿出一种来都能够称得上是经典算法,它们在数据挖掘领域都产生了极为深远的影响. 1.C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法.C4.5算法继承了ID3算法的长处.并在下面几方面对ID3算法进行了改进: 1)用信息增益率来选择属性.克服了用信息增益选择属性时偏向选择取值多的属性的不足: 2)在树构造过程中进行剪枝: 3)可以完毕对连续属性的离散化处理. 4)可以对不

数据挖掘十大算法之CART详解

在2006年12月召开的 IEEE 数据挖掘国际会议上(ICDM, International Conference on Data Mining),与会的各位专家选出了当时的十大数据挖掘算法( top 10 data mining algorithms ),可以参见文献[1].本博客已经介绍过的位列十大算法之中的算法包括: [1] k-means算法(http://blog.csdn.net/baimafujinji/article/details/50570824) [2] 支持向量机SVM

数据挖掘十大算法之决策树详解（2）

在2006年12月召开的 IEEE 数据挖掘国际会议上(ICDM, International Conference on Data Mining),与会的各位专家选出了当时的十大数据挖掘算法( top 10 data mining algorithms ),可以参见文献[1].本博客已经介绍过的位列十大算法之中的算法包括: [1] k-means算法(http://blog.csdn.net/baimafujinji/article/details/50570824) [2] 支持向量机SVM

数据挖掘十大算法之决策树详解（1）

在2006年12月召开的 IEEE 数据挖掘国际会议上(ICDM, International Conference on Data Mining),与会的各位专家选出了当时的十大数据挖掘算法( top 10 data mining algorithms ),可以参见文献[1].本博客已经介绍过的位列十大算法之中的算法包括: [1] k-means算法(http://blog.csdn.net/baimafujinji/article/details/50570824) [2] 支持向量机SVM

数据挖掘十大算法--Apriori算法

一.Apriori 算法概述 Apriori 算法是一种最有影响力的挖掘布尔关联规则的频繁项集的算法,它是由Rakesh Agrawal 和RamakrishnanSkrikant 提出的.它使用一种称作逐层搜索的迭代方法,k- 项集用于探索(k+1)- 项集.首先,找出频繁 1- 项集的集合.该集合记作L1.L1 用于找频繁2- 项集的集合 L2,而L2 用于找L2,如此下去,直到不能找到 k- 项集.每找一个 Lk 需要一次数据库扫描.为提高频繁项集逐层产生的效率,一种称作Apriori

数据挖掘十大算法之Apriori详解

在2006年12月召开的 IEEE 数据挖掘国际会议上(ICDM, International Conference on Data Mining),与会的各位专家选出了当时的十大数据挖掘算法( top 10 data mining algorithms ),可以参见文献[1].本博客已经介绍过的位列十大算法之中的算法包括: [1] k-means算法(http://blog.csdn.net/baimafujinji/article/details/50570824) [2] 支持向量机SVM

数据挖掘十大算法总结--核心思想，算法优缺点，应用领域

本文所涉算法均只概述核心思想,具体实现细节参看本博客"数据挖掘算法学习"分类下其他文章,不定期更新中.转载请注明出处,谢谢. 参考了许多资料加上个人理解,对十大算法进行如下分类: ?分类算法:C4.5,CART,Adaboost,NaiveBayes,KNN,SVM ?聚类算法:KMeans ?统计学习:EM ?关联分析:Apriori ?链接挖掘:PageRank 其中,EM算法虽可以用来聚类,但是由于EM算法进行迭代速度很慢,比kMeans性能差很多,并且KMeans算法聚类效果

数据挖掘十大算法之k-means算法

1.引言 k-means算法主要是用来解决什么问题呢?主要是用来解决类似于这样的问题:聚类,如一次班级聚餐,平时玩的好的同学,就会自动的聚集在一起愉快的玩耍.那么什么样才算平时玩的好呢?请看k-means算法. K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则.K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小.算法采用误差平

猜你喜欢

2017 多校赛第二场

1003.Maximum Sequence Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Ot ...

Java集合(17)--HashMap、Hashtable和ConcurrentHashMap的比较

1. 数据结构都是数组+拉链实现的哈希表,但是具体实现上差别大了 2. 并发 Hashtable全表锁 HashMap多线程不安全,需要自己封装 ConcurrentHashMap加细粒度锁,读不加 ...

在Github上开了一个关于leetcode的repository. 如果你也有兴趣可以把你的解法通过github上传,一起印证和学习. https://github.com/LiLane/leetc ...

Windows 磁盘检查命令

今天在给朋友重装系统时,发现每次重启时总是出现下面的问题上网搜索了下这个问题,可能的原因是:把磁盘格式转换成NTFS时没等转换完就重启或关机造成的. 解决方案:使用 "chkdsk/f D ...

中科院外籍院士姚期智：科学家与科学之路

■姚期智我从事科学工作几十年,也认识了很多杰出的科学家.我自己觉得科学家的生涯很有收获,当科学家是一个非常好的体验,从中可以品尝到巨大的乐趣. 首先,我要谈一谈什么是科学家,科学家做什么 ...

[MODx] Build a CMP (Custom manager page) using MIGX in MODX 2.3 -- 2

We are not finishing yet... 1. Under MIGX Management, we need to add some "Actionbuttons" ...

CUDA 纹理内存

原文链接 1.概述纹理存储器中的数据以一维.二维或者三维数组的形式存储在显存中,可以通过缓存加速访问,并且可以声明大小比常数存储器要大的多. 在kernel中访问纹理存储器的操作称为纹理拾取(tex ...

c++ 使用json的库。cJSON

你看到的这个文章来自于http://www.cnblogs.com/ayanmw cJSON官网是:http://sourceforge.net/projects/cjson/?source=reco ...

tyvj 1049 最长不下降子序列 n^2/nlogn

P1049 最长不下降子序列时间: 1000ms / 空间: 131072KiB / Java类名: Main 描述求最长不下降子序列的长度输入格式第一行为n,表示n个数第二行n个数输出格式 ...

SWIFT中使用AFNetwroking访问网络数据

AFNetworking 是 iOS 一个使用很方便的第三方网络开发框架,它可以很轻松的从一个URL地址内获取JSON数据. 在使用它时我用到包管理器Cocoapods 不懂的请移步: Cocoapo ...

ExtJs4.2应用：使用ExtJs扩展组件searchfield实现数据搜索功能

ExtJs4.2应用:使用ExtJs扩展组件searchfield 实现数据搜索功能 1.引入searchfield组件在Ext目录下放入ux目录将searchfield组件放入ux目录下的form ...

jmeter录制(ios)app脚本

做好笔记,怕自己后面忘了 1.运行jmeter,添加线程组,单击工作台右键添加HTTP代理服务器,配置端口号9999,HTTP Domanins 以https://开头,后接运行jmeter的本机IP ...

刿苊偾堂湍wspxre5o22h3ocd9lyh

原本憨厚温和的他,眼神骤然变得锐利起来,嘴里歪歪的叼着那根"大便"用力深吸一口,突然宛如一只矫健的猎豹般动了起来.贝贝作为队长,忍不住问道:"言院长,终身指的是我们在史莱 ...

zw版【转发·台湾nvp系列Delphi例程】HALCON OverpaintRegion2

zw版[转发·台湾nvp系列Delphi例程]HALCON OverpaintRegion2 unit Unit1;interfaceuses Windows, Messages, SysUtils, ...

java的NIO包中ByteBuffer类的clear(),flip(),rewind()方法的意思

我们要澄清一点:这三个方法都是ByteBuffer的抽象基类Buffer定义的方法,ByteBuffer只是继承了它们. *************************************** ...

DexHunter脱壳神器分析

0x00 这篇文章我们分析Android脱壳神器DexHunter的源代码.DexHunter作者也写了一篇介绍它的文章从Android运行时出发,打造我们的脱壳神器.DexHunter源代码位于ht ...

js&jquery验证邮箱和手机号是否正确范例

实现源码: <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> ...

Oracle 学习之性能优化（四）收集统计信息

emp表有如下数据. SQL> select ename,deptno from emp; ENAME DEPTNO ------------------------------ ---- ...

定制Meteor账户界面

Meteor自带一个方便的账户代码包,可以很容易的在应用中加入用户注册.登录和找回密码等功能. Meteor的这个账户系统对于快速构建原型是非常有帮助的,但是,当需要更合适,更具弹性的账户系统时,就要 ...

JFinal + B-JUI（2）-实践（了如股掌）

前一篇里面说了前端选用B-JUI,配合后端JFinal,形成了JFinal + B-JUI的组合. 那么接下来是做什么,然后才是怎么做. 14年-15年最火爆的莫过于股市,互联网金融风生水起,各种神话 ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.