计划安排时间 | 计划完成内容 | 是否完成 |
2017.3.1---2017.3.7 | 了解贝叶斯算法的大致内容 | |
2017.3.8---2017.3.30 | 掌握贝叶斯算法的原理,阅读相关书籍,学习python语言,并初步进行相关算法的实现检验 | |
2017.4.1---2017.4.15 | 学习数据的预处理方法,对算法要处理的入侵数据数据进行尝试处理 | |
2017.4.16---2017.5.7 | 程序设计,糅合以上三块内容,并且用python进行分析结果展示 | |
2017.5.8---2017.5.15 | 撰写毕业论文,并且与老师共同修改 | |
2017.5.15---2017.5.22 | 修改、并做好答辩的各项准备工作 |
二、本周研究内容。
1、 贝叶斯算法的基本概念和原理:
朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。
朴素贝叶斯分类的正式定义如下:
1、设为一个待分类项,而每个a为x的一个特征属性。
2、有类别集合。
3、计算。
4、如果,则。
2、应用的三大阶段
第一阶段——准备工作阶段,这个阶段的任务是为朴素贝叶斯分类做必要的准备,主要工作是根据具体情况确定特征属性,并对每个特征属性进行适当划分,然后由人工对一部分待分类项进行分类,形成训练样本集合。这一阶段的输入是所有待分类数据,输出是特征属性和训练样本。
第二阶段——分类器训练阶段,这个阶段的任务就是生成分类器,主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率估计,并将结果记录。其输入是特征属性和训练样本,输出是分类器。
第三阶段——应用阶段。这个阶段的任务是使用分类器对待分类项进行分类,其输入是分类器和待分类项,输出是待分类项与类别的映射关系。
三、本周实现代码及结果截图展示。
暂无
四、你本周的体会及需要改进地方。
原理的掌握是最基本的,可以通过一些实例来理解贝叶斯分类器的思想——贝叶斯算法。唯一的人工阶段就是数据处理,即确定数据属性,并进行适当的划分,所以这部分应该也是对最后结果精确度的影响还是很大的。
五、你本周参考的文献。
1、http://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayesian-classifier.html
2、http://www.ruanyifeng.com/blog/2013/12/naive_bayes_classifier.html
时间: 2024-10-12 12:25:58