算法总结、类比

1.用于文档分类的贝叶斯分类器:

监督算法

优点:

训练和查询数据的高效性

每次训练可能只是用一个训练项,不想决策树、SVM必须传入整个群组,才能得到最后的结果

缺点:

因为贝叶斯定理假设特征间彼此相互独立,所以无法对组合特征的结果分类

2.决策树分类器:

监督算法:

优点:

模型的解释相对容易,最为重要的判断因素都很好的安排在靠近根部的位置;可以非常清晰的显示出哪些变量时最合适用于拆分数据的,在广告策划、判断哪些数据应该收集方面非常有意

能够同时处理分类和数值型数据

非常容易的处理变量间的相互影响,比分档分类的贝叶斯分类在这个方面好

缺点:

对属性非常多的数据分类时,比较困难

不支持增量式的训练

3.神经网络

监督的,可以识别出重要信息和非重要信息,既可以用于分类,也可以用于数值预测问题

优点:

处理复杂的非线性函数,及不同输入间的依赖关系

增量式的训练

缺点:

黑盒方法,不可控性

4.支持向量机、核技法:

优点:

对新的观测数据分类速度最快

适合大数据集的分类,决策树等分类方法更适合小数据集

缺点:

对于不同的数据集必须重新确定这些(核)变换函数及其参数

也是黑盒技术

5.kNN

优点:

使用复杂函数进行数值预测,同时保持简单易懂的特点

能知道各个属性的重要程度

在线技术

缺点:

要求大量的训练数据

为大数据集寻找缩放因子计算量非常大

6.聚类

7.非负矩阵因式分解:拆分数据得到新的关系

8.优化

时间: 2024-12-25 07:48:37

算法总结、类比的相关文章

低秩矩阵填充|奇异值阈值算法

斜风细雨作小寒,淡烟疏柳媚晴滩.入淮清洛渐漫漫. 雪沫乳花浮午盏,蓼茸蒿笋试春盘.人间有味是清欢. ---- 苏轼 更多精彩内容请关注微信公众号 "优化与算法" 低秩矩阵恢复是稀疏向量恢复的拓展,二者具有很多可以类比的性质.首先,稀疏是相对于向量而言,稀疏性体现在待恢复向量中非零元素的数量远小于向量长度:而低秩是相对于矩阵而言,低秩体现在矩阵的秩远小于矩阵的实际尺寸.其次,稀疏向量恢复问题可以转化为基于 \(\ell _1\) 范数的凸优化问题,因为 \(\ell _1\) 范数是 \

Lisp简明教程

此教程是我花了一点时间和功夫整理出来的,希望能够帮到喜欢Lisp(Common Lisp)的朋友们.本人排版很烂还望多多海涵! <Lisp简明教程>PDF格式下载 <Lisp简明教程>ODT格式下载 具体的内容我已经编辑好了,想下载的朋友可以用上面的链接.本人水平有限,如有疏漏还望之处(要是有谁帮我排排版就好了)还望指出!资料虽然是我整理的,但都是网友的智慧,如果有人需要转载,请至少保留其中的“鸣谢”页(如果能有我就更好了:-)). Lisp简明教程 整理人:Chaobs 邮箱:[

HDU 5666 快速乘

Segment Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Others)Total Submission(s): 360    Accepted Submission(s): 134 Problem Description Silen August does not like to talk with others.She like to find some interesting pr

【程序员小助手】Emacs,最强编辑器,没有之一

内容简介 1.Emacs简介 2.Emacs三个平台的安装与配置 3.自动补全插件 4.小编的Emacs配置文件 5.常用快捷方式 6.和版本控制系统的配合(以SVN为例) [程序员小助手]系列 在这个系列文章中(不定期更新),小编会把这些年(也没几年)的编程学习和工作中使用到的个人感觉非常好的软件推荐给大家,希望能够共享美好资源,使大家提高编程和办事效率. Emacs,最强编辑器,没有之一 小编知道,此标题一出,肯定会遭受广大群众“诟病”,说不好还会被其他编辑器的粉丝暗地里“干掉”. 比如,V

转: 技术人员的发展之路

2012年的时候写过一篇叫<程序算法与人生选择>的文章,我用算法来类比如何做选择,说白了就是怎么去计算,但是并没有讲程序员可以发展的方向有哪些. 所以,就算是有这些所谓的方法论,我们可能对自己的发展还是会很纠结和无所事从,尤其是人到了30岁,这种彷徨和迷惑越来越重.虽然我之前也写过一篇<编程年龄和编程技能>的文章,但是还是有很多做技术的人对于自己能否在年纪大时还能去做技术感到没有信心.我猜测,这其中,最大的问题的是,目前从事技术工作的种种负面的经历(比如经常性的加班,被当成棋子或劳

LISP 转载

一 如果我们把流行的编程语言,以这样的顺序排列:Java.Perl.Python.Ruby.你会发现,排在越后面的语言,越像Lisp. Python模仿Lisp,甚至把许多Lisp黑客认为属于设计错误的功能,也一起模仿了.至于Ruby,如果回到1975年,你声称它是一种Lisp方言,没有人会反对. 编程语言现在的发展,不过刚刚赶上1958年Lisp语言的水平. 二 1958年,John McCarthy设计了Lisp语言.我认为,当前最新潮的编程语言,只是实现了他在1958年的设想而已. 这怎么

技术人员的发展之路 (转载)

转载自:陈皓(左耳朵耗子)  http://coolshell.cn/articles/17583.html  酷 壳 – CoolShell 2012年的时候写过一篇叫<程序算法与人生选择>的文章,我用算法来类比如何做选择,说白了就是怎么去计算,但是并没有讲程序员可以发展的方向有哪些. 所以,就算是有这些所谓的方法论,我们可能对自己的发展还是会很纠结和无所事从,尤其是人到了30岁,这种彷徨和迷惑越来越重.虽然我之前也写过一篇<编程年龄和编程技能>的文章,但是还是有很多做技术的人对

redis 延时任务 看一篇成高手系列2

引言 在开发中,往往会遇到一些关于延时任务的需求.例如 生成订单30分钟未支付,则自动取消 生成订单60秒后,给用户发短信 对上述的任务,我们给一个专业的名字来形容,那就是延时任务.那么这里就会产生一个问题,这个延时任务和定时任务的区别究竟在哪里呢?一共有如下几点区别 定时任务有明确的触发时间,延时任务没有 定时任务有执行周期,而延时任务在某事件触发后一段时间内执行,没有执行周期 定时任务一般执行的是批处理操作是多个任务,而延时任务一般是单个任务 下面,我们以判断订单是否超时为例,进行方案分析

分布式之延时任务方案解析

引言 在开发中,往往会遇到一些关于延时任务的需求.例如 生成订单30分钟未支付,则自动取消 生成订单60秒后,给用户发短信 对上述的任务,我们给一个专业的名字来形容,那就是延时任务.那么这里就会产生一个问题,这个延时任务和定时任务的区别究竟在哪里呢?一共有如下几点区别 定时任务有明确的触发时间,延时任务没有 定时任务有执行周期,而延时任务在某事件触发后一段时间内执行,没有执行周期 定时任务一般执行的是批处理操作是多个任务,而延时任务一般是单个任务 下面,我们以判断订单是否超时为例,进行方案分析

技术人员的发展之路

程序算法与人生选择 我用算法来类比如何做选择,说白了就是怎么去计算,但是并没有讲程序员可以发展的方向有哪些. 所以,就算是有这些所谓的方法论,我们可能对自己的发展还是会很纠结和无所事从,尤其是人到了30岁,这种彷徨和迷惑越来越重.虽然我之前也写过一篇<编程年龄和编程技能>的文章,但是还是有很多做技术的人对于自己能否在年纪大时还能去做技术感到没有信心.我猜测,这其中,最大的问题的是,目前从事技术工作的种种负面的经历(比如经常性的加班,被当成棋子或劳动力等等),让人完全看不到希望和前途,尤其是随着