ML 概念小记

一般地，我们可以把分类（或者回归）的问题分为两类：参数学习的形式和基于实例的学习形式。

参数学习的形式就是通过一堆训练数据，把相应模型的参数给学习出来，然后训练数据就没有用了，对于新的数据，用学习出来的参数即可以得到相应的结论；

而基于实例的学习（又叫基于内存的学习）则是在预测的时候也会使用训练数据，如KNN算法。而基于实例的学习一般就需要判定两个点之间的相似程度，一般就通过向量的内积来表达。从这里可以看出，核方法不是万能的，它一般只针对基于实例的学习。

—— http://blog.csdn.net/xianlingmao/article/details/7719122

时间： 2024-10-27 06:47:20

ML 概念小记的相关文章

ML概念

训练集(traning set/data):用来训练,产生模型的算法的数据集测试集(testing set/data):用来训练,产生模型的算法的数据集):用来专门进行测试已经学习好的模型或者算法的数据集.特征向量(feature/feature vector):属性集合,通常用一个向量来表示,附属于一个实例.标记(label):实例类别的标记(用模型测试完数据后得到的结果).正例(position example)反例(negative example) 分类(classification):

个人的工作总结（和工作规划）

写在前面: 结合我的工作经验,我对未来工作做出了一些规划.算是想法的总结,我希望能达到有效的沟通.请指正我哪里有不合适的.告诉我哪里能做,哪里不能做,哪里不足. 现在,我已经养成一个engineer思维,所以我可以教授如何像一个engineer一样思考. 思维方式: Engineer和scientist的思维方式,完全不同. Scientist:why Analyze:注重原理,从简入繁(从现象,原因,分析各种复杂的因素) Engineer:how Realize:注重实现.化繁为简(将原理用工

ML（1）--概念理解

机器是如何模拟人来学习的? 人: observations===>learning===>skill 人从出生开始经过大量的观察(也可能经过身边的的指导)进行学习然后得到相应的技能(比如小孩认车) 机器:data====>learning====>skill 机器从大量的数据里学习获得相应的技能对于机器来说skill:improve some performance measure 即:电脑从资料出发经过学习得到某种表现的增进. e.g stock data===>M

Spark ML下实现的多分类adaboost+naivebayes算法在文本分类上的应用

1. Naive Bayes算法朴素贝叶斯算法算是生成模型中一个最经典的分类算法之一了,常用的有Bernoulli和Multinomial两种.在文本分类上经常会用到这两种方法.在词袋模型中,对于一篇文档$d$中出现的词$w_0,w_1,...,w_n$, 这篇文章被分类为$c$的概率为$$p(c|w_0,w_1,...,w_n) = \frac{p(c,w_0,w_1,...,w_n)}{p(w_0,w_1,...,w_n)} = \frac{p(w_0,w_1,...,w_n|c)*p(c

第三章基本概念（第五部分：函数初步）

六. 函数初步无论在哪门语言,函数都是一个相当核心的概念.通过函数可以封装任意多的语句,刻意在任何地方调用执行.函数实质上是一个短小的脚本,需要反复做一件事时,可以利用函数避免重复键入过多重复的代码.良好的编程习惯要求,先定义函数,再使用它们.定义函数用法如下: function 函数名(参数){函数代码;} 比如封装以下代码: var beatles=["Joln","Paul","George","Ringo"]; fo

ML简史

原文地址:http://www.52ml.net/15427.html 图 1 机器学习时间线在科学技术刚刚萌芽的时候,科学家Blaise Pascal和Von Leibniz就想到了有朝一日能够实现人工智能.即让机器拥有像人一样的智能. 机器学习是AI中一条重要的发展线,在工业界和学术界都异常火爆.企业.大学都在投入大量的资源来做机器学习方面的研究.最近,机器学习在很多任务上都有了重大的进步,达到或者超越了人类的水平(例如,交通标志的识别[1],ML达到了98.98%,已超越了人类). 图1

机器学习(ML)中文视频教程

本节是李政軒Cheng-Hsuan Li的关于机器学习一些算法的中文视频教程.讲得很好不错,这里非常感谢他的分享:http://www.powercam.cc/chli.也贴到这里,和大家共同学习. Clustering Fuzzy C-Means 基本概念(第1部分) Fuzzy C-Means 基本概念(第2部分) Fuzzy C-Means 基本概念(第3部分) Fuzzy C-Means 迭代公式推導 Regression Linear Regression Models-1 Linea

算法小记

什么是计算机程序设计? 简单的说,它就是告诉计算机要做什么.计算机可以做很多事情,但是不太擅长自主思考,程序员需要像给小孩子喂饭一样告诉它具体的细节,并且使计算机能够理解的语言--算法. 算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制.也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出.如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题.不同的算法可能用不同的时间.空间或效率来完成同

ML(1): 入门理论

机器学习相关的文章太多,选取一篇本人认为最赞的,copy文章中部分经典供自己学习,摘抄至 http://www.cnblogs.com/subconscious/p/4107357.html#first 示例入门传统上如果我们想让计算机工作,我们给它一串指令,然后它遵照这个指令一步步执行下去.有因有果,非常明确.但这样的方式在机器学习中行不通.机器学习根本不接受你输入的指令,相反,它接受你输入的数据! 也就是说,机器学习是一种让计算机利用数据而不是指令来进行各种工作的方法.这听起来非常不可思