【转载】在线学习（Online Learning）

在线学习（Online Learning）

原题目叫做The perception and large margin classifiers，其实探讨的是在线学习。这里将题目换了换。以前讨论的都是批量学习（batch learning），就是给了一堆样例后，在样例上学习出假设函数h。而在线学习就是要根据新来的样例，边学习，边给出结果。

假设样例按照到来的先后顺序依次定义为。X为样本特征，y为类别标签。我们的任务是到来一个样例x，给出其类别结果y的预测值，之后我们会看到y的真实值，然后根据真实值来重新调整模型参数，整个过程是重复迭代的过程，直到所有的样例完成。这么看来，我们也可以将原来用于批量学习的样例拿来作为在线学习的样例。在在线学习中我们主要关注在整个预测过程中预测错误的样例数。

拿二值分类来讲，我们用y=1表示正例，y=-1表示负例。回想在讨论支持向量机中提到的感知算法（perception algorithm）。我们的假设函数为

其中x是n维特征向量，是n+1维参数权重。函数g用来将计算结果映射到-1和1上。具体公式如下：

这个也是logistic回归中g的简化形式。

现在我们提出一个在线学习算法如下：

新来一个样例，我们先用从之前样例学习到的来得到样例的预测值y，如果（即预测正确），那么不改变，反之

也就是说，如果对于预测错误的样例，进行调整时只需加上（实际上为正例）或者减去（实际负例）样本特征x值即可。初始值为向量0。这里我们关心的是的符号，而不是它的具体值。调整方法非常简单。然而这个简单的调整方法还是很有效的，它的错误率不仅是有上界的，而且这个上界不依赖于样例数和特征维度。

下面定理阐述了错误率上界：

定理（Block and Novikoff）：

给定按照顺序到来的样例。假设对于所有的样例，也就是说特征向量长度有界为D。更进一步，假设存在一个单位长度向量且。也就是说对于y=1的正例，，反例，u能够有的间隔将正例和反例分开。那么感知算法的预测的错误样例数不超过。

根据前面对SVM的理解，这个定理就可以阐述为：如果训练样本线性可分，并且几何间距至少是，样例样本特征向量最长为D，那么感知算法错误数不会超过。这个定理是62年提出的，63年Vapnik提出SVM，可见提出也不是偶然的，感知算法也许是当时的热门。

下面主要讨论这个定理的证明：

感知算法只在样例预测错误时进行更新，定义是第k次预测错误时使用的样本特征权重，初始化为0向量。假设第k次预测错误发生在样例上，利用计算值时得到的结果不正确（也就是说，调换x和顺序主要是为了书写方便）。也就是说下面的公式成立：

根据感知算法的更新方法，我们有。这时候，两边都乘以u得到

两个向量做内积的时候，放在左边还是右边无所谓，转置符号标注正确即可。

这个式子是个递推公式，就像等差数列一样f(n+1)=f(n)+d。由此我们可得

因为初始为0。

下面我们利用前面推导出的和得到

也就是说的长度平方不会超过与D的平方和。

又是一个等差不等式，得到：

两边开根号得：

其中第二步可能有点迷惑，我们细想u是单位向量的话，

因此上面的不等式成立，最后得到：

也就是预测错误的数目不会超过样本特征向量x的最长长度与几何间隔的平方。实际上整个调整过程中就是x的线性组合。

整个感知算法应该是在线学习中最简单的一种了，目前发现online learning挺有用的，以后多多学习。

时间： 2024-08-28 21:57:21

【转载】在线学习（Online Learning）的相关文章

在线学习--online learning

在线学习 online learning Online learning并不是一种模型,而是模型的训练方法.能够根据线上反馈数据,实时快速的进行模型调优,使得模型能够及时反映线上的变化,提高线上预测的准确率. 在线模型的评估之--Mistake Bound 假设有一个模型完全预测正确,Mistake Bound表示的就是找到这个模型最多犯错的次数. 用Halving算法来解决这个问题,算法步骤如下: 所以犯错次数小于等于对模型集合数量求以2为底的对数. 在线模型的评估之--Regret 后悔度

【转载】浅谈深度学习(Deep Learning)的基本思想和方法

浅谈深度学习(Deep Learning)的基本思想和方法分类: 机器学习信息抽取 Deep Learning2013-01-07 22:18 25010人阅读评论(11) 收藏举报深度学习(Deep Learning),又叫Unsupervised Feature Learning或者Feature Learning,是目前非常热的一个研究主题. 本文将主要介绍Deep Learning的基本思想和常用的方法. 一. 什么是Deep Learning? 实际生活中,人们为了解决一个问

【转载】机器学习——深度学习(Deep Learning)

机器学习——深度学习(Deep Learning) 分类: Machine Learning2012-08-04 09:49 142028人阅读评论(70) 收藏举报 algorithmclassificationfeaturesfunctionhierarchy Deep Learning是机器学习中一个非常接近AI的领域,其动机在于建立.模拟人脑进行分析学习的神经网络,最近研究了机器学习中一些深度学习的相关知识,本文给出一些很有用的资料和心得. Key Words:有监督学习与无监督学习

在线学习和在线凸优化（online learning and online convex optimization）—FTL算法5

最自然的学习规则是使用任何在过去回合中损失最小的向量. 这与Consistent算法的精神相同,它在在线凸优化中通常被称为Follow-The-Leader,最小化累积损失. 对于任何t: 我们谈到了能最小化累计损失不能说明此算法在在线学习场景是有效,我们需要探究算法的 Regret bound: 采用归纳法证明: 例子1:Online Quadratic Optimization 例子2:Online Linear Optimization 未完,待续...... 下一节将讲述FTRL算法原

【深度学习Deep Learning】资料大全

转载:http://www.cnblogs.com/charlotte77/p/5485438.html 最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books Deep Learning66 by Yoshua Bengio, Ian Goodfellow and Aaron Courville Neural Networks and Deep Learning42 by Michael Nielsen Deep Learning27 by

各大公司广泛使用的在线学习算法FTRL详解

各大公司广泛使用的在线学习算法FTRL详解现在做在线学习和CTR常常会用到逻辑回归( Logistic Regression),而传统的批量(batch)算法无法有效地处理超大规模的数据集和在线数据流,google先后三年时间(2010年-2013年)从理论研究到实际工程化实现的FTRL(Follow-the-regularized-Leader)算法,在处理诸如逻辑回归之类的带非光滑正则化项(例如1范数,做模型复杂度控制和稀疏化)的凸优化问题上性能非常出色,据闻国内各大互联网公司都第一时间应

[转]在线学习java资料集合

原文链接: fromdev 翻译: ImportNew.com- 赖信涛译文链接: http://www.importnew.com/11910.html[ 转载请保留原文出处.译者和译文链接.] 本文由 ImportNew - 赖信涛翻译自 fromdev.欢迎加入Java小组.转载请参见文章末尾的要求. 你想学习Java吗?来对地方了!这篇文章将会介绍很多高质量的免费资源,包括网页.论坛.电子书和速查表. Java是一种面向对象的编程语言,拥有独立.多线程.安全.动态和健壮的特点.归功

【教育系统】《深度探讨》如何建设千万级网络教育在线学习支持系统？

1) 用户建设开放性学习环境,用户的统一授权.认证.用户容量成为关键问题,用户通过认证/授权服务管理用户,达到统一的管理,并通过后台负载均衡管理,实现访问用户分流.资源访问分流,实现大用户量的管理. 建设支持超过千万人访问的一站式远程学习支持系统平台. 2) 资源随着学习环境的建设和发展,资源的海量存储.分类细化已成为关键课题,系统通过虚拟化技术进行存储和相关运算,实现资源存储和调度,用以支撑不同学习过程和教学资源的存储隔离和应用共享. 3) 数据服务定义和完善接口和服务内容,搭建集成环境

机器学习(Machine Learning)&深度学习(Deep Learning)资料

机器学习(Machine Learning)&深度学习(Deep Learning)资料 <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.Deep Learning. <Deep Learning in Neural Networks: An Overview> 介绍:这是瑞士人工智能实验室Jurgen Schmidhuber写的最新版本

猜你喜欢

拦截404页面时tomcat抛出异常： org.apache.shiro.UnavailableSecurityManagerException

404页面中包含shiro标签,当访问404页面时,抛出异常: 原因:shiro拦截器配置缺少标红部分,缺少红色部分导致在serverlet在拦截404页面的时候没有经过shiro 从而使shir ...

【转】深入浅出 JavaScript 中的 this

Java 等面向对象的语言中,this 关键字的含义是明确且具体的,即指代当前对象.一般在编译期确定下来,或称为编译期绑定.而在 JavaScript 中,this 是动态绑定,或称为运行期绑定的,这 ...

【管理心得之二十七】管理者的开局

场景再现 ===================== Boss :王さん,你怎么搞的?刚刚接手这个部门才3个月,部门人员就走了30%,再有一年岂不是这个部门没有人了? 王さん :Bos ...

由HTTP500错误引出的问题案例

************************************************************* 案例一:资源引起的问题(实验虚拟机) ******************* ...

基于Bootstrap使用jQuery实现简单可编辑表格

editTable.js 提供编辑表格当前行.添加一行.删除当前行的操作,其中可以设置参数,如: operatePos 用于设置放置操作的列,从0开始,-1表示以最后一列作为放置操作的列:(这里的操作 ...

《TCP/IP详解卷1：协议》第19章 TCP的交互数据流-读书笔记

章节回顾: <TCP/IP详解卷1:协议>第1章概述-读书笔记 <TCP/IP详解卷1:协议>第2章链路层-读书笔记 <TCP/IP详解卷1:协议>第3章 IP ...

面向对象的五个基本原则

五个基本原则: 单一职责原则(Single-Resposibility Principle):一个类,最好只做一件事,只有一个引起它的变化.单一职责原则可以看做是低耦合.高内聚在面向对象原则上的引申, ...

hibernate的Many2One、Many2Many等的使用

本文简单讲述hibernate的Many2One.One2Many和Many2Many的单双向映射的annotation和xml的实现方式. 1.首先,先看下annotation的API文档 2.2. ...

2.5-docker配置桥接网络

Docker 网络管理 – 配置桥接网络(centos7) 为了使本地网络中的机器和Docker容器更方便的通信,我们经常会有将Docker容器配置到和主机同一网段的需求.这个需求其实很容易实现,我们 ...

mvn archetype:create报错解决办法

执行下列命令:mvn archetype:create -DgroupId=com.mycompany.app -DartifactId=my-app -X 会报错: 此时将archetype:cr ...

poj -- 3468

很明显用线段树节点类型 : typedef struct _NODE_{ int L,R; _NODE_* pLeft; _NODE_* pRight; LL nSum; ...

centos6.5（64bit）下编译hadoop-2.5.0

编译环境准备: 1.安装cmake: sudo wget http://www.cmake.org/files/v2.8/cmake-2.8.12.2.tar.gz #tar -zxvf cmake- ...

多态和虚函数

在类的定义中,前面有virtual关键字的成员函数就是虚函数.多态是通过虚函数来实现的. Class base{ Virtual int get(); }; Int base::get() { } V ...

unity, UGUI Text fadeIn

错误写法: Color color = m_text.GetComponent<Text> ().color; Color startColor = new Color (c ...

windows2008批量建立用户账号的方法

(1)新建一个文本文档,写上命令,完成后点击文件,选择文件,选择另存为, 类型选择所有文件,文件后缀名为bat格式.

UNIX网络编程卷1 server程序设计范式1 并发server，为每一个客户请求fork一个进程

本文为senlie原创.转载请保留此地址:http://blog.csdn.net/zhengsenlie 1.传统并发server调用 fork 派生一个子进程来处理每一个客户 2.传统并发serv ...

libUpnp缓冲区溢出、拒绝服务等漏洞分析

该漏洞存在于UPnP?设备的便携式SDK中,也叫做 libupnp.这个库是用来实现媒体播放(DLAN)或者NAT地址转换(UPnP IGD).智能手机上的应用程序可用这些功能播放媒体文件或者利用用户 ...

转载：reactor模式学习

最近又重新看了下netty背后的设计思想,接触到了reactor模型.发现以前虽然也看过reactor和proactor模型的介绍,但是真的是只了解了个皮毛. 再重新学习了一遍,有了更深刻的认识.但是 ...

Unity3D脚本：C＃计时类脚本

Unity3D脚本:C#计时类脚本 unity3D更多资源教程免费下载,群153442627using UnityEngine;using System.Collections;/// <su ...

IIS下配置SilverLight

在Windows 2003 IIS 6.0环境下在Silverlight中需要使用xap.XAML文件类型,如果您想在IIS服务器上使用Silverlight 4.0程序,所以必须在IIS中注册 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.