算法理论——PLA

全称

perceptron learning algrithm

用武之地

二值分类问题,资料线性可分

算法核心(以二维平面为例)

找到一条直线wTx=0,一边全为+1,另一边全为-1。找到了这条线(即,向量w)就得到了分类器。

如何找到这条线?

每次选取分类出错的样本点,迭代执行:wt+1T=wtT+yn(t)xn(t)  (t代表第t次迭代)

直观理解:改变分界线的方向,尽量在下一次预测的时候将当前预测出错的这个点出现在线的另一边。

我的问题

这里是不是默认原点就在分界线上,因为都是围绕原点进行旋转的

怎么证明PLA一定线性可分?

假设wf就是我们要的目标分界线的向量(下面简称为目标向量吧),有:

但现在,我们还没有达到迭代到目标向量,对于此时,我们的xn(t)和yn(t)有:

先记住上面这个结论,下面也要用到

现在想要知道,我们刚得到的wt+1T与wf接近程度,可以用两者的内积来表示。内积的值越大,从某种角度来说,越接近。

但是这不能排除长度对内积的影响。

因此,下面来看看是不是能够排除长度的影响

易知:

又有:

时间: 2024-10-05 03:11:32

算法理论——PLA的相关文章

张正友标定算法理论及算法实现

张正友标定算法理论及算法实现 理论基础 1999年,微软研究院的张正友提出了基于移动平面模板的相机标定方法.此方法是介于传统标定方法和自标定方法之间的一种方法,传统标定方法虽然精度高设备有较高的要求,其操作过程也比较繁琐,自标定方法的精度不高,张正友标定算法克服了这两者的缺点同时又兼备二者的优点,因此对办公.家庭的场合使用的桌面视觉系统(DVS)很适合. 设三维世界中坐标的点为:和二维相机平面坐标的点为: 为方便运算,模板被定义在世界坐标系中与X-y平面平行(即Z=0)的平面上,为模板平面上点的

普林斯顿公开课 算法1-5:算法理论

本节主要讲解的是算法的复杂度. 算法性能 算法的性能分为三种: 最佳情况:计算时间最短的情况 最差情况:计算时间最长的情况 平均情况:随机输入的期望开销 以二分查找为例 最佳情况是1,因为第一次就有可能找到需要找的整数. 最差情况是logN 平均情况是logN 算法复杂度 算法复杂度用于定义问题的难度,另外也有助于开发最优化的算法,算法复杂度可以通过分析最坏情况来减少输入数据对算法性能的影响. 为了简化问题难度的表示方法,算法复杂度减少了算法分析的细节,忽略常数系数. 最优算法 所谓的最佳算法就

k近邻算法理论(一)

时间 :2014.07.05 地点:基地 ----------------------------------------------------------------------------------- 一.简述 K近邻法(k-nearest neighbor,kNN)是一种基本分类与回归方法.k近邻的输入为实例的特征向量,对应特征空间中的点,输出为实例的类别.k近邻算法的基本思想是:给定训练数据集,实例类别已定,在对目标实例进行分类时,我们根据与目标实例k个最近邻居的训练实例的类别,通过

ng机器学习视频笔记(十一) ——K-均值算法理论

ng机器学习视频笔记(十一) --K-均值算法理论 (转载请附上本文链接--linhxx) 一.概述 K均值(K-Means)算法,是一种无监督学习(Unsupervised learning)算法,其核心是聚类(Clustering),即把一组输入,通过K均值算法进行分类,输出分类结果. 由于K均值算法是无监督学习算法,故这里输入的样本和之前不同了,输入的样本只有样本本身,没有对应的样本分类结果,即这里的输入的仅仅是{x(1),x(2),-x(m)},每个x没有对应的分类结果y(i),需要我们

感知机学习算法(PLA)

Perception Learning Algorithm, PLA 1.感知机 感知机是一种线性分类模型,属于判别模型. 感知机模型给出了由输入空间到输出空间的映射: f(X) = sign(WTX + b) 简单来说,就是找到一个分类超平面 WTX + b =0,将数据集中的正例和反例完全分开. 2.感知机学习算法(PLA) 感知机学习算法是为了找到 W 和 b  以确定分类超平面.为了减少符号,令 W = [b, W1, W2, ..., Wn], X = [1, X1, X2, ...,

机器学习资料《分布式机器学习算法理论与实践》+《白话机器学习算法》+《Python机器学习基础教程》

机器学习正在迅速改变我们的世界.我们几乎每天都会读到机器学习如何改变日常的生活. 人工智能和大数据时代,解决最有挑战性问题的主流方案是分布式机器学习! <分布式机器学习:算法.理论与实践>电子书资料全面介绍分布式机器学习的现状,深入分析其中的核心技术问题,并且讨论该领域未来的发展方向. 我认为第3章到第8章是核心,讲解分布式机器学习的框架及其各个功能,分别针对其中的数据与模型划分模块.单机优化模块.通信模块.数据与模型聚合模块加以介绍.最有用的是第9章,学习由分布式机器学习框架中不同选项所组合

算法理论(一)动态规划

一.前言 周末果然是堕落的根源,原谅我两天没刷题(PS:主要是因为周末搬家去了).上次在这个题的时候,看到网上很多方法都是用动态规划做的,但是本渣渣实在不知道动态规划具体是怎样的,于是就专门花了花时间去研究了一下.肯定没这么快弄懂,只能说是稍微入门,于是写下这篇文章,帮助自己也帮助别人理解动态规划. 二.理论部分 动态规划是什么呢? 百度百科上的定义是:动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法.用通俗

SSD算法结构 SSD算法理论 目标检测 宗师级全解

SingleShotMultiBoxDetector(SSD,单步多框目标检测) ———————————————————————————————————————————————— 前言:哈哈,有多少人被标题引诱来的?不过我确实把料下足了,想彻底了解SSD理论的朋友,请你沉下心来看,估计底子好的人要看半小时到一小时左右.这篇随笔,我写了三个小时多,SSD本身结构不复杂,奈何涉及的细节与知识范围有些多,这篇随笔的全部内容对于SSD来说,都缺之不可,耐心通读本篇,SSD的原理,你就能完全掌握了,写的我

Apriori 算法 理论

关联规则的基本模型-规则 关联规则的基本模型-置信度 关联规则的基本模型-支持度 关联规则基本概念 频繁项集举例 关联规则举例 Apriori的步骤 Apriori的重要性质 Apriori算法实例-产生频繁项集 Apriori算法实例-产生关联规则 Apriori算法思想总结 Apriori算法代码 由L(k-1)生成候选集Ck 从频繁项集中挖掘关联规则 由频繁项集产生关联规则--频繁项集性质 由频繁项集产生关联规则