感知机1 -- 感知机模型

声明:

1,本篇为个人对《2012.李航.统计学习方法.pdf》的学习总结,不得用作商用。欢迎转载。但请注明出处(即:本帖地址)。

2,因为本人在学习初始时有非常多数学知识都已忘记,因此为了弄懂当中的内容查阅了非常多资料。所以里面应该会有引用其它帖子的小部分内容。假设原作者看到能够私信我。我会将您的帖子的地址付到以下。

3,假设有内容错误或不准确欢迎大家指正。

4。假设能帮到你,那真是太好了。

定义

感知机模型说白了就是推断“属于规定类?还是不属于规定类”的模型。

其函数为:

F(x)= sign(w·x + b)

w、b :感知机模型的參数

w∈Rn :权值/权值向量

b∈R :偏置

w·x :w和x的内积

Sign :符号函数

感知机为一种线性分类模型,属于一宗判别模型

感知机的几何解释

首先。其线性方程为w·x + b = 0,于是例如以下图所看到的:

若该线性方程相应特征空间Rn中的一个超平面S,则w为该超平面的法向量,b为超平面的截距,该超平面将Rn分成正负两类。于是该超平面也被称为分离超平面

第一次总结

综上所述。感知机预測就是通过学习得到的感知机模型,给出新输入实力相应的输出类别。

线性可不可分

对数据集 T={(x1,y1),(x2,y2),...,(xn,yn)},当中x1∈Rn。yi={+1,-1}, i=1, 2, ...,n,若存在一超平面S:

w·x + b = 0

可将数据集的正实例点和负实例点全然正确的划分到超平面的两側。即:

对全部的yi = +1的实例i,有w·xi+ b > 0

对全部的yi = -1的实例i,有w·xi+ b < 0

则称数据集T为线性可分数据集,反之。称其为线性不可分数据集

感知机学习策略

于是。其学习策略就是找出一个可将数据集全然正确分离的超平面:

w·x + b = 0

话句话说。就是确定w和b这两个參数

而为了确定这两个參数,我们需了解下“损失函数”。

损失函数

我们规定,损失函数为误分类点到超平面S的总距离。

于是,我们先写出输入空间Rn中任一点x0到超平面S的距离:

|w·x + b| / ||w||

这里||w||为w的L2范数。

对于误分类的数据(xi,yi)来说:

-yi(wxi + b) > 0

由于。对于误分类的数据:

w·x + b > 0 时,yi = -1

w·x + b < 0 时。yi = +1

于是

∵误分类点xi到超平面S的距离为:

-yi(wxi + b) / ||w||

∴ 对于误分类点集合M。全部误分类点到S的总距离为:

∴若不考虑1/||w|||,就得到了感知机学习模型的损失函数

最后,损失函数定义为:

对给定数据集 T={(x1,y1),(x2,y2),...,(xn,yn)},当中x1∈Rn,yi={+1,-1}, i=1, 2, ...,n

感知机sign(w·x + b)学习的损失函数定义为:

L(w,b) = -yi(w·xi + b)

当中。M为误分类点的集合。

第二次总结(关于损失函数)

1,  损失函数L(w, b) 是非负的

2,  若无误分类点,则损失函数为0

而随着误分类点的降低。损失函数的值也会降低

3,  一个特定的样本的损失函数:

在误分类时为參数w,b 的线性函数,在正确分类时为0

4,  于是。对给定训练数据T。损失函数L(w, b)为:w,b的连续可导函数

感知机学习算法的最优化方法

感知机学习算法的最优化的方法为:随机梯度下降算法。

(类似的还有个:最小二乘法)

感知机学习算法的原始形式

现已知,对于误分类点的几何,损失函数为:

L(w,b) = -yi(w·xi + b)

于是乎,我们的目的就是求L(w, b)的极小值,而这里,我们选择随机梯度下降算法来求此极小值。

以下请转到“随机梯度下降算法”的总结。

时间: 2024-10-14 10:26:40

感知机1 -- 感知机模型的相关文章

使用感知机训练加法模型

感知机此处不介绍,这里只是简单的做了一个使用感知机思路,训练一个y=a+b计算模型. 1 # -*-coding:utf-8-*- 2 '@author: xijun.gong' 3 import numpy as np 4 import random 5 import math 6 7 8 class Perceptron: 9 def __init__(self, learnRate, maxIter, bit_len): 10 """ 11 :param bit_len

python实现感知机线性分类模型

前言 感知器是分类的线性分类模型,其中输入为实例的特征向量,输出为实例的类别,取+1或-1的值作为正类或负类.感知器对应于输入空间中对输入特征进行分类的超平面,属于判别模型. 通过梯度下降使误分类的损失函数最小化,得到了感知器模型. 本节为大家介绍实现感知机实现的具体原理代码: 学习从来不是一个人的事情,要有个相互监督的伙伴,需要学习python或者有兴趣学习python的伙伴可以私信回复QQ:1354124729或微信:ff186345,一起学习哦!!!   O(∩_∩)O 运行结果如图所示:

感知机模型

感知机(perceptron)是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值.感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型.感知机旨在求出将训练数据进行线性划分的分离超平面.为此,导入基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,求得感知机模型. 感知机模型 定义1(感知机) 假设输入空间(特征空间)是,输出空间是.输入表示实例的特征向量,对应于输入空间(特征空间)的点,输出表示实例的类别.由输入空间到输出空间

【机器学习基础】从感知机模型说起

感知机(perceptron) 感知器(perceptron)1957年由Rosenblatt提出,是神经网络与支持向量机的基础.感知器是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值.感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型.感知机学习旨在求出将训练数据进行线性划分的分离超平面. 分离超平面分类法 分离超平面进行分类的过程是构造线性判定边界,试图显示地.尽可能好地将数据分到不同的类. 超平面分离定理 超平面分离定理是应

【城北徐公之机器学习】感知机模型

一.什么是感知机? 感知机最早由计算科学家Rosenblatt在1958年提出,他是一种单层(注意,输入层并不计算在内)神经网络.如图为一个二元输入的感知机模型. 其中x1,x2为输入,b为偏置,激活函数被称为符号函数(sign function),我们将激活函数的输出记为,其函数表达式及图像如下所示. 二.感知机可以用来干什么? 感知机可以用来处理线性可分类问题,线性可不可分简单来说,就是可不可以用一条直线把图上两类点划分开.如第二张图所示,无论怎么画直线都无法将两类点分区开. 线性可分 线性

感知机PLA

感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1,-1.感知机学习旨在求出将训练数据进行线性划分的分离超平面.具体介绍如下: 感知机模型 感知机学习策略 感知机学习算法 1 感知机模型 输入空间(特征空间)是Rn输出空间是{+1,-1} 由输入空间到输出空间的函数 f(x)=sign(w.x+b),称为感知机.w为权值,b为偏置.感知器模型的假设空间是定义在特征空间的所有线性分类模型.想求得感知机模型,即需要求w,b. 2 感知机学习策略 假设训练数据集是线性可分

统计学习方法 笔记&lt;第二章 感知机&gt;

第二章 感知机 感觉感知机这东西还是很简单的,随便写点. 感知机(perceptron)是二分类的线性分类器. 输入x表示实例的特征向量,输出y为实例的类别,由如下函数表示: 其中w为权值(weight)或权值向量(weight vector),b表示偏置(bias),sign为符号函数,里面的东西大于0就是1,否则是-1. 感知机属于判别模型(直接寻找输入到输出的映射函数,不关心联合概率什么的). 感知机的解释:wx + b = 0 对应于特征空间中的一个超平面S(超平面这个东西在二维上表示为

《神经网络和深度学习》系列文章二:感知机

出处: Michael Nielsen的<Neural Network and Deep Leraning>,点击末尾“阅读原文”即可查看英文原文. 本节译者:哈工大SCIR硕士生 徐梓翔 (https://github.com/endyul) 声明:我们将在每周一,周四,周日定期连载该书的中文翻译,如需转载请联系[email protected],未经授权不得转载. “本文转载自[哈工大SCIR]微信公众号,转载已征得同意.” 使用神经网络识别手写数字 感知机 sigmoid神经元 神经网络

记一下机器学习笔记 Rosenblatt感知机

一入ML深似海啊- 这里主要是<神经网络与机器学习>(Neural Networks and Learning Machines,以下简称<神机>)的笔记,以及一些周志华的<机器学习>的内容,可能夹杂有自己的吐槽,以及自己用R语言随便撸的实现. 话说这个<神经网络与机器学习>还真是奇书,不知是作者风格还是翻译问题,一眼望去看不到几句人话(也许是水利狗看不懂),感觉我就是纯买来自虐的. 作为开始当然是最古老的机器学习算法之一,神经网络的板砖感知机,对应<