机器学习——BP神经网络模型

一、什么是BP

BP（Back Propagation）网络是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系，而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法，通过反向传播来不断调整网络的权值和阈值，使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层（input）、隐层(hide
layer)和输出层(output layer)。

我们现在来分析下这些话：

“是一种按误差逆传播算法训练的多层前馈网络”

BP是后向传播的英文缩写，那么传播对象是什么？传播的目的是什么？传播的方式是后向，可这又是什么意思呢。

传播的对象是误差，传播的目的是得到所有层的估计误差，后向是说由后层误差推导前层误差：

即BP的思想可以总结为

利用输出后的误差来估计输出层的直接前导层的误差，再用这个误差估计更前一层的误差，如此一层一层的反传下去，就获得了所有其他各层的误差估计。

“BP神经网络模型拓扑结构包括输入层（input）、隐层(hide layer)和输出层(output layer)”

我们来看一个最简单的三层BP：

网络能学习和存贮大量的输入-输出模式映射关系，而无需事前揭示描述这种映射关系的数学方程。”

BP利用一种称为激活函数来描述层与层输出之间的关系，从而模拟各层神经元之间的交互反应。

激活函数必须满足处处可导的条件。那么比较常用的是一种称为S型函数的激活函数：

那么上面的函数为什么称为是S型函数呢：

我们来看它的形态和它导数的形态：

p.s. S型函数的导数：

神经网络的学习目的：

希望能够学习到一个模型，能够对输入输出一个我们期望的输出。

学习的方式：

在外界输入样本的刺激下不断改变网络的连接权值

学习的本质：

对各连接权值的动态调整

学习的核心：

权值调整规则，即在学习过程中网络中各神经元的连接权变化所依据的一定的调整规则。

二、有监督的BP模型训练过程

1. 思想

有监督的BP模型训练表示我们有一个训练集，它包括了： input X 和它被期望拥有的输出 output Y

所以对于当前的一个BP模型，我们能够获得它针对于训练集的误差

所以BP的核心思想就是：将输出误差以某种形式通过隐层向输入层逐层反传，这里的某种形式其实就是：

也就是一种 "信号的正向传播 ----> 误差的反向传播"的过程：

2.具体

想要了解更多，请扫描关注数据分析师Nieson的微信公众号！

时间： 2024-10-12 09:31:08

机器学习——BP神经网络模型的相关文章

BP神经网络模型与学习算法

一,什么是BP "BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一.BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程.它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小.BP神经网络模型拓扑结构包括输入层(input).隐层(hide layer)和输出层(output

机器学习之神经网络模型-上（Neural Networks: Representation）

在这篇文章中,我们一起来讨论一种叫作"神经网络"(Neural Network)的机器学习算法,这也是我硕士阶段的研究方向.我们将首先讨论神经网络的表层结构,在之后再具体讨论神经网络学习算法. 神经网络实际上是一个相对古老的算法,并且沉寂了一段时间,不过到了现在它又成为许多机器学习问题的首选技术. 1. Non-linear Hypotheses 之前我们已经介绍过线性回归和逻辑回归算法了,那为什么还要研究神经网络? 为了阐述研究神经网络算法的目的,我们首先来看几个机器学习问题作为例子

机器学习之神经网络模型-下（Neural Networks: Representation）

3. Model Representation I 1 神经网络是在模仿大脑中的神经元或者神经网络时发明的.因此,要解释如何表示模型假设,我们不妨先来看单个神经元在大脑中是什么样的. 我们的大脑中充满了如上图所示的这样的神经元,神经元是大脑中的细胞.其中有两点值得我们注意,一是神经元有像这样的细胞主体(Nucleus),二是神经元有一定数量的输入神经和输出神经.这些输入神经叫做树突(Dendrite),可以把它们想象成输入电线,它们接收来自其他神经元的信息.神经元的输出神经叫做轴突(Axon),

机器学习技法-神经网路（NNet）

课程地址:https://class.coursera.org/ntumltwo-002 1.神经网络(NNet)的动机? 单个感知机(perceptron)模型简单,能力有限,只能线性分割.通过组合感知机模型很容易实现逻辑与.或.非,以及凸集合,但不能实现异或运算,能力有限.多层次的感知机(perceptrons)模型,不仅能实现异或,功能更为强大. 2.神经网络的输出,可以是分类.回归.逻辑回归的任意一种. 3.神经网络中神经元的激活函数(转换函数),课件中介绍的tanh(s) 4.最终的神

【数据挖掘技术】神经网络模型

神经网络模型一.神经网络模型对网络模型的研究始于20世纪40年代,作为一门交叉学科,它是人类基于对其大脑神经认识的基础上,人工构造实现某种功能的网络模型.经过将近70年的发展,神经网络模型已成为机器学习的典型代表,它不依照任何概率分布,而是模仿人脑功能进行抽象运算.神经网络(Neutral Network)是通过数学算法来模仿人脑思维的,它是数据挖掘中机器学习的典型代表.神经网络是人脑的抽象计算模型,我们知道人脑中有数以百亿个神经元(人脑处理信息的微单元),这些神经元之间相互连接,是的人的大

基于tensorflow的MNIST手写字识别（一）--白话卷积神经网络模型

一.卷积神经网络模型知识要点卷积卷积 1.卷积 2.池化 3.全连接 4.梯度下降法 5.softmax 本次就是用最简单的方法给大家讲解这些概念,因为具体的各种论文网上都有,连推导都有,所以本文主要就是给大家做个铺垫,如有错误请指正,相互学习共同进步. 二.卷积神经网络讲解 2.1卷积神经网络作用大家应该知道大名鼎鼎的傅里叶变换,即一个波形,可以有不同的正弦函数和余弦函数进行叠加完成,卷积神经网络也是一样,可以认为一张图片是由各种不同特征的图片叠加而成的,所以它的作用是用来提取特定的特征,举

常用神经网络模型及其应用评述(转载)

神经网络是由大量处理单元(神经元)互相连接而成的网络,实际上ANN并不完全模拟了生物的神经系统,而是一种抽象.简化和模拟.神经网络的信息处理通过神经元的相互作用来实现,知识与信息的存贮表现在网络元件互连的分布式结构与联系,神经网络的学习和识别各神经元连接权系数的动态演化过程.实践中常用的基本神经网络模型有:感知器神经网络.线性神经网络.BP神经网络.径向基神经网络.自组织神经网络.反馈网络等.1.感知器神经网络: 是一个具有单层计算神经元的神经网络,网络的传递函数是线性阈值单元.原始的感知器神经

使用Tensorflow训练神经网络模型

最近正在入坑机器学习,前期以读代码为主.买了一本才云科技郑泽宇的书,叫做<Tensorflow,实战Google深度学习框架>,觉得很适合入门的小菜鸟,拿出来跟大家分享下. 下面是第一个完整的训练神经网络模型的代码,里面综合了作者和我在网上查到的其他人关于代码的解读.整理之后如下: 1 #-*-coding:UTF-8-*- 2 import tensorflow as tf 3 #通过numpy工具包生成模拟数据集 4 from numpy.random import RandomState

大数据金融数据分析GBDT模型、神经网络模型、违约预测模型视频教程

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程视频课程包含: 38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,Linux基础,Hadoop,Spark,Storm,Docker,Mapreduce,Kafka,Flume,OpenStack,Hiv

猜你喜欢

把握linux内核设计思想系列（未完待续......）

[版权声明:尊重原创,转载请保留出处:blog.csdn.net/shallnet,文章仅供学习交流,请勿用于商业用途] 把握linux内核设计思想(一):系统调用把握linux内核设计思想(二): ...

Python创建二维码通讯录

参考文档: Python二维码生成库qrcode安装和使用示例:http://www.jb51.net/article/58579.htm vCard格式参数详细说明:http://www.phpin ...

用Spring MVC开发简单的Web应用

这个例子是来自于Gary Mak等人写的Spring攻略(第二版)第八章Spring @MVC中的一个例子,在此以学习为目的进行记录. 问题:想用Spring MVC开发一个简单的Web应用, 学习这 ...

【RMAN备份】数据库备份

转载请注明地址. 备份片文件名通配符: %c 备份片的拷贝数 %D 位于该月中的第几天 (DD) %M 位于该年中的第几月 (MM) %F 一个基于DBID 唯一的名称,这个格式的形式为c-IIIII ...

SpringMVC配置文件dispatcherServlet-servlet.xml

<?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.sp ...

[Javascript] Call Stack

Every time when a function run it will be push into the call stack and put on the top, you can thin ...

Redis3.2.8配置参数及说明

bind 127.0.0.1# 绑定的主机地址,不设置默认将处理所有请求protected-mode yes# 是否开启保护模式,默认开启,要是配置里面没有指定bind和密码,开启该参数后,redis ...

2.3-docker网络-如何让外部网络访问容器资源

Docker 网络管理 - 外部访问容器 1.首先使用centos镜像新建一个容器,然后在该容器中安装httpd服务,并启动 2.再把该容器导成一个新的镜像(centos-httpd),然后再使用新镜 ...

css样式整理

字体属性:(font) 大小 {font-size: x-large;}(特大) xx-small;(极小) 一般中文用不到,只要用数值就可以,单位:PX.PD 样式 {font-style: obl ...

JSONP实例

JSONP实例 package sus.app; import java.io.IOException; import java.util.Map; import javax.servlet.http ...

跨控制器跳转view——RedirectToRoute和RedirectToAction

已知控制器AccountController.cs和HomeController.cs,如果从页面Account/Login直接跳转到Home/Index,可以利用RedirectToRoute和Re ...

java强引用，软引用，弱引用，虚引用

用了Java怎么长时间一直不知道原来Java还有四种引用类型,这个引用类型和我们平常说的可不一样.这里的引用类型不是指数据类型的一种,而是指Java中的引用所分的四种类型.他们代表了JVM回收内存的四 ...

mysql 5.7 修改root密码允许远程连接

1.修改root密码(其他用户类似) 试过网上看的一些在mysql数据库执行 update user set password='新密码' where user='root' 执行说找不到字段, ...

Android 中View的绘制机制源代码分析三

到眼下为止,measure过程已经解说完了,今天開始我们就来学习layout过程.只是在学习layout过程之前.大家有没有发现我换了编辑器,哈哈.最终下定决心从Html编辑器切换为markdown编 ...

接口性能测试方案白皮书 V1.0

一. 性能测试术语解释 1. 响应时间响应时间即从应用系统发出请求开始,到客户端接收到最后一个字节数据为止所消耗的时间.响应时间按软件的特点再可以细分,如对于一个 C/S 软件的响应时间可以细分为网 ...

SharePoint 2013实例1—构建三层服务器场9—配置搜索服务器

这节我们来配置搜索服务器,如下图标红处. 1.搜索架构首先,我们进入搜索管理,确认下现在的搜索服务器组件的构成情况. 点击默认的搜索应用程序在搜索管理中,发现应用服务器APP01承担了所有6个搜索 ...

剪贴板增强---Kawvin增强剪贴板_V2.0

#Persistent SetWorkingDir,%A_ScriptDir% ;设置工作目录 #MaxThreadsPerHotkey 5 ;最大热键数量 #NoEnv ;#Warn #Single ...

Python常用模块之五 subprocess

Python引入subprocess模块来管理子进程,以取代一些旧模块的方法:如 os.system.os.spawn*.os.popen*.popen2.*.commands.*不但可以调用外部的命 ...

Deep Learning学习之卷积神经网络（文字识别系统LeNet-5）

部分预备知识可以先看博文,统一了一些专业名词. 原文摘自,在此文中对原文增加了一些注释和修改,统一了与之前博文的专业名词说法,有助于理解. !!!如果读者发现一些数学符号后面有一些奇怪的竖线,那是CS ...

关于头文件是否参与编译的讨论

一.文章来由写项目的时候发现了这个问题,又是一个比较底层的问题,首先说明,这篇文章只是我根据查阅的资料和做的实验提出的一个讨论,并不一定就是正确答案.因为这个问题网上众说纷纭,我很欢迎大家参与这个讨 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.