这一篇sigmoid和softmax的比较,讲的不错

文章:

http://blog.csdn.net/u014422406/article/details/52805924

sigmoid函数(也叫逻辑斯谛函数): 
 引用wiki百科的定义:

  A logistic function or logistic curve is a common “S” shape (sigmoid curve).

  其实逻辑斯谛函数也就是经常说的sigmoid函数,它的几何形状也就是一条sigmoid曲线。

  logistic曲线如下: 
  

同样,我们贴一下wiki百科对softmax函数的定义:

softmax is a generalization of logistic function that “squashes”(maps) a K-dimensional vector z of arbitrary real values to a K-dimensional vector σ(z) of real values in the range (0, 1) that add up to 1.

  这句话既表明了softmax函数与logistic函数的关系,也同时阐述了softmax函数的本质就是将一个K 
维的任意实数向量压缩(映射)成另一个K

维的实数向量,其中向量中的每个元素取值都介于(0,1)之间。

  softmax函数形式如下: 
  

总结:sigmoid将一个real value映射到(0,1)的区间(当然也可以是(-1,1)),这样可以用来做二分类。 
而softmax把一个k维的real value向量(a1,a2,a3,a4….)映射成一个(b1,b2,b3,b4….)其中bi是一个0-1的常数,然后可以根据bi的大小来进行多分类的任务,如取权重最大的一维。 
  

时间: 2024-10-06 22:34:59

这一篇sigmoid和softmax的比较,讲的不错的相关文章

对于分类问题的神经网络最后一层的函数:sigmoid、softmax与损失函数

对于分类问题的神经网络最后一层的函数做如下知识点总结: sigmoid和softmax一般用作神经网络的最后一层做分类函数(备注:sigmoid也用作中间层做激活函数): 对于类别数量大于2的分类问题,如果每个类别之间互斥,则选用softmax函数(例如:类别为牡丹花.玫瑰花.菊花),如果每个类别之间有交叉则选用与类别数量相等的sigmoid函数(例如:类别为小孩.大人.男人.女人,此处应该选用4个sigmoid函数): 神经网络最后一层的分类函数直接面临作损失函数的选择: softmax函数的

【深度学习】sigmoid与softmax

sigmoid与softmax sigmoid与softmax可以神经网络的输出单元. 原理 sigmoid 预测二值型变量$y$的值,定义如下: $$\hat{y}= \sigma( \omega^{T}h+b)=\frac{1}{1+exp{-( \omega^ {T}h+b)}}$$ 通常使用最大似然来学习,因为最大似然的代价函数是$-log(y|x)$,代价函数中的log抵消了sigmoid中的exp,这样的结果是只有当$\sigma$函数的自变量非常大的时候才会有饱和,也就是梯度变得非

转载:sigmoid和softmax总结

转自:http://blog.csdn.net/u014422406/article/details/52805924 sigmoid函数(也叫逻辑斯谛函数): 引用wiki百科的定义: A logistic function or logistic curve is a common "S" shape (sigmoid curve). 其实逻辑斯谛函数也就是经常说的sigmoid函数,它的几何形状也就是一条sigmoid曲线. logistic曲线如下: 同样,我们贴一下wiki百

sigmoid 和 soft-max总结

1)sigmoid函数(也叫逻辑斯谛函数):  引用wiki百科的定义: A logistic function or logistic curve is a common "S" shape (sigmoid curve). 其实逻辑斯谛函数也就是经常说的sigmoid函数,它的几何形状也就是一条sigmoid曲线. logistic曲线如下:  2)softmax函数的定义: softmax is a generalization of logistic function that

什么叫工业4.0,这篇接地气的文章终于讲懂了

笔者早年从事过工业自动化行业,后来去了几个城市,讲过<工业互联网与工业文明史>这门课,以至于很多人以为我很懂工业互联网(其实我也就是半桶水而已).今天早上有人问我,工业4.0到底是个啥,本来答应给他单独讲一遍,后来一想,不如整理下材料和思路,一块分享给大家,所以今天就跟大家谈谈这个神秘的工业4.0吧. 先声明,笔者只是个知识的搬运工,我说的不一定对,不过是看了很多材料后消化理解的结果而已.事实上,工业4.0就没有标准答案,连德国人自己都没有. 先看三个概念: 工业1.0 机械化,以蒸汽机为标志

什么叫工业4.0,这篇接地气的文章终于讲懂了(ZT)

原地址:https://www.cnblogs.com/namei/p/6110382.html 笔者早年从事过工业自动化行业,后来去了几个城市,讲过<工业互联网与工业文明史>这门课,以至于很多人以为我很懂工业互联网(其实我也就是半桶水而已).今天早上有人问我,工业4.0到底是个啥,本来答应给他单独讲一遍,后来一想,不如整理下材料和思路,一块分享给大家,所以今天就跟大家谈谈这个神秘的工业4.0吧. 先声明,笔者只是个知识的搬运工,我说的不一定对,不过是看了很多材料后消化理解的结果而已.事实上,

[质因数分解]UVa10791 Minimum Sum LCM

题目大意 输入整数n (1<=n<2^31),求至少两个正整数,使得它们的最小公倍数为n,且这些整数的和最小,输出最小的和. (LRJ小紫书P317页例题) 思考 看LRJ的分析没怎么看懂,随手搜了一篇题解.发现了一个讲的不错的,让我恍然大悟. 题解地址 首先假设我们知道了一系列数字a1,a2,a3……an,他们的LCM是n,那么什么时候他们是最优解呢,当他们两两互质的时候. 简单证明一下: 设两个正整数为a,b (a<=b) 其gcd(a,b)=n lcm(a,b)=m  sum =

图像处理与计算机视觉基础,经典以及最近发展

*************************************************************************************************************** 在这里,我特别声明:本文章的源作者是   杨晓冬  (个人邮箱:[email protected]).原文的链接是 http://www.iask.sina.com.cn/u/2252291285/ish.版权归 杨晓冬 朋友所有. 我非常感谢原作者辛勤地编写本文章,并愿意共

SpringMVC关于Date类型的时间根据格式显示页面上

最近和别人开发WEB项目,用的是springMVC,在开发过程中遇到了许多小问题,为了避免以后碰到类似的问题还是不会弄,就写了一篇博客. 今天遇到了如何把数据库中date类型的数据根据要求转换格式“yyyy-MM-dd”.网上看了些方法,我使用的是在实体类中进行注解. 这个是spring-context.jar中的 并且在相应的JSP中添加:<spring:eval expression="c.time"></spring:eval><br/> 注意