2.2 logistic回归损失函数（非常重要，深入理解）

上一节当中，为了能够训练logistic回归模型的参数w和b，需要定义一个成本函数
1. 使用logistic回归训练的成本函数
  2. 为了让模型通过学习来调整参数，要给出一个含有m和训练样本的训练集
  3. 很自然的，希望通过训练集找到参数w和b，来得到自己得输出
  4. 对训练集当中的值进行预测，将他写成y^（I）我们希望他会接近于训练集当中的y^（i）的数值
现在来看一下损失函数或者叫做误差函数
1. 他们可以用来衡量算法的运行情况
2. 可以定义损失函数为y^和y的差，或者他们差的平方的一半，结果表明你可能这样做，但是实际当中，大家都不会这么做，因为当你学习这些参数的时候，你会发现之后讨论的优化问题，会变成非凸的，最后会得到很多的局部最优解，梯度下降算法可能找不到最优的全局最优值，
3. 直观理解就是我们定义这个损失函数L，来衡量你的预测输出值y^和y的实际值有多接近，误差平方看起来是一个合理的选择，但是如果用这个的话，梯度下降法就不会很好用，
4. 在logistic回归中，我们会定义一个不同的损失函数，它起着于误差平方相似的作用，这会给我们一个凸的优化问题，他很容易去做优化，
5. 在logistic回归中，我们用的损失函数将会是下面这样的，（非常重要！）
  2. 直观的看一下为什么这个函数会起到作用，
    1. 记得如果我们使用误差平方越小越好
    2. 对于这个logistic回归的损失函数，同样的，我们也想让它尽可能的小，
  3. 为了更好的理解它能起到好的作用，来看两个例子
    1. 当y=1的时候，就是第一项L带个负号，
      1. 这就是说，当y=1的时候，你想让-log(y^)尽可能小（代表着误差尽可能的小），那么就需要y^足够大，但是因为y^是sigmoid函数得出来的，永远不会比1大，也就是说，如果y=1的时候，你想让y^，尽可能的大，但是它永远不会大于1，所以你要让y^接近1（从sigmoid函数的图像上看一下，采取什么样的措施才能够让y^接近于1呢？就是上一节分析的那样），
    2. 当y=0的时候，
      1. 在学习过程中，想让损失函数小一些，也就意味着你想要log(1-y^)够大，通过这一系列的推导，发现，损失函数让y^尽可能的小，再次，因为y^只能介于0和1之间，所以就是说，当y=0的时候，损失函数会让这些让y^尽可能的接近0，有很多函数都能够达到上面的效果，
  4. 如果y=1，我们尽可能的让y^很大，如果y=0，尽可能的让y^足够小，
    1. 给出解释为什么在logistic回归中，要使用这个形式的损失函数。
  5. 最后说一下
    1. 在单个训练样本中定义的，它衡量了在单个训练样本上的表现（个人理解也就是一个训练集中的每个训练样本），
下面定义一个成本函数
1. 它衡量的是在全体训练样本上的表现，这个成本函数J，根据之前得到的两个参数w和b，J(w,b)等于所有的训练样本的损失函数的和的平均数
2. y^是用一组特定的参数w和b，通过logistic回归算法得出的预测输出值，
3. 损失精度函数适用于单个训练样本，而成本函数，基于参数的总成本，所以在训练logistic回归模型的是时候，我们需要找到合适的参数w和b，让下面这里的成本函数尽可能的小，
这一节我们看到了logistic回归算法的过程，以及训练样本的损失函数，还有和参数相关的总体成本函数，结果表明，logistic回归可以被看作是一个非常小的神经网络，
下一节讲解，神经网络能够做什么，看看如何将logistic回归看做一个非常小得神经网络，

时间： 2024-08-02 02:39:23

2.2 logistic回归损失函数（非常重要，深入理解）的相关文章

2.9 logistic回归中的梯度下降法（非常重要，一定要重点理解）

怎么样计算偏导数来实现logistic回归的梯度下降法它的核心关键点是其中的几个重要公式用来实现logistic回归的梯度下降法接下来开始学习logistic回归的梯度下降法 logistic回归的公式现在只考虑单个样本的情况,关于该样本的损失函数定义如上面第三个公式,其中a是logistic回归的输出,y是样本的基本真值标签值, 下面写出该样本的偏导数流程图假设样本只有两个特征x1和x2 为了计算Z,我们需要输入参数w1和w2和b 因此在logistic回归中,我们要做的就是变换参数w

logistic回归与手写识别例子的实现

本文主要介绍logistic回归相关知识点和一个手写识别的例子实现一.logistic回归介绍: logistic回归算法很简单,这里简单介绍一下: 1.和线性回归做一个简单的对比下图就是一个简单的线性回归实例,简单一点就是一个线性方程表示 (就是用来描述自变量和因变量已经偏差的方程) 2.logistic回归可以看到下图,很难找到一条线性方程能将他们很好的分开.这里也需要用到logistic回归来处理了. logistic回归本质上是线性回归,只是在特征到结果的映射中加入了一层函数映射,

对线性回归，logistic回归和一般回归的认识

假设有一个房屋销售的数据如下:这个表类似于北京5环左右的房屋价钱,我们可以做出一个图,x轴是房屋的面积.y轴是房屋的售价,如下: 如果来了一个新的面积,假设在销售价钱的记录中没有的,我们怎么办呢? 我们可以用一条曲线去尽量准的拟合这些数据,然后如果有新的输入过来,我们可以在将曲线上这个点对应的值返回.如果用一条直线去拟合,可能是下面的样子:绿色的点就是我们想要预测的点. 首先给出一些概念和常用的符号. 房屋销售记录表:训练集(training set)或者训练数据(training data)

Logistic 回归

Logistic回归是目前最常用的一种分类算法.之前讨论了线性回归 http://www.cnblogs.com/futurehau/p/6105011.html,采用线性回归是不能解决或者说不能很好解决分类问题的,很直观的一个解释如下图所示,这里介绍Logistic回归. 一.Logistic 回归模型 1.1 目标函数: 1.2 ML准则推导代价函数似然函数: 对数似然函数及其求导: 1.3 代价函数: 在线性回归中,我们得到代价函数,但是在Logistic 回归中,由于h(x)是一个复杂

机器学习与数据挖掘-logistic回归及手写识别实例的实现

5 Logistic回归（一）

首次接触最优化算法.介绍几个最优化算法,并利用它们训练出一个非线性函数用于分类. 假设现在有一些数据点,我们利用一条直线对这些点进行拟合(该直线为最佳拟合直线),这个拟合过程称作回归. 利用Logistic回归进行分类思想:根据现有数据对分类边界线建立回归公式,以此进行分类. 这里的“回归”一词源于最佳拟合,表示找到最佳拟合参数.训练分类器的做法:寻找最佳拟合参数,使用的是最优化算法(梯度上升法.改进的随机梯度上升法). 5.1 基于Logistic回归和Sigmoid函数的分类 Logisti

机器学习实战——Logistic回归

回归概述(个人理解的总结) 回归是数学中的一种模拟离散数据点的数学模型的方法,拟合一个连续的函数从而可以对未知的离散数据点进行分类或预测.这种方法有一个统一的形式,给定n维特征的数据集合,对任意一个数据点Xi={x(1)i,x(2)i,...,x(n)i}的每个维度都有一个回归系数wi与之对应,整个模型就存在一个系数向量w={w1,w2...wn}.如果是系数向量w与特征Xi的线性组合,那么就是一个n空间下的超平面,如果对应分类问题,那么这个超平面就是分类器的决策平面(分类超平面).由于线性组合

机器学习之线性回归---logistic回归---softmax回归

1 摘要本报告是在学习斯坦福大学机器学习课程前四节加上配套的讲义后的总结与认识.前四节主要讲述了回归问题,回归属于有监督学习中的一种方法.该方法的核心思想是从连续型统计数据中得到数学模型,然后将该数学模型用于预测或者分类.该方法处理的数据可以是多维的. 讲义最初介绍了一个基本问题,然后引出了线性回归的解决方法,然后针对误差问题做了概率解释.之后介绍了logistic回归.最后上升到理论层次,提出了一般回归. 2 问题引入这个例子来自http://www.cnblogs.com/LeftNot

【转载】对线性回归，logistic回归和一般回归的认识

对线性回归,logistic回归和一般回归的认识 [转载时请注明来源]:http://www.cnblogs.com/jerrylead JerryLead 2011年2月27日作为一个机器学习初学者,认识有限,表述也多有错误,望大家多多批评指正. 1 摘要本报告是在学习斯坦福大学机器学习课程前四节加上配套的讲义后的总结与认识.前四节主要讲述了回归问题,回归属于有监督学习中的一种方法.该方法的核心思想是从连续型统计数据中得到数学模型,然后将该数学模型用于预测或者分类.该方法处理的数据可以是多