吴恩达深度学习：2.1Logistic Regression逻辑回归及其损失函数

1.Logistic Regression是一个二元分类问题

　　(1)已知输入的特征向量x可能是一张图，你希望把它识别出来，这是不是猫图，你需要一个算法，可以给出预测值，更正式的y是一个概率，当输入特征x满足条件的时候y就是1。换句话说，如果x是图片，那就需要拿到一张猫图的概率。

　　(2)Sigmoid函数。这里就不多说了，关于sigmoid自己百度，很简单

　　(3)为了训练logistic回归模型的参数w和b，需要定义一个代价函数，接下来看看用logistic regression来训练的代价函数

　　

　　这里我们想通过训练集来找到参数w和b，来得到相应的输出

　　(4)接下来看看损失函数或者叫做误差函数，你可以将损失定义为(y真实值-y预测值)^2，但是在logistc回归中，大家都不这样做，因为当你学习参数的时候，你会发现后续讨论的优化问题会变成非凸的，最后会得到很多歌局部最优解。梯度下降算法可能找不到全局最优值，但是这个L值可以用来衡量你的预测输出值和真实值有多接近。所以在logistic函数中，我们用下面这个式子来进行损失函数的计算：

　　

　　对于这个损失函数，希望它尽可能的小

　　(4)ex1:当y=1的时候，，因为如果y=1的时候，第二项1-y就等于0，这就是说当y=1的时候，如果想让损失函数尽可能的小，这就意味着要尽可能的大，这就意味着要尽可能的大，但是sigmoid函数的输出永远不可能比1大，也就是说y=1时，让尽可能的大，但是它永远不可能大于1，所以要让接近1,

　　(5)ex2:当y=0的时候，损失函数的第一项等于0，因为y是0，所以这个第二项就是这个损失函数，所以损失函数变成，在学习过程中，想要损失函数小一些，这就意味着足够大

　　(6)成本函数：衡量的是在全体训练样本上的表现，我们要找到合适的w和b，让这里的成本函数J尽可能的小

原文地址：https://www.cnblogs.com/bigdata-stone/p/10301098.html

时间： 2024-10-08 23:58:39

吴恩达深度学习：2.1Logistic Regression逻辑回归及其损失函数的相关文章

吴恩达深度学习:1.2什么是神经网络

写在开头的话,本博客内容全部来自吴恩达深度学习教学课程,插图均来自吴恩达课件,在此说明来处,不喜勿喷! 一.什么是神经网络 1.我们从一个房屋加个预测的例子开始,假设有一个6间房间的数据集,已知房屋的面积单位是平方米或者平方英尺,已知房屋加个,现在想要找到一个函数,根据房屋面积来预测房屋价格的函数.如果有机器学习的只是,可以用线性回归得到这样的一条直线: 但是我们知道,价格永远不可能为一个负值,所以用一个直线的线性回归进行预测不太合适,我们可以在size轴将预测线弯曲一点,让他结束于0,我们所要

吴恩达-深度学习-课程笔记-8: 超参数调试、Batch正则化和softmax( Week 3 )

1 调试处理( tuning process ) 如下图所示,ng认为学习速率α是需要调试的最重要的超参数. 其次重要的是momentum算法的β参数(一般设为0.9),隐藏单元数和mini-batch的大小. 第三重要的是神经网络的层数和学习率衰减 adam算法的三个参数一般不调整,设定为0.9, 0.999, 10^-8. 注意这些直觉是ng的经验,ng自己说了,可能其它的深度学习研究者是不这么认为的. 那么如何选择参数呢?下面介绍两个策略,随机搜索和精细搜索. 早一代的机器学习算法中,如下

吴恩达-深度学习-课程笔记-6: 深度学习的实用层面( Week 1 )

1 训练/验证/测试集( Train/Dev/test sets ) 构建神经网络的时候有些参数需要选择,比如层数,单元数,学习率,激活函数.这些参数可以通过在验证集上的表现好坏来进行选择. 前几年机器学习普遍的做法: 把数据分成60%训练集,20%验证集,20%测试集.如果有指明的测试集,那就用把数据分成70%训练集,30%验证集. 现在数据量大了,那么验证集和数据集的比例会变小.比如我们有100w的数据,取1w条数据来评估就可以了,取1w做验证集,1w做测试集,剩下的用来训练,即98%的训练

吴恩达-深度学习-课程笔记-7: 优化算法( Week 2 )

1 Mini-batch梯度下降在做梯度下降的时候,不选取训练集的所有样本计算损失函数,而是切分成很多个相等的部分,每个部分称为一个mini-batch,我们对一个mini-batch的数据计算代价,做完梯度下降,再对下一个mini-batch做梯度下降.比如500w个数据,一个mini-batch设为1000的话,我们就做5000次梯度下降(5000个mini-batch,每个mini-batch样本数为1000,总共500w个样本). 对于batch梯度下降(每次计算所有的样本),随着迭代

吴恩达深度学习笔记+作业 (一)

1.1.2 Building basic functions with numpy 1.1.2.2 numpy.exp, sigmoid, sigmoid gradient import numpy as np def sigmoid(x): s = 1/(1+np.exp(-x)) return s # 设sigmoid为s, s' = s*(1-s) def sigmoid_derivative(x): s = 1/(1+np.exp(-x)) ds = s*(1-s) return ds

吴恩达深度学习专项课程3学习笔记/week1/Setting up ML Application

应用ML是一个高度迭代的过程 Idea->Code->Experment->... 去不断地调整超参数. Train/Dev/Test sets 通常将数据集划分为Train/Dev/Test集. Training set: 用于模型的训练 Hold-out cross validation set/Developmet set: 用于测试,调整模型超参数 Test set: 用于最终评估以前的ML问题:数据规模在w级,通常70/30划分Train/Test集或者60/20/20比例划

吴恩达深度学习课程第二课-改善深层神经网络

第一周深度学习的实用层面 1.1 训练,配置,测试训练集学习完如何构建神经网络,接下来学习如何高效运行神经网络数据集划分: train,dev,test: 在train中训练模型,利用dev选择最佳模型,利用test测试最终模型 1.2 偏差Bias,方差Variance 欠拟合(高偏差),过拟合(高方差) 1.3 处理欠拟合,过拟合方案 1.4 正则化Regularization 原文地址:https://www.cnblogs.com/nrocky/p/12114269.html

吴恩达深度学习课程第一课 — 神经网络与深度学习 — 第一周练习

课程一 - 神经网络和深度学习第一周 - 深度学习简介第 1 题 “人工智能是新电力”这个比喻指的是什么? A.人工智能为我们的家庭和办公室的个人设备供电,类似于电力. B.通过“智能电网”,人工智能正在传递新一波的电力. C.人工智能在计算机上运行,因此由电力驱动,但它让计算机做以前不可能做的事情. D.与100年前开始的电力类似,人工智能正在改变多个行业. 第 2 题以下哪些是最近深度学习开始崛起的原因?(选2个答案) A.我们拥有了更多的计算能力 B.神经网络是一个崭新的领域. C.

吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（二）

经典网络 LeNet-5 AlexNet VGG Ng介绍了上述三个在计算机视觉中的经典网络.网络深度逐渐增加,训练的参数数量也骤增.AlexNet大约6000万参数,VGG大约上亿参数. 从中我们可以学习到: 随着网络深度增加,模型的效果能够提升. 另外,VGG网络虽然很深,但是其结构比较规整.每经过一次池化层(过滤器大小为2,步长为2),图像的长度和宽度折半:每经过一次卷积层,输出数据的channel数量加倍,即卷积层中过滤器(filter)的数量. 残差网络(ResNet) 由于存在梯度消

猜你喜欢

iOS账号续费及证书更新流程

开发者账号会员快到期的时候,苹果会发送给开发者账号的注册邮箱一封邮件,提示用户账号快到期了,及时续费,一般是提前一个月提示用户续费.下面开始介绍续费流程; 1.登录开发者账号后,网页上面会有账号过期黄 ...

Linux内核编程：从hello world 开始-(1)_C文件编写

/* *File : test.c *Author : DavidLin *Date : 2014-12-07pm *Email : [email protected] or [email prote ...

微信公众号开发java框架：wx4j（入门篇）

导航入门 http://www.cnblogs.com/2333/p/6617819.html WxServlet介绍 MaterialUtils 素材工具类使用说明 http://www.cnbl ...

一些阿里云服务器的使用

记录的一些使用阿里云搭建环境的blog,备用. 1.在阿里云服务器上快速搭建JavaWeb环境JDKtomcatmysql 2.基于阿里云服务器搭建SVN服务器 3.阿里云Ubuntu系统搭建SVN服 ...

流体力学发展史（转）

流体力学发展简史流体力学是力学的一个分支,它主要研究流体本身的静止状态和运动状态,以及流体和固体界壁间有相对运动时的相互作用和流动的规律. 流体力学中研究得最多的流体是水和空气.它的主要基础 ...

java中结合struts2自定义标签的使用

java中结合struts2自定义标签的使用一.建立一个继承于SimpleTagSupport类实现它的doTag方法 1 package com.xiangshang.tag; 2 3 impor ...

mysql 命令行增删改查

1.mysql数据库的连接与关闭连接数据库: mysql -h 服务器主机地址 -u 用户名 -p密码关闭连接: 在任何时候输入exit或quit 2.创建新用户并授权 grant 权限 on 数 ...

[CareerCup] 10.6 Find Duplicate URLs 找重复的URL链接

10.6 You have 10 billion URLs. How do you detect the duplicate documents? In this case, assume that ...

谈谈javascript语法里一些难点问题（二）

3) 作用域链相关的问题作用域链是javascript语言里非常红的概念,很多学习和使用javascript语言的程序员都知道作用域链是理解javascript里很重要的一些概念的关键,这些概 ...

Django卸载

1.删除C:\Python34\Lib\site-packages路径下的相关文件夹 2.

搞好信号处理的一个前提

一个众所周之的事实是,信号处理几乎就是一个框,什么内容都可以往里装.人类感知世界的两种最常用的方式:用耳朵听,用眼睛看,所谓是“听其言,察其行”.对应到两种重要的信号:语音信号和图像信号.在语音信号和 ...

ACL的综合应用案例

在上一篇,介绍了ACL的原理与基本配置,举例说明了标准ACL.扩展ACL.命名ACL的配置案例,下面介绍综合应用ACL的案例. ACL的原理与基本配置的链接:http://yangshufan.blo ...

SPOJ SUBLEX 求第k小子串

题目大意: 对于一个给定字符串,找到其所有不同的子串中排第k小的子串先构建后缀自动机,然后我们可以将整个后缀自动机看做是一个DAG图,那么我们先进行拓扑排序得到 *b[N] 对于每个节点记录一个sc ...

计算机经典书籍整理

计算机程序的构造和解释(Structures and Interpretations of Computer Programs) 代码大全2(Code Complete 2) 程序员的修炼之道(Pra ...

DB2中如何实现正则表达式

正则表达式是什么? 正则表达式用于查找和替换字符串中的模式.正则表达式是用某种语法定义的,正则表达式引擎采用这种语法并将它与字符串进行比较.引擎返回字符串是否与语法匹配的指示:也即,该字符串是否包含能 ...

(转)C++中extern “C”含义深层探索

(转)C++中extern "C"含义深层探索 1.引言 C++语言的创建初衷是"a better C",但是这并不意味着C++中类似C语言的全局变量和函数所 ...

馅控米艘幸oh11l0gj82sktk359

"咱们史莱克学院是大陆第一学院.这你应该知道.那是指的咱们史莱克学院的武魂系.可咱们魂导系却并非大陆第一."在帆羽的指点下,和老师仔细商量之后,霍雨浩就开始锻造适合自己的二级魂导器 ...

Modal视图弹出方式

Modal方式弹出页面: 1.Modal方式弹出页面在iOS中有很广泛的应用,比如UIImagePickerController等,Modal方式主要有以下几个作用: 检查登陆信息,Modal出登陆页 ...

sql复杂的子查询，横向合并结果集

第一个查询的结果集 select * from( select c.msName,a.msId,c.msPrice, c.msPrice*COUNT(a.msId) as totalMoney,sum ...

[水煮 ASP.NET Web API2 方法论]（12-1）创建 OData

问题怎样用在 Web API 中创建 OData 服务. 解决方案对于我们来说,在 Web API 中使用 OData最简单的方式就是使用 ASP.NET 模板来创建Odata Controlle ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.