2.1 二分分类

  1. 本周学习神经网络编程的基础知识
  2. 构建神经网络,有些技巧是非常重要
    1. 神经网络的计算过程中,通常有一个正向的过程(正向传播步骤),接着会有一个反向步骤(反向传播步骤),
    2. 为什么神经网络的计算可以分为前向传播和反向传播两个分开的过程?本周课程通过使用logistic回归来阐述,以便于能够更好的理解,

  1. logistic回归是一个用于二分分类的算法

    1. 比如有一个二分分类问题的例子,

      1. 假如有一张图像作为输入是这样的,你想输出识别此图的标签,如果是猫,输出1,如果不是,则输出0

        1. 使用y来表示输出的结果标签,
    2. 来看一张图片在计算机当中是如何保存的,
      1. 计算机保存一张图片,要保存三个独立的矩阵,分别对应图中的红绿蓝三个颜色通道

      2. 如果输入图片是64X64像素的,就会有三个64X64的矩阵,分别对应图中的红绿蓝三种像素的亮度,为了表示方便,这里使用了三个小的矩阵,他们是5X4的,而不是64X64的
      3. 要把这些像素亮度值,放进一个特征向量当中,就要把这些像素值都提出来,放入一个特征向量X
      4. 为了把这些像素值提取出来放入特征向量,就要像下面这样定义一个特征向量X,以便表示这张图片,我们把所有这些像素值都提取出来,
      5. 使用nx来表示输入的特征向量x的维度
  2. 在二分类问题中,目标是训练出一个分类器,它以图片的特征向量X作为输入,预测出的结果标签y 是1还是0,也就是预测图片当中是否有猫,
  3. 一些符号约定
    1. 用一对(x,y)来表示一个单独的样本,x是一个nx维度的特征向量,标签的值为0或者1,训练集由m个训练样本组成,m代表训练样本的个数,

来自为知笔记(Wiz)

时间: 2024-10-07 05:29:51

2.1 二分分类的相关文章

二分分类中的logistic回归(regression)

最简单的基础 以图像为例,输入三个矩阵 红绿蓝,(64*64)*3的像素亮度值--->特征向量值---X[](64*64*3长度的一维向量)训练一个分类器输入为特征向量,输出为0,1代表是不是猫. Z=W^T*X+b---->b为R实数W->R*n_x,X->R*n_x,b->R y~=sigmoid(Z); 函数原型:sigmoid(z) = 1/(1+e^-z); Sigmoid函数是一个在生物学中常见的S型的函数,也称为S型生长曲线.[1]  在信息科学中,由于其单增以

OpenCV 之 支持向量机 (一)

统计学习方法是由 模型 + 策略 + 算法 构成的,构建一种统计学习方法 (例如,支持向量机),实际上就是具体去确定这三个要素. 1  支持向量机 支持向量机,简称 SVM (Support Vector Machine),是一种二分分类模型. 1) 基本模型 (model) 定义在特征空间上的,一种间隔 (margin) 最大的,线性分类器 (linear classifier) 2) 学习策略 (strategy) 使间隔最大化,可转化为求解凸二次规划的问题. 3) 学习算法 (algori

神经网络与深度学习

第二周 神经网络基础 2.1 二分分类 二分类:训练一个分类器,输入图片的特征向量x,预测结果的标签是0还是1 输入rgb图片尺寸为64*64,则输入特征向量(列向量)x为64*64*3 写法:m个训练样本 { (x(1)  ,y(1)), (x(2)  ,y(2)),...,(x(m)  ,y(m))}    (x,y) ,x属于Rnx  y属于{0,1} 一般将训练样本写成矩阵形式  X= [ x(1)     x(2)   x(m) ],每个样本特征向量为一个列向量nx * m

吴恩达机器学习3

二分分类 在一个二分分类的问题中间,结果总是离散输出的 比如:账户被黑客入侵(1)或者被盗(0):肿瘤是恶性的(1)还是良性的(0) 举个例子:是不是一个猫 目标是训练分类器,其中输入是一张图片所产生的特征向量,并且预测相应的标签是1还是0.在这种情况下,如果是1则表明是猫的图像,0则表示不是猫的图像 通常情况下,一张图片在电脑里面被存为三色素:红,绿和蓝.这三种颜色分别产生了三个矩阵,这三个矩阵拥有相同的大小.比如说,如果一张图片的大小为64*64,则三个矩阵的大小都是64*64 单元格中的值

用主题模型可视化分析911新闻(Python版)

本文由 伯乐在线 - 东狗 翻译,toolate 校稿.未经许可,禁止转载!英文出处:blog.dominodatalab.com.欢迎加入翻译小组. 本文介绍一个将911袭击及后续影响相关新闻文章的主题可视化的项目.我将介绍我的出发点,实现的技术细节和我对一些结果的思考. 简介 近代美国历史上再没有比911袭击影响更深远的事件了,它的影响在未来还会持续.从事件发生到现在,成千上万主题各异的文章付梓.我们怎样能利用数据科学的工具来探索这些主题,并且追踪它们随着时间的变化呢? 灵感 首先提出这个问

深度学习——超参数调试

1. 超参数的重要性级别:红->桔->紫 2. 如何调整参数 2.1 不要用grid来设置选择,因为不同参数的重要性不同 参数的选择范围从一个比较大的,到后来一个较小的 3. 为超参数选择合适的范围 3.1 uniform选择:如每层的节点数或网络层数.但并不是适用于所有超参数 3.2 scale的方法:比如选择学习率 如果在[0.0001,1]之间均匀选择,那么其实90%的数据是来自于[0.1,1],10%是来自[0.0001,0.1].所以,更合理的方法应该是 把[0.0001,1]转换成

深度学习的学习规划

万事开头难,经过一段时间的不断摸索,对深度学习也有所了解,先谈一谈我的学习路线吧! 在接触深度学习时,我完全不懂,恩,连python都不会,是一个完完全全的小白.最开始接触的时候,肯定是先学习一下python了,因为python很契合机器学习.网页上一直有句话叫做"人生苦短,来学python!",所以在入门前先学习一下python,如果你掌握一门编程语言的话,学Python很简单的,几天就ok了.然后就是需要了解神经网络了,需要去学习一下神经网络的基础,主要就是一些简单的算法,二分分类

吴恩达第一课第三周随笔

2.1 双层神经网络 图 1 图 2 图1是一个双层网络模型,实际上有三层,但是通常把输入层给忽略掉 称为输入层 注意层了,图1层有4个节点,图2只要1个, 所以图1 应该是一个(4,3)的矩阵,图2的是一个(1,3)的矩阵 ps:坚持将前一层的特征的权重做成一列放入矩阵中,所以每一个都是(3,1)的列向量 以前一直都是使用,np.dot(.T,X),这里也同样也沿用这个设定 所以,所以 是一个(4,3)矩阵 ,b是一个[4,1]的列向量,要生成矩阵节点在前 图1的正向传播算法: A,Z的横向表

神经网络和深度学习(一)神经网络基础

1.什么是神经网络? (1)房价预测模型Ⅰ: 神经网络:size x ——> O ——> price y ReLU函数(Rectified linear unit 修正线性单元):修改线性的函数,避免出现price未负数的情况. (2)房价预测模型Ⅱ: 即神经网络为: 2.Binary classification(二分分类): 以识别照片中的猫为例 ① 判定:若是猫,则 y = 1:若不是猫,则 y = 0. ② 图片规格:64*64,数字化表示:3个 64*64矩阵,分别表示Red Gre