Machine Learning 学习笔记 (3) —— 回归问题深入：泊松回归与Softmax回归

本系列文章允许转载，转载请保留全文！

【总目录】http://www.cnblogs.com/tbcaaa8/p/4415055.html

1. 泊松回归 (Poisson Regression)

在生活中，经常会遇到一类问题需要对一段时间内某一小概率事件的发生次数建模，例如癌症、火灾等。

假设向量x表示引起这一事件发生的因素，向量θ表示因素的权重，则使用h_θ(x)=exp(θ^Tx)表示事件发生次数的期望。θ^Tx位于指数位置，意味着其每增加1个单位，将导至事件发生次数的期望值翻倍。

此时，因变量与自变量近似满足泊松分布，即：y⁽ⁱ⁾~π(h_θ(x⁽ⁱ⁾))。

下面求参数θ的极大似然估计。似然函数：

对数似然函数：

定义损失函数：

要使似然函数最大，只需使损失函数最小。使用损失函数的极小值代替最小值：

化简，有：

最后，使用梯度下降法迭代求解：

其中，为学习率。

2. Softmax回归 (Softmax Regression)

利用之前介绍的逻辑回归模型，我们已经可以解决二分类问题。下面，我们将二分类问题推广为k分类问题。

在逻辑回归中，因变量y∈{0,1}，分别对应两个分类；而在Softmax回归模型中，因变量y∈{1,2,...,k}，分别对应k个分类。Softmax回归假定因变量服从参数为Φ₁,...,Φ_k的多项分布，即y(i)~Mult(Φ₁,...,Φ_k)。其中：

参数Φ_k是冗余的，利用概率之和等于1的条件，可以得到：

同时定义：

容易证明，Φ具有如下性质：

尤其需要注意的是，上述性质对i=k的情况仍然成立，尽管推导过程并不相同。后续证明中将直接使用这些性质。

下面求参数θ的极大似然估计，似然函数：

其中，函数1{expression}定义如下：当expression为真时，函数值为1；否则为0。Φ的性质可以利用1{·}进一步化简。

对数似然函数：

定义损失函数：

要使似然函数最大，只需使损失函数最小。使用损失函数的极小值代替最小值：

可以将上式进一步整理为向量形式：

最后，使用梯度下降法迭代求解：

至此，本系列已经探讨了四个常用的回归模型，其中的泊松回归和Softmax回归初看并不容易理解。关于h_θ(x)的来历，以及不同模型中J(θ)相似的原因，将在后续文章中作出说明。

时间： 2025-01-09 08:12:46

Machine Learning 学习笔记 (3) —— 回归问题深入：泊松回归与Softmax回归的相关文章

Machine Learning 学习笔记

Machine Learning 学习笔记在海军陆战队服役超过 10 年后,我于去年 7 月份退役了.随后在 8 月份找到了一份赌场的工作做公关,到今年 2 月中旬的时候又被辞退了.到 5 月中旬的时候我在 DE 协会找到了一份临时的"初级用户体验工程师"工作,而到了 8 月底我则成了正式的"用户体验工程师". 当我丢掉赌场的那份工作时,我就在想公关这行可能真的不适合我.我想做一名程序员.于是我开始节衣缩食学习编程.家人对我的情况非常担心.从 2 月份到 5 月份的

Machine Learning 学习笔记 (4) —— 回归问题总结：广义线性模型

本系列文章允许转载,转载请保留全文! [请先阅读][说明&总目录]http://www.cnblogs.com/tbcaaa8/p/4415055.html 1. 指数分布族简介之前的文章分别介绍了因变量服从高斯分布.伯努利分布.泊松分布.多项分布时,与之对应的回归模型,本文章将阐释这些模型的共同点,并加以推广. 首先非正式地给出指数分布族的定义: 定义如果变量y的分布可以被表示为p(y;η)=b(y)exp(ηTT(y)-a(η))的形式(η为分布的参数),则称y服从指数分布族萌萌哒博主

Coursera Machine Learning 学习笔记（一）

之前就对Machine Learning很感兴趣,假期得闲看了Coursera Machine Learning 的全部课程,整理了笔记以便反复体会. I. Introduction (Week 1) - What is machine learning 对于机器学习的定义,并没有一个被一致认同的答案. Arthur Samuel (1959) 给出对机器学习的定义: 机器学习所研究的是赋予计算机在没有明确编程的情况下仍能学习的能力. Samuel设计了一个西洋棋游戏,他让程序自己跟自己下棋,并

[Python & Machine Learning] 学习笔记之scikit-learn机器学习库

1. scikit-learn介绍 scikit-learn是Python的一个开源机器学习模块,它建立在NumPy,SciPy和matplotlib模块之上.值得一提的是,scikit-learn最先是由David Cournapeau在2007年发起的一个Google Summer of Code项目,从那时起这个项目就已经拥有很多的贡献者了,而且该项目目前为止也是由一个志愿者团队在维护着. scikit-learn最大的特点就是,为用户提供各种机器学习算法接口,可以让用户简单.高效地进行数

Machine Learning 学习笔记 (1) —— 线性回归与逻辑回归

[总目录]http://www.cnblogs.com/tbcaaa8/p/4415055.html 1. 梯度下降法梯度下降法是一种用来寻找函数最小值的算法.算法的思想非常简单:每次沿与当前梯度方向相反的方向走一小步,并不断重复这一过程.举例如下: [例]使用梯度下降法,求的最小值. 第一步:求解迭代格式.根据“每次沿与当前梯度方向相反的方向走一小步”的思想,可知第二步:选择迭代的初始值.初始值一般可以随意选择,但恰当的初始值有助于提升收敛速度.本例中选择第三步:根据迭代格式和初始值进行

Coursera Machine Learning 学习笔记（二）

- Supervised Learning 对于监督学习我们先看一个例子,下图中表示的是一个房价预测的例子.图中横坐标表示房屋占地面积,纵坐标表示房屋交易价格.图中的每个叉则表示一个房屋实例. 现在,我们希望能够预测一个房屋占地面积为750平方英尺的房屋的交易价格是多少.简单的方法是根据这些数据点的分布,画出一条合适的直线,然后根据这条直线来预测.当然,在此房价预测例子中,一个二次函数更加适合已有数据的分布.因此,我们可能会更加希望使用这个二次函数的曲线来进行房价预测. 因此,我们称上述这样的学

machine learning学习笔记

看到Max Welling教授主页上有不少学习notes,收藏一下吧,其最近出版了一本书呢还,还没看过. http://www.ics.uci.edu/~welling/classnotes/classnotes.html Statistical Estimation [ps]- bayesian estimation- maximum a posteriori (MAP) estimation- maximum likelihood (ML) estimation- Bias/Variance

Machine Learning学习笔记(1)

1.机器学习可以做什么? 搜索引擎.垃圾邮件过滤.人脸识别等等,不仅用于人工智能领域,生物.医疗.机械等很多领域都有应用. 2.机器学习的定义 A computer program is said to learn from experience E with respect to some task T and some performance measure P,if its performance on T,as measured by P,improves with experience

Coursera Machine Learning 学习笔记（四）

II. Linear Regression with One Variable (Week 1) - Model representation 以之前预测房价的问题为例,假设我们回归问题的训练集(Training Set)如下所示: 我们用如下符号来描述回归问题中的量: - m 代表训练集中实例的数量 - x 代表特征/输入变量 - y 代表目标变量/输出变量 - (x,y) 代表训练集中的实例 - 代表第i个观察实例 - h 代表学习算法的解决方案或函数,也称为假设(hypothesi

猜你喜欢

linux 备份文件+sql

sql 1 2 3 rm -f /bak/bak.sql mysqldump --databases nl -uroot -p413121 > /bak/bak.sql curl http:// ...

2015 我的IT之路

转眼2015年就过去一半了,作为IT屌丝的我,感到仿徨又无奈,从事这个行业差不多有5年了,现在让我来说说我的心路历程. 2010年,从大学出来,就去上海了,弱小的心灵想见识下传说中的大上海,第一份工作 ...

vim-snipmate编写snippet的语法

vim-snipmate真的很好用,以前好多编写代码的问题得到完美的解决.还附带提升我对vim的理解和信心,在这里感谢一下作者.thank you. 1.现说一下我浓缩的重要语法. 1.定义是下面这样 ...

error while loading shared libraries: libluajit-5.1.so.2: cannot open shared 解决办法

一般我们在Linux下执行某些外部程序的时候可能会提示找不到共享库的错误, 比如: tmux: error while loading shared libraries: libevent-1.4.s ...

跟着实例学习java多线程5-初识volatile变量

同步机制可以保证原子操作和内存可见性,但是同步机制对变量的访问性能是我们不得不考虑的问题,java语言提供了一种弱同步机制,volatile变量. 它的原理大致是这样的,当把变量声明为volatile ...

2014考研数学一第二题

设函数$f(x)$具有2阶导数,$g(x)=f(0)(1-x)+f(1)$,则在$[0,1]$上 $(A)$当$f'(x)\ge 0$时,$f(x)\ge g(x);$ $(B)$当$f'(x)\ge ...

编程算法 - 数字在排序数组中出现的次数代码(C)

数字在排序数组中出现的次数代码(C) 本文地址: http://blog.csdn.net/caroline_wendy 题目: 统计一个数字在排序数组中出现的次数. 通过折半查找, 找到首次出现的 ...

快学Scala 第十一课（类继承）

类继承: class People { } class Emp extends People{ } 和Java一样,final的类不能被继承.final的字段和方法不能被override. 在Scal ...

matlab求导数

clc; %清屏 clear; %清除变量 close all; %关闭 syms x; %定义变量,多个变量间用空格分离 f(x) = x^3; %原函数 res = diff(f(x),x,1); ...

javascript循环结构练习

冒泡排序: for(var i=1;i<arr.length;i++){ for(var j=0;j<arr.length-i;j++){ if(arr[j]>arr[j+1]){ ...

构造与析构函数与=不能被继承，以及内部类的用法

不是所有的函数都能自动地从基类继承到派生类中的.构造函数和析构函数是用来处理对象的创建和析构的,它们只知道对在它们的特殊层次的对象做什么.所以,在整个层次中的所有的构造函数和析构函数都必须被调用,也就 ...

IFA与“色“俱进，三星“量子点+曲面”如何掀起新变革？

在显示技术领域中,色彩显示精度及色彩显示设备是最为重要的两大中心焦点.从早期的CRT球面显示器与位图显示状态阶段开始.到目前形成以曲面屏幕与量子点显示技术结合的行业趋势,是整个显示领域所经历的巨大发展 ...

七牛上传小工具-Go语言版本

运行环境: Mac os X and Linux 现在当前目录下创建qiniu.json文件: { "AK":"XXX" , "SK":&q ...

一个能将给定非负整数数组中的数字排列成最大数字的函数

最近在网上看到这样一个题目,自己琢磨了一下. java version "1.8.0_40" // 编写一个能将给定非负整数数组中的数字排列成最大数字的函数. // 例如,给定[5 ...

输入法评价

我用的是电脑原带的微软输入法一.用户界面: 首先界面简单清洁,页面上只在右下角有个输入法的标志,没有多余的东西,改变中英文只需按下shift件就能转换,操作简单二.记住用户选择: 因为我电脑上的输 ...

大概一年前听说了nosql,上网查了查,觉得自己的基础很差,还不到研究这些的时候(其实就是懒),现在工作两年了,基础依旧薄弱,觉得应该发愤图强学点儿什么了,所以下载了<nosql数据库入门> ...

android 上传文件（表单），表单填写格式分析

原文地址:http://blog.sina.com.cn/s/blog_68494364010116gk.html 在Android的客户端编程中(特别是SNS 类型的客户端),经常需要实现注册功能A ...

Java程序员必须掌握的8大排序算法

8种排序之间的关系: 1, 直接插入排序 (1)基本思想:在要排序的一组数中,假设前面(n-1)[n>=2] 个数已经是排好顺序的,现在要把第n个数插到前面的有序数中,使得这n个数也是排好顺 ...

关于xml作为模板的配置服务系统开发

最近在做一个后台配置系统,其实之前也接触过,所谓的配置系统就是指,将你的网站布局抽象成一个xml模板,里面包括你自定义的节点,然后将变化的部分作为配置项,通过服务将配置选项与模板组装成一个js(这个服 ...

JQuery - 点击，滚动回到顶部 / 底部刷新回到顶部

if ($(document).scrollTop() != 0) { //刷新之后,回到顶部 $('body,html').animate({ scrollTop: 0 }, 500); }

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.