（原创）Stanford Machine Learning (by Andrew NG) --- (week 10) Large Scale Machine Learning & Application Example

本栏目来源于Andrew NG老师讲解的Machine
Learning课程，主要介绍大规模机器学习以及其应用。包括随机梯度下降法、维批量梯度下降法、梯度下降法的收敛、在线学习、map
reduce以及应用实例：photo OCR。课程地址为：https://www.coursera.org/course/ml

（一）大规模机器学习

从前面的课程我们知道，如果我们的系统是high
variance的，那么增加样本数会改善我们的系统，假设现在我们有100万个训练样本，可想而知，如果使用梯度下降法，那么每次迭代都要计算这100万训练集的误差，计算代价显然很大。那么有没有什么办法来解决呢？

随机梯度下降（Stochastic gradient descent）

之前的批量梯度下降法定义代价函数为所有训练样本的误差和：

对比在前面的梯度下降法，我们重新定义代价函数为一个单一训练样本的误差：

算法流程：

首先对训练集随机“洗牌”，让训练数据乱序；

每次迭代只计算单一误差，然后更新θ，这样不是每一步都是“正确”的方向，因此算法虽然会“走近”全局最小，但可能只是在最小值附近徘徊，如下图所示：

微批量梯度下降法（Mini‐batch gradient descent）

微批量梯度下降法介于批量梯度下降和随机梯度下降之间，每次迭代计算b个训练样本的误差。

PS：通常令b介于2-200。

随机梯度下降收敛(Stochastic gradient descent convergence)

在批量梯度下降中，我们可以通过绘制J与迭代次数的函数来判断是否收敛。但是在大规模机器学习中，计算代价过大。

在随机梯度下降中，每次迭代前都计算cost(θ,(x⁽ⁱ⁾,y⁽ⁱ⁾))，比如每进行1000次迭代，绘制cost(θ,(x⁽ⁱ⁾,y⁽ⁱ⁾))的平均值。

有时，我们会得到一个颠簸但不明显减少的图像（左下图），这样可以通过增加迭代间隔（比如2000次迭代计算平均）来使图像平缓；如果函数图仍然木有改善，则说明模型存在错误。

有时，我们会得到不断上升的图像（右下图），这样可以通过减小学习率α解决。

另外，我们也可以随迭代次数增加而减小学习率α，可用如下的算式：

这样在接近最小值点时，通过学习率，我们可以使算法收敛，如下图所示：

在线学习（online
learning）

假设我们经营一家物流公司，当用户询问从A地到B地的快递费用时，我们会给出报价，用户可能会接受（y=1）或拒绝（y=0）。现在我们要建立模型，来预测用户接受报价的可能性。

在online
learning中，许多网站都会有持续不断的用户流，在构建模型时，我们对单一实例进行学习，一旦该实例学习完了，便可以丢弃该数据。这样我们的模型可以很好适应并更新用户的倾向。

Map reduce 和
并行运算（data parallelism）

如果我们有多台计算机（或有一台多核的计算机），让每台计算机（或计算机的每个cpu）处理数据一个子集，然后再将计算结果求和，这样可以加速学习算法。计算流程如下所示：

例如，有400个训练样本和4台计算机，我们可以使用批量梯度下降法将数据分给这4台计算机：

（二）应用实例（photo OCR）

问题描述：photo
OCR的目标是从一张图像中识别文字。

算法步骤：

文字检测（Text detection）

字符切分（Character segmentation）

字符分类（Character classification）

其中每一项任务都由单独的团队负责，如下流程：

滑动窗口（Sliding
windows）

1.
通过滑动窗口可以从图像中抽取对象，比如要在下图中识别行人，可以选择之前训练得到的行人的图片尺寸来对该图进行剪裁，然后对切片进行识别，判断其是否是行人。

2.
下面进行文字分割，即将文字分割成单个字符，训练集是单个字符的图片和两个相连字符之间的图片。

3.
最后进行字符识别，可以通过我们之前的神经网络、逻辑回归算法来实现。

获取数据（Getting lots of data: Artificial
data synthesis）

对于high
variance问题，我们需要获取更多的训练数据，那么怎样在有限的条件下获取数据呢？

在OCR问题中，我们可以下载各种字体，然后搭配不同的背景从而创造一些训练数据；另外，我们也可以通过利用已有的数据，对其进行修改，如对字符图片进行变形、旋转、模糊等处理，从而得到大量训练数据。

下一步该怎样做？（Ceiling
analysis）

在机器学习的一些应用中，通常需要多个步骤来实现最终的预测，那么我们应该投入精力改善那一部分呢？

以OCR问题为例，流程如下：

我们可以选取每个流程的一部分，手动提供100%的正确输出结果，然后看看整体的提升效果。假设我们的模型整体效果为72%，若Text
detection输出结果正确，模型效果为89%；若另character
segmentation的输出结果正确，模型效果为90%（即只提高了1%）。这就意味着我们应该投入更大的精力在Text
detection上面。

练习

这是本课程的最后一节课，没有作业，下面就罗列一些练习题目吧：

（原创）Stanford Machine Learning (by Andrew NG) --- (week 10) Large
Scale Machine Learning & Application Example

时间： 2024-10-27 01:34:22

（原创）Stanford Machine Learning (by Andrew NG) --- (week 10) Large Scale Machine Learning & Application Example的相关文章

Week 10:Large Scale Machine Learning课后习题解答

大家好,我是Mac Jiang,今天和大家分享Coursera-Stanford University-Machine Learning-Week 10:Large Scale Machine Learning的课后习题解答.虽然我的答案通过了系统测试,但是我的分析不一定是正确的,如果各位博友发现错误或有更好的想法,请留言联系,谢谢.希望我的博客对您的学习有所帮助! 这单元,吴恩达老师主要讲了五个方面的内容: 1.随机梯度下降(Stochastic Gradient Descent),比较了随机

（原创）Stanford Machine Learning (by Andrew NG) --- (week 7) Support Vector Machines

本栏目内容来源于Andrew NG老师讲解的SVM部分,包括SVM的优化目标.最大判定边界.核函数.SVM使用方法.多分类问题等,Machine learning课程地址为:https://www.coursera.org/course/ml 大家对于支持向量机(SVM)可能会比较熟悉,是个强大且流行的算法,有时能解决一些复杂的非线性问题.我之前用过它的工具包libsvm来做情感分析的研究,感觉效果还不错.NG在进行SVM的讲解时也同样建议我们使用此类的工具来运用SVM. (一)优化目标(Opt

Andrew Ng机器学习公开课笔记–Reinforcement Learning and Control

网易公开课,第16课 notes,12 前面的supervised learning,对于一个指定的x可以明确告诉你,正确的y是什么但某些sequential decision making问题,比如下棋或直升机自动驾驶无法确切知道,下一步怎么样是正确的,因为这是一个连续和序列化的决策,比如直到最终直升机crash或下棋输了,你才知道之前的选择是不好的,但中间那么多步决策,到底是哪部分出了问题,可见这是个比较复杂的问题强化学习,基本思路就是,既然不知道怎样是正确的,那就随便try,然后根据

Machine Learning - XVII. Large Scale Machine Learning大规模机器学习 (Week 10)

http://blog.csdn.net/pipisorry/article/details/44904649 机器学习Machine Learning - Andrew NG courses学习笔记 Large Scale Machine Learning大规模机器学习 Learning With Large Datasets大数据集学习 Stochastic Gradient Descent随机梯度下降 Mini-Batch Gradient Descent迷你批处理梯度下降 Stochas

Lessons learned developing a practical large scale machine learning system

原文:http://googleresearch.blogspot.jp/2010/04/lessons-learned-developing-practical.html Lessons learned developing a practical large scale machine learning system Tuesday, April 06, 2010 Posted by Simon Tong, Google Research When faced with a hard pre

Stanford CS229 Machine Learning by Andrew Ng

CS229 Machine Learning Stanford Course by Andrew Ng Course material, problem set Matlab code written by me, my notes about video course: https://github.com/Yao-Yao/CS229-Machine-Learning Contents: supervised learning Lecture 1 application field, pre-

Large Scale Metric Learning from Equivalence Constraints (KISSME) CVPR 2012

In this paper, we raise important issues on scalability and the required degree of supervision of existing Mahalanobis metric learning methods. Often rather tedious optimization procedures are applied that become computationally intractable on a larg

Machine Learning Yearning - Andrew NG

链接(1~12章): https://gallery.mailchimp.com/dc3a7ef4d750c0abfc19202a3/files/Machine_Learning_Yearning_V0.5_01.pdf链接(第13章): https://gallery.mailchimp.com/dc3a7ef4d750c0abfc19202a3/files/Machine_Learning_Yearning_V0.5_02.pdf链接(第14章): https://gallery.mailc

神经网络作业: NN LEARNING Coursera Machine Learning（Andrew Ng） WEEK 5

在WEEK 5中,作业要求完成通过神经网络(NN)实现多分类的逻辑回归(MULTI-CLASS LOGISTIC REGRESSION)的监督学习(SUOERVISED LEARNING)来识别阿拉伯数字.作业主要目的是感受如何在NN中求代价函数(COST FUNCTION)和其假设函数中各个参量(THETA)的求导值(GRADIENT DERIVATIVE)(利用BACKPROPAGGATION). 难度不高,但问题是你要习惯使用MALAB的矩阵QAQ,作为一名蒟蒻,我已经狗带了.以下代核心部

猜你喜欢

本地上传图片预览

<!DOCTYPE html > <html > <head> <meta http-equiv="Content-Type" conte ...

[C++] Test question(1-16)

code: C++ don't have static class

新年伊始，.net菜鸟入院的第一篇随笔

学习.net有半年了,大二一年都是微软校园的负责人,但是因为根本没有系统的学习过编程的知识,所以一直都是活动负责人的身份,忙忙碌碌也没有什么收获,大三一狠心就退了,想能够踏踏实实的敲敲代码,手上的学习 ...

怎么停止LogCat的自动滚动？

============问题描述============ 真机调试时,想看看所有的调试消息,但是Logcat老是自动滚动,就是有新的调试消息时,就会自动向上滚动,把我现在看的滚没了,真是不胜其烦,但是 ...

第七章读书笔记

LED驱动实现原理是Linux驱动与本机的I/O内存进行交互,连接到主机的硬件在主机内存的映射. 编写驱动程序,先创建led驱动的设备文件: 创建LED驱动的设备文件: 1.使用cdev_init函数 ...

提取需要国际化的字符串到messages.pot 文件 pybabel extract -F babel.cfg -o messages.pot . 初使化翻译目录 pybabel init -i m ...

常用服务器模型(转载)

1) 迭代性服务器迭代性服务器,在开源社区的代表之作是Apache Web服务器.该模型中,存在唯一的侦听进程,侦听进程accept新的链接之后,通过fork的方式,派生出一个新的进程来为这个请 ...

HDU2647

第一道逆拓扑纪念一下... #include<iostream> #include<cstdio> #include<cstring> #include<cm ...

[转载]无线充电器三种经典振荡电路图分析

典型震荡电路基本原理: 状态一:Q1导通,Q1的集电极电压为接近0V,C1由流经R2及R1的电流放电,由于电容C1提供反电压,使得Q2截止,C2经由R3及R4放电,输出电压为高(但因C2经由R4放电的 ...

gulp学习笔记（一）

gulp 是基于 Nodejs 的自动任务运行器,能自动化地完成javascript/coffee/sass/less/html/image/css等文件的的测试.检查.合并.压缩.格式化.浏览器自动 ...

【转】测试人员的职业规划 --整理标注

不同类型的软件公司,对测试工作的重视程度也有很大不同.建议测试人员选择一些业务持续发展的公司.做项目东一榔头西一棒的公司,是不需要高质量的测试的,他们需要的是尽快把软件交出去,却无法静下心来思考,怎么 ...

[jbdj]SpringMVC框架(2)加载自定义目录下的springmvc.xml配置文件

自己定义文件目录,文件名称无疑是件快乐的事情! 如果springmvc.xml配置文件放在src目录下,web.xml代码如下: <?xml version="1.0" en ...

ZzuliOJ 1877 蛤玮打扫教室（线段树）

题目链接:http://acm.zzuli.edu.cn/zzuliacm/problem.php?id=1877 #include "algorithm" #include &q ...

记录部件的业务表条件

大部分时间 ,我们记录部件是用于新增修改数据,带了ID的条件,但是有些时候,新增和修改分开了,就要注意条件了.今天在检查一个窗体时遇到一个问题,发现记录部件的业务表如下: 大家发现问题了吗?显然,记录 ...

排列和组合

排列和组合在我们高中的时候是最熟悉不过的数学词了,接下来找找这方面的题目供大家思考 (1)爬楼梯一个楼梯有50个台阶,每一步可以走一个台阶,也可以走两个台阶,请问走完这个楼梯共有多少种方法? (2) ...

javascript函数大全

JavaScript函数大全 1.document.write(""); 输出语句2.JS中的注释为//3.传统的HTML文档顺序是:document->html->( ...

sql语句应考虑哪些安全性？

(1)少使用root账户,应该为不同的动作分配不同的账户: (2)sql执行出错后,不能把数据库中显示的出错信息,直接展示给用户.防止泄露服务器和数据库相关信息: (3)防止sql注入,对特殊字符进行 ...

redis 的主从复制机制

1.redis的主从复制是什么,我们看看那官网解释: 注: redis 的复制是配置了 master-slave 复制,这种机制允许从redis服务器能够准确地复制主服务器的内容. 主要包括:(英 ...

VIM如何将全部内容复制并粘贴到外部

ubuntu默认安装的vim是不支持系统剪切.粘贴版的,需要执行以下安装:sudo apt-get install vim-gnome 注意要让vim支持系统粘贴板,首先执行sudo apt-get ...

linux它SQL声明简明教程---WHERE

我们并不一定必须注意,每次格里面的信息是完全陷入了.在很多情况下,我们需要有选择性地捕捞数据.对于我们的样本.我们可以只抓住一个营业额超过 $1,000 轮廓. 做这个事情,我们就须要用到 WHERE ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.017 s.