Machine Learning- Basics

  近几年来热门的神经网络(Neural Network)和深度学习(Deep Learning)是机器学习(Machine Learning)的分支. 在计算机科学的定义中, 学习可以理解为:"A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E"(Mitchell 1997).

  T - Task: 机器学习的目标(任务). 从工程角度来说, 机器学习的方法可以用来解决很多常规意义上的"程序"无法解决的问题.常见的机器学习任务有:

  1. Classification
  2. Classification with missing inputs
  3. Regression
  4. Transcription
  5. Translation
  6. Structured Output task
  7. Anomaly Detection
  8. Synthesis and Sampling
  9. Imputation of missing value
  10. Denoising
  11. Density of probability function estimation

  P- Performance: 我们需要衡量机器学习算法好坏的指标. 例如, 在Classification的任务中, 我们可以用Accuracy准确率来衡量算法性能好坏. 通常情况下, 我们会设置一个test set 测试集来测试网络性能. 测试集不能与训练集, 验证集交叉(训练集包含了用于训练学习的数据, 验证集用于选择最优参数等). 很多时候我们会发现, Performance是一个很难量化的问题. 在有监督学习(Supervised Learning)中, 例如图像识别,语音识别等, 我们可以找到一个cost function(损失函数)来衡量网络输出Y‘ 和 目标输出Y的差距. 但并不是所有的学习都能通过有监督学习进行. 例如在计算机音乐创作的任务中, 我们无法找到目前输入音符下, 下一个输出音符的"正确答案". 这时就需要无监督学习(Unsupervised Learning). 这就引出了我们的经验 E

  E- experience : 机器学习的经验E可以来自上述的两种学习模式, 有监督学习(SL) 和无监督学习. 两种学习都需要一个data-set, 里面包含了样本 examples. 这些样本包含着许多特征, 机器学习的任务很多情况下就是学习数据集的特征. 无监督学习需要通过特有的算法对特征进行学习, 常见的算法有 聚类算法(Cluster), 以及基于能量模型的RBM, autoencoder等. 有监督学习与无监督学习不同的地方在于, 有监督学习的样本中, 每个example都会对应一个label, 我们需要学习example的特征, 使得网络学会对测试集中相似的example分配正确的label.

机器学习还包括其他的算法, 例如近一两年来应用广泛的Reinforcement Learning(强化学习)等. 接下来的博客主要是介绍机器学习的一个分支, 深度学习里的网络和算法.

reference: Deep Learning - Yoshua Bengio etc.

时间: 2024-07-30 02:17:08

Machine Learning- Basics的相关文章

【转载】Machine Learning CMSC 422 Spring 2013

Machine LearningCMSC 422Spring 2013 Schedule: MWF 4:00pm-4:50pm Location: CSIC 2117 Instructor: Hal Daume III:  Office Hours: AVW 3227; Fri 2:45-3:45 or by appointment Piazza: UMD/cs422 TAs: Phil Dasler (office hours: Thr 2:00-3:00 in TA room)   Josh

Teaching Your Computer To Play Super Mario Bros. – A Fork of the Google DeepMind Atari Machine Learning Project

Teaching Your Computer To Play Super Mario Bros. – A Fork of the Google DeepMind Atari Machine Learning Project Posted by ehrenbrav on August 25, 2016Leave a comment (14)Go to comments For those who want to get right to the good stuff, the installati

Seven Steps to Success Machine Learning in Practice

Seven Steps to Success Machine Learning in Practice Project failures in IT are all too common. The risks are higher if you are adopting a new technology that is unfamiliar to your organisation. Machine learning has been around for a long time in acad

(转)Introduction to Gradient Descent Algorithm (along with variants) in Machine Learning

Introduction Optimization is always the ultimate goal whether you are dealing with a real life problem or building a software product. I, as a computer science student, always fiddled with optimizing my code to the extent that I could brag about its

Bayesian machine learning

from: http://www.metacademy.org/roadmaps/rgrosse/bayesian_machine_learning Created by: Roger Grosse(http://www.cs.toronto.edu/~rgrosse/) Intended for: beginning machine learning researchers, practitioners Bayesian statistics is a branch of statistics

【机器学习实战】Machine Learning in Action 代码 视频 项目案例

MachineLearning 欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远 Machine Learning in Action (机器学习实战) | ApacheCN(apache中文网) 视频每周更新:如果你觉得有价值,请帮忙点 Star[后续组织学习活动:sklearn + tensorflow] ApacheCN - 学习机器学习群[629470233] 第一部分 分类 1.) 机器学习基础 2.) k-近邻算法 3.) 决策树 4.) 基于概率论的分类方法:朴素

Machine Learning In Action 第二章学习笔记: kNN算法

本文主要记录<Machine Learning In Action>中第二章的内容.书中以两个具体实例来介绍kNN(k nearest neighbors),分别是: 约会对象预测 手写数字识别 通过“约会对象”功能,基本能够了解到kNN算法的工作原理.“手写数字识别”与“约会对象预测”使用完全一样的算法代码,仅仅是数据集有变化. 约会对象预测 1 约会对象预测功能需求 主人公“张三”喜欢结交新朋友.“系统A”上面注册了很多类似于“张三”的用户,大家都想结交心朋友.“张三”最开始通过自己筛选的

[Machine Learning] 国外程序员整理的机器学习资源大全

本文汇编了一些机器学习领域的框架.库以及软件(按编程语言排序). 1. C++ 1.1 计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Android and Mac OS操作系统. 1.2 机器学习 MLPack DLib ecogg shark 2. Closure Closure Toolbox—Clojure语言库与工具的分类目录 3

New to Machine Learning? Avoid these three mistakes

http://blog.csdn.net/pipisorry/article/details/43973171 James Faghmous提醒机器学习初学者要避免的三方面错误,推荐阅读 New to Machine Learning? Avoid these three mistakes Common pitfalls when learning from data Machine learning (ML) is one of the hottest fields in data scien

Machine Learning - VI. Logistic Regression (Week 3)

http://blog.csdn.net/pipisorry/article/details/43884027 机器学习Machine Learning - Andrew NG courses学习笔记 Classification  0.1表示含义 denote with 0 is the negative class denote with 1 is the positive class.  Hypothesis Representation  Decision Boundary  Cost