第一章:统计学习及监督学习概论

目录

  • 统计学习

    • 基本分类
    • 按模型分类
    • 按算法分类
    • 按技巧分类
  • 三要素
    • 模型
    • 策略
    • 算法
  • 生成模型和判别模型
    • 生成方法
    • 判别方法
  • 应用
  • 习题

统计学习

  • 对象:data
  • 目的:预测和分析
  • 方法
    • 监督,无监督,强化学习

基本分类

  1. 监督学习

    • 从标注数据中学习预测模型
    • 建设\((X,Y)\)遵循联合概率分布\(P(X,Y)\), 样本独立同分布
    • 假设空间:输入空间到输出空间映射的集合
  2. 无监督
    • \(X\)是输入空间,\(Z\)是隐式结构空间,学习\(z=g(x)\)或者\(P(z|x)\)
  3. 强化学习
  4. 半监督
    • 少量标记数据,大量无标记数据
  5. 主动学习
    • 给实例让教师标注

按模型分类

  1. 概率模型和非概率模型

    • 监督学习

      • 概率模型(生成模型):\(P(y|x)\)
      • 非概率模型(判别模型): \(y=g(x)\)
    • 无监督学习
    • 概率模型: \(P(z|x),P(x|z)\)
    • 非概率模型: \(z= g(x)\)

    概率模型可以表示为联合概率分布的形式

  2. 线性模型和非线性模型
  3. 参数化模型和非参数化模型
    • 参数化模型: 模型参数维度固定
    • 非参数化模型:参数随数据量增大而不断增加

按算法分类

  1. 在线学习
  2. 批量学习

按技巧分类

  1. 贝叶斯学习,利用贝叶斯定理

    \[P(\theta|D) = \frac{P(\theta)P(D|\theta)}{P(D)}\]

    \(P(\theta|D)\)后验概率,\(P(\theta)\)先验概率,\(P(D|\theta)\)似然函数

    如果要给一个模型,给后验概率最大的模型(MAP)

    预测时\(P(x|D) = \int P(x|\theta,D)P(\theta|D)d\theta\)

  2. 核方法

三要素

方法=模型+策略+算法

模型

  • 假设空间:决策函数集合

    \(F=\{f|Y=f(X)\}\)

    \(F=\{f|Y=f_\theta(X),\theta\in R^n\}\),参数\(\theta\)所在的空间叫参数空间

  • 假设空间:条件概率集合

    \(F=\{P|P(Y|X)\}\)

    \(F = \{P_\theta|P_\theta(Y|X),\theta\in R^n\}\)

策略

引入损失函数,风险函数度量模型好坏

  • 0-1损失:\(\begin{equation} L(Y,f(x))=\left\{ \begin{aligned} 1 & , & Y\neq f(x) \\ 0 & , & Y =f(x) \end{aligned} \right. \end{equation}\)
  • 平方损失函数:\(L(Y,f(X))= (Y-f(X)^2\)
  • 绝对损失函数: \(L(Y,f(X)) = |Y-f(X)|\)
  • 对数损失函数:\(L(Y,P(Y|X))=-log P(Y|X)\)

风险损失,期望损失:

\(\begin{align*}R_{exp}(f) = &E_P[L(Y,f(x))] \\=&\int_{X\times Y} L(y,f(x))p(x,y)dxdy\end{align*}\)

由于不知道联合概率分布,只能使用经验风险,或者经验损失:

\(R_{emp}(f) = \frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i))\)

由于样本数量有限,大数定律不起作用

  • 经验分布最小化学习

    \(\underset{f\in F}{min} \frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i))\)

  • 结构风险最小化学习

    \(R_{stm}(f) = \frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i))+\lambda J(f)\)

    \(J(f)\)是泛函,衡量模型复杂度

算法

求解最优化问题

生成模型和判别模型

监督学习方法可以分为生成方法或者判别方法,所学到的模型分别为生成模型或者判别模型

生成方法

由数据学习联合分布\(P(X,Y)\),然后求条件概率\(P(Y|X)=\frac{P(X,Y)}{P(X)}\)

典型:朴素贝叶斯,隐马尔科夫模型

判别方法

直接学习决策函数\(f(X)\),或者条件概率分布\(P(Y|X)\)

应用

  • TP:把真的预测成真的
  • FN:把真的预测成假的
  • TN:把假的预测成假的
  • FP:把假的预测成真的

precision:\(P = \frac{TP}{TP+FP}\)

recall:\(R = \frac{TP}{TP+FN}\)

F1:\(\frac{2}{F_1} = \frac{1}{P}+\frac{1}{R}\)

习题

  1. 伯努利模型n次实验结果,k次结果为1,

    • 极大似然估计

      \(f(X,\theta) = \theta^k(1-\theta)^{n-k}\)

      \(\begin{align*}\underset{\theta}{argmax}f(X,\theta) =& \underset{\theta}{argmax}log(f(X,\theta)) \\=&\underset{\theta}{argmax}(klog\theta +(n-k)log(1-\theta)) \end{align*}\)

      \(g(\theta) = klog\theta +(n-k)log(1-\theta)\)

      \(g'(\theta) = (1-\theta)k-(n-k)(1-\theta)\)

      \(g'(\theta)=0\)的解为\(\theta=\frac{k}{n}\)

    • 贝叶斯估计

原文地址:https://www.cnblogs.com/Lzqayx/p/12151009.html

时间: 2024-10-12 21:10:21

第一章:统计学习及监督学习概论的相关文章

第一章:学习之始

1.为什么要学习Android? 第一个原因是随着身边的朋友都开始转行,经常都会在耳边听到Android的词汇慢慢的开始对学习Android产生了兴趣.第二个原因则是因为提高自身能力,在加上互联网的发展趋势.总之一句话,反正学的多了没坏处. 2.开发工具和相关配置 现在Android的开发工具无非就是Eclipse 和google 提供的官方开发工具 Android Studio.个人推荐使用官方的Android Studio 这些开发,优点有很多在这里就不一一说明了.如果需要下载Android

第一章 Actionscript学习基本知识笔记及flashdevelop软件的安装问题

OOP:封装.继承.多态. Pubilc :完全公开. Internal:包内类成员可以互相访问. Private:仅当前类可以访问. Protected:当前类和当前类的子类可以访问. 被关键词final定义过的实例不能被重写. 复合和继承,当是从属关系的时候用继承,当其是构成的一部分就用复合. 所有的对象都有父类----就是它的数据类型所有类的顶层是object类 关于flashdevelop软件的安装问题 先到www.flashdevelop.org/ 下载安装该软件的安装包或者是绿色版的

统计学习方法 李航---第1章 统计学习方法概论

第一章 统计学习方法概论 统计学习的主要特点是: (1)统计学习以计算机及网络为平台,是建立在计算机及网络之上的; (2)统计学习以数据为研究对象,是数据驱动的学科: (3)统计学习的目的是对数据进行预测与分析: (4)统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析; (5)统计学习是概率论.统计学.信息论.计算理论.最优化理论及计算机科学等多个领域的交叉学科,并且在发展中逐步形成独自的理论体系与方法论. 统计学习的对象是数据Cdata) 统计学习的目的是对数据进行预铡与分析

统计学习方法-李航 第一章

第一章 统计学习方法概论 学习:如果一个系统能够通过执行某个过程改进它的性能,这就是学习 监督学习:从训练数据集中学习模型,对测试数据进行预测 回归问题:输入变量与输出变量均为连续变量的预测问题 分类问题:输出变量为有限个离散变量的预测问题 标注问题:输入变量与输出变量均为变量序列的预测问题 损失函数:度量预测错误的程度 经验风险:训练数据集的平均损失 期望风险:损失函数的期望值 根据大数定律,当样本容量N趋于无穷时,经验风险趋于期望风险 泛化能力:指由该方法学习到的模型对未知数据的预测能力 过

统计学习方法 笔记<第一章>

第一章 统计学习方法概述 1.1 统计学习 统计学习(statistical learning)是关于计算机基于数据概率模型并运用模型进行预测和分析的学科.统计学习也称为统计机器学习,现在人们提及的机器学习一般都是指统计机器学习. 统计学习的对象是数据(data),关于数据的基本假设是同类数据具有一定的统计规律性(前提):比如可以用随机变量描述数据中的特征,用概率分布描述数据的统计规律等. 统计学习的目的:对现有的数据进行分析,构建概率统计模型,分析和预测未知新数据,同时也需要考虑模型的复杂度以

读书笔记 第一章

通过第一章的学习,我了解到了Android 是Google开发的基于Linux平台的开源手机操作系统.它包括操作系统.用户界面和应用程序以及移动电话工作所需的全部软件,而且不存在任何以往阻碍移动产业创新的专有权障碍.Android采用WebKit浏览器引擎,具备触摸屏.高级图形显示和上网功能,用户能够在手机上查看电子邮件.搜索网址和观看视频节目等,比iPhone等其他手机更强调搜索功能,界面更强大,可以说是一种融入全部Web应用的单一平台. android的系统架构和其操作系统一样,采用了分层的

统计学习概念

统计学习是基于数据构建统计模型从而对数据进行预测与分析,统计学习由监督学习,非监督学习,半监督学习和强化学习等组成 统计学习由模型的假设空间(学习的模型属于某个函数的集合),模型选择的准则,及模型学习的算法 统计学习方法步骤如下: (1)得到一个有限的训练数据集合 (2)确定包含所有可能的模型的假设空间(学习模型的集合) (3)确定模型选择的准则,即学习的策略 (4)实现求解最优模型的算法即学习的算法 (5)通过学习方法选择最优模型 (6)利用学习的最优模型对新数据进行预测或分析 1.监督学习

【C语言探索之旅】 第一部分第四课第一章:变量的世界之内存那档事

内容简介 1.课程大纲 2.第一部分第四课第一章:变量的世界之内存那档事 3.第一部分第四课第二章预告:变量的世界之声明变量 课程大纲 我们的课程分为四大部分,每一个部分结束后都会有练习题,并会公布答案.还会带大家用C语言编写三个游戏. C语言编程基础知识 什么是编程? 工欲善其事,必先利其器 你的第一个程序 变量的世界 运算符 条件表达式 循环语句 实战:第一个C语言小游戏 函数 练习题 习作:完善第一个C语言小游戏 C语言高级技术 模块化编程 进击的指针,C语言王牌 数组 字符串 预处理 创

第一章:安卓系统移植与驱动开发概述

<Android深度探索>(卷1)HAL与驱动开发读后感: 这一章主要概括的介绍了安卓驱动开发和系统移植的主要内容,对安卓与Linux驱动做了一个总体的介绍.通过对第一章的学习,使我对Linux驱动开发有了一个感性的认识.在学习过程中,首先,我通过以往上课时学习到的知识和查阅资料了解了一些专业词汇的含义(例如:.so文件:共享库,是shared object,用于动态连接:SDK:软件开发工具包:API:应用程序编程接口:HAL:硬件抽象层等),并在文中做了相应的标注,为以后更好的学习安卓驱动