统计学习方法进程01

  学习统计学习方法也已经有几天了,在这几天的时间里,我主要对分类学习方法进行了初步学习,包括:感知机——>支持向量机,K近邻法,朴素贝叶斯法,决策树,logistic
回归与最大熵模型。

  其中k近邻法的实现为kd树,朴素贝叶斯通过极大似然估计实现,决策树包含有生成决策树算法ID3,C4.5,决策树的剪枝算法CART.

  logistic回归,核心为参数估计,一般用极大似然估计把问题变成优化问题。最优化问题的解决通常采用梯度下降法,拟牛顿法。概率学习问题中还涉及到最大熵模型(存在一定遗忘)

  支持向量机部分是整本书的重点也是难点,从感知机演化而来的线性可分SVM(包括间隔最大化,学习的对偶算法,拉格朗日),进一步研究近似线性可分SVM(软间隔最大化,学习的对偶算法),得到包含向量内积的目标函数。根据向量内积引入核函数,进而把复杂问题转化为线性SVM来解决。SVM的求解算法的一种SMO,包括两个变量二次规划求解方法,两个变量的选择方法。(SMO还存在疑惑,需要继续研究)

时间: 2024-10-22 00:30:57

统计学习方法进程01的相关文章

统计学习方法概述

一 统计学习方法概述 统计学习对象: 数据-->数据特征-->数据模型-->知识-->预测 统计学习关于数据的假设: 具有一定统计规律性的同类数据. 统计学习目的: 对数据进行预测与分析,尤其是对未知新数据进行分析预测.通过构建概率统计模型实现. 统计学习方法: 监督学习,非监督学习,半监督学习,强化学习 监督学习: 从给定的,有限的,用于学习的训练数据集出发,假设数据是独立同分布产生的,并且假设要学习的模型属于某个函数集合(假设空间).应用某个评价准则,从假设空间中选取一个最优的

李航《统计学习方法》多项式函数拟合问题V2

最近在看李航的统计学习方法P11时发现一个多项式函数拟合问题觉得公式的推导有问题,于是看了一些资料发现这里的推倒是有错误的,用python编程验证后发现按书上的求导结果拟合后的函数图像完全不对,下面给出正确的推导结果和对应的python实现与拟合效果. (第一次写了一版这篇博客,公式自己敲的,但是从别人那里贴的代码,后面感觉那个代码思路没问题,但就是进行了很多次重复计算,数据量大的时候效率低,而且很多地方对python的语言特性利用不足,写的有点类似C语言风格,比较晦涩.于是乎,把代码重写了一次

统计学习方法:朴素贝叶斯

作者:桂. 时间:2017-04-20  18:31:37 链接:http://www.cnblogs.com/xingshansi/p/6740308.html 前言 本文为<统计学习方法>第四章:朴素贝叶斯(naive bayes),主要是借助先验知识+统计估计,本文主要论述其分类的思路.全文包括: 1)模型描述 2)算法求解 3)理论应用 内容为自己的学习记录,其中参考他人的地方,最后一并给出链接. 一.模型描述 A-理论框架 日常生活中,总会这么表达:“我觉得吧....”,“以我的经验

统计学习方法 李航---第12章 统计学习方法总结

第12章 统计学习方法总结 1 适用问题 分类问题是从实例的特征向量到类标记的预测问题:标注问题是从观测序列到标记序列(或状态序列)的预测问题.可以认为分类问题是标注问题的特殊情况. 分类问题中可能的预测结果是二类或多类:而标注问题中可能的预测结果是所有的标记序列,其数目是指数级的. 感知机.k近邻法.朴素贝叶斯法.决策树是简单的分类方法,具有模型直观.方法简单.实现容易等特点: 逻辑斯谛回归与最大熵模型.支持向量机.提升方法是更复杂但更有效的分类方法,往往分类准确率更高: 隐马尔可夫模型.条件

统计学习方法 李航---第1章 统计学习方法概论

第一章 统计学习方法概论 统计学习的主要特点是: (1)统计学习以计算机及网络为平台,是建立在计算机及网络之上的; (2)统计学习以数据为研究对象,是数据驱动的学科: (3)统计学习的目的是对数据进行预测与分析: (4)统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析; (5)统计学习是概率论.统计学.信息论.计算理论.最优化理论及计算机科学等多个领域的交叉学科,并且在发展中逐步形成独自的理论体系与方法论. 统计学习的对象是数据Cdata) 统计学习的目的是对数据进行预铡与分析

统计学习方法[6]——逻辑回归模型

统计学习方法由三个要素组成:方法=模型+策略+算法 模型是针对具体的问题做的假设空间,是学习算法要求解的参数空间.例如模型可以是线性函数等. 策略是学习算法学习的目标,不同的问题可以有不同的学习目标,例如经验风险最小化或者结构风险最小化. 经验风险最小化中常见的损失函数有:0-1损失函数.残差损失函数.绝对值损失函数.平方损失函数.对数损失函数等等. 算法是按照上述策略求解模型的具体计算方法.模型定义了要求什么,策略定义了按照什么标准去求,算法则具体去解决. 线性回归模型 线性回归模型,众所周知

统计学习方法:罗杰斯特回归及Tensorflow入门

作者:桂. 时间:2017-04-21  21:11:23 链接:http://www.cnblogs.com/xingshansi/p/6743780.html 前言 看到最近大家都在用Tensorflow,一查才发现火的不行.想着入门看一看,Tensorflow使用手册第一篇是基于MNIST的手写数字识别的,用到softmax regression,而这个恰好与我正在看的<统计信号处理>相关.本文借此梳理一下: 1)罗杰斯特回归 2)Softmax Regression 3)基于Tenso

统计学习方法 笔记&lt;第一章&gt;

第一章 统计学习方法概述 1.1 统计学习 统计学习(statistical learning)是关于计算机基于数据概率模型并运用模型进行预测和分析的学科.统计学习也称为统计机器学习,现在人们提及的机器学习一般都是指统计机器学习. 统计学习的对象是数据(data),关于数据的基本假设是同类数据具有一定的统计规律性(前提):比如可以用随机变量描述数据中的特征,用概率分布描述数据的统计规律等. 统计学习的目的:对现有的数据进行分析,构建概率统计模型,分析和预测未知新数据,同时也需要考虑模型的复杂度以

统计学习方法--机器学习概论

(本章主要参考李航老师的<统计学习方法>,其次是周志华老师的<机器学习>.通过自己的阅读,提炼出书中的知识点以及些许自己部分的理解(可能不到位),巩固所学知识.) 统计学习方法概论 本章简要叙述统计学习方法的一些基本概念.首先许如统计学习的定义.研究对象与方法:然后叙述监督学习:接着提出统计学习方法的三要素:介绍模型选择:介绍生成模型与判别模型:最后介绍监督学习方法的应用:分类问题.标注问题与回归问题. 以下是目录结构: 一. 统计学习 二. 监督学习 三.统计学习三要素 四. 模