机器学习 - 3 - 线性分类

机器学习 - 3 - 线性分类

符号约定

贝叶斯分类器

  1. 基于最小错误率的决策

    • 符号约定:

      • 样本 $ \bold{x} \in R^d$
      • 状态(类) \(w = {w_1,w_2,\dots}\)
      • 先验概率 \(P(w_1),P(w_2)\)
      • 样本分布密度 \(p(x)\)
      • 类条件概率密度 \(p(\bold{x}|w_1),p(\bold{x}|w_2)\)
      • 后验概率 \(P(w_1|\bold{x}),P(w_2|\bold{x})\)
      • 错误概率
        \[P(e|\bold{x})\lbrace_{P(W_1|\bold{X}) \ if\ \bold{x}\ is\ assigned\ to\ w_2}^{P(W_2|\bold{X})\ if\ \bold{x}\ is\ assigned\ to\ w_1}\]
      • 平均错误率 \(P(e) = \int P(e|\bold{x})p(\bold{x})d\bold{x}\)
      • 正确率 \(P(c)\)
    • 策略:错误概率最小嘛,很简单易懂

      \[P(e|\bold{x})\lbrace_{P(W_1|\bold{X}), \ if\ P(w_1|\bold{x})>P(w_2|\bold{x})}^{P(W_2|\bold{X}), \ if\ P(w_1|\bold{x})<P(w_2|\bold{x})}\]

      所以:\(x\) 属于那种状态时的错误概率小,就认为 \(x\) 是那种状态

  2. 基于最小风险的决策
    • 符号约定:

      • 样本 \(\bold{x}\in R^d\)
      • 状态(类) \(w = {w_1,w_2,\dots}\)
      • 决策, \(\alpha_i\) 表示将样本分类为 \(w_j,j\in1,\dots,n\)
      • 将真实标记为 \(w_j\) 的样本误分类为 \(w_i\) 所产生的损失 \(\lambda_{i,j}\)
      • 对于特定 \(x\) 采取决策 \(\alpha_i\) 的期望损失(基于后验概率 \(P(w_i|\bold{x})\) )
        \[R(\alpha_i|\bold{x}) = \sum_{j=1}^{N}\lambda_{ij}P(w_j|\bold{x})\]
      • 期望风险,即对 \(x\) 所有可能的决策 \(\alpha(x)\) 所造成的期望损失之和,也称为平均风险
        \[R(\alpha) = \int R(\alpha(x)|x)p(x)dx\]
    • 策略:使 \(R(\alpha(x)|x)\) 最小

线性判别函数

  1. 广义
  2. 齐次化

线性分类器设计

  1. 准则函数

多分类问题

原文地址:https://www.cnblogs.com/ChildishChange/p/9748954.html

时间: 2024-11-13 09:51:01

机器学习 - 3 - 线性分类的相关文章

机器学习:线性分类、高斯判别分析(GDA)、朴素贝叶斯(NB)

简介:这篇文章主要介绍简单的二分类算法:线性分类器.高斯判别分析.朴素贝叶斯. 一.线性分类器 加入给定如下两类数据(0-1),目测分类器应该对这组数据进行这样的划分.图中,红色样本点表示0,蓝色样本点表示1. 原始数据显示为三维如下: 现在运用前一节介绍的线性拟合来进行分类,即线性分类器.当拟合出来的y值大于等于0.5,则归为1,:否则归为0. 代码如下: %% %线性分类器 function Classification_Liner %% clc; clear all; close all;

机器学习之logistic分类线性与非线性实验(续)

本节续上节 机器学习之logistic回归与分类 对logistic分类的线性与非线性进行实验.上节中的"种子"分类实例中,样本虽然有7维,但是很大很大程度上符合线性可分的,为了在说明上节中的那种logistic对于非线性不可分,进行如下的两组样本进行实验,一组线性,一组非线性,样本如下: 线性样本: 非线性样本: 为了防止完全可分,在1,2类样本的分界面上重叠一部分样本,也就是说这部分样本很难分出来,图中的样本也可以看出来. 线性与非线性样本都包含两类,每类100个样本点. 先对线性

机器学习常见算法分类汇总

机器学习常见算法分类汇总 机器学习无疑是当前数据分析领域的一个热点内容.很多人在平时的工作中都或多或少会用到机器学习的算法.这里 IT 经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考. 机器学习的算法很多.很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的.这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性. 学习方式 根据数据类型的不同,对一个问题的建模有不同的方式.在机器学习或者人工智能领域,人们首先会考虑算法的学习

【机器学习基础】机器学习算法的分类——关于如何选择机器学习算法和适用解决的问题

引子 系统的学习机器学习课程让我觉得受益匪浅,有些基础问题的认识我觉得是非常有必要的,比如机器学习算法的类别. 为什么这么说呢?我承认,作为初学者,可能无法在初期对一个学习的对象有全面而清晰的理解和审视,但是,对一些关键概念有一个初步并且较为清晰的认识,有助于让我们把握对问题的认识层次,说白了,就是帮助我们有目的的去学习心得知识,带着问题去学习,充满对解决问题的动力去实验,我觉得这种方式是有益并且良性的. 之前,我遇到过很多这方面的问题,可能出于对问题分析不够,在寻找解决的问题的方法或者模型的时

python实现感知机线性分类模型

前言 感知器是分类的线性分类模型,其中输入为实例的特征向量,输出为实例的类别,取+1或-1的值作为正类或负类.感知器对应于输入空间中对输入特征进行分类的超平面,属于判别模型. 通过梯度下降使误分类的损失函数最小化,得到了感知器模型. 本节为大家介绍实现感知机实现的具体原理代码: 学习从来不是一个人的事情,要有个相互监督的伙伴,需要学习python或者有兴趣学习python的伙伴可以私信回复QQ:1354124729或微信:ff186345,一起学习哦!!!   O(∩_∩)O 运行结果如图所示:

机器学习基础4--评估线性分类

如线性回归一样,我们也分成了训练集和测试集. 用训练集进行分类器的学习,用测试集来评估分类错误. 分类错误: 测试集 -> 隐藏类型标签 -> 放到分类器进行处理 -> 得出结果 -> 与定义好的类型标签进行比较 错误率: 分类错误数/总句子数 正确率: 分类正确数/总句子数 那么,什么样的正确率才是好的? 至少要比随机猜测效果要好. 如果有k个分类,那么正确率至少要大于等于1/k 同时要关注是否有意义: 2010年,全球有90%的邮件是垃圾邮件.而只要说所有邮件都是垃圾邮件,就有

机器学习理论基础学习3.4--- Linear classification 线性分类之Gaussian Discriminant Analysis高斯判别模型

一.什么是高斯判别模型? 二.怎么求解参数? 原文地址:https://www.cnblogs.com/nxf-rabbit75/p/10284255.html

如何用机器学习对文本分类

需求 使用监督学习对历史数据训练生成模型,用于预测文本的类别. 样本清洗 主要将重复的数据删除掉,将错误无效的数据纠正或删除,并检查数据的一致性等.比如我认为长度小于少于13的数据是无效的遂将之删掉. def writeFile(text): file_object = open('result.txt','w') file_object.write(text) file_object.close() def clear(): text = "" file_obj = open(&qu

[Machine Learning] 机器学习常见算法分类汇总

声明:本篇博文根据http://www.ctocio.com/hotnews/15919.html整理,原作者张萌,尊重原创. 机器学习无疑是当前数据分析领域的一个热点内容.很多人在平时的工作中都或多或少会用到机器学习的算法.本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考. 机器学习的算法很多.很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的.这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的分类. 博主根据原创基础上加入了遗