机器学习 - 3 - 线性分类

符号约定

贝叶斯分类器

基于最小错误率的决策
- 符号约定：
  - 样本 $ \bold{x} \in R^d$
  - 状态（类） $w = {w_1,w_2,\dots}$
  - 先验概率 $P(w_1),P(w_2)$
  - 样本分布密度 $p(x)$
  - 类条件概率密度 $p(\bold{x}|w_1),p(\bold{x}|w_2)$
  - 后验概率 $P(w_1|\bold{x}),P(w_2|\bold{x})$
  - 错误概率
    \[P(e|\bold{x})\lbrace_{P(W_1|\bold{X}) \ if\ \bold{x}\ is\ assigned\ to\ w_2}^{P(W_2|\bold{X})\ if\ \bold{x}\ is\ assigned\ to\ w_1}\]
  - 平均错误率 $P(e) = \int P(e|\bold{x})p(\bold{x})d\bold{x}$
  - 正确率 $P(c)$
- 策略：错误概率最小嘛，很简单易懂
  \[P(e|\bold{x})\lbrace_{P(W_1|\bold{X}), \ if\ P(w_1|\bold{x})>P(w_2|\bold{x})}^{P(W_2|\bold{X}), \ if\ P(w_1|\bold{x})<P(w_2|\bold{x})}\]
  
  所以：$x$ 属于那种状态时的错误概率小，就认为 $x$ 是那种状态
基于最小风险的决策
- 符号约定：
  - 样本 $\bold{x}\in R^d$
  - 状态（类） $w = {w_1,w_2,\dots}$
  - 决策， $\alpha_i$ 表示将样本分类为 $w_j,j\in1,\dots,n$
  - 将真实标记为 $w_j$ 的样本误分类为 $w_i$ 所产生的损失 $\lambda_{i,j}$
  - 对于特定 $x$ 采取决策 $\alpha_i$ 的期望损失（基于后验概率 $P(w_i|\bold{x})$ ）
    \[R(\alpha_i|\bold{x}) = \sum_{j=1}^{N}\lambda_{ij}P(w_j|\bold{x})\]
  - 期望风险，即对 $x$ 所有可能的决策 $\alpha(x)$ 所造成的期望损失之和，也称为平均风险
    \[R(\alpha) = \int R(\alpha(x)|x)p(x)dx\]
- 策略：使 $R(\alpha(x)|x)$ 最小

线性判别函数

广义
齐次化

线性分类器设计

准则函数

多分类问题

原文地址：https://www.cnblogs.com/ChildishChange/p/9748954.html

时间： 2024-11-13 09:51:01

机器学习 - 3 - 线性分类的相关文章

机器学习：线性分类、高斯判别分析（GDA）、朴素贝叶斯（NB）

简介:这篇文章主要介绍简单的二分类算法:线性分类器.高斯判别分析.朴素贝叶斯. 一.线性分类器加入给定如下两类数据(0-1),目测分类器应该对这组数据进行这样的划分.图中,红色样本点表示0,蓝色样本点表示1. 原始数据显示为三维如下: 现在运用前一节介绍的线性拟合来进行分类,即线性分类器.当拟合出来的y值大于等于0.5,则归为1,:否则归为0. 代码如下: %% %线性分类器 function Classification_Liner %% clc; clear all; close all;

机器学习之logistic分类线性与非线性实验（续）

本节续上节机器学习之logistic回归与分类对logistic分类的线性与非线性进行实验.上节中的"种子"分类实例中,样本虽然有7维,但是很大很大程度上符合线性可分的,为了在说明上节中的那种logistic对于非线性不可分,进行如下的两组样本进行实验,一组线性,一组非线性,样本如下: 线性样本: 非线性样本: 为了防止完全可分,在1,2类样本的分界面上重叠一部分样本,也就是说这部分样本很难分出来,图中的样本也可以看出来. 线性与非线性样本都包含两类,每类100个样本点. 先对线性

机器学习常见算法分类汇总

机器学习常见算法分类汇总机器学习无疑是当前数据分析领域的一个热点内容.很多人在平时的工作中都或多或少会用到机器学习的算法.这里 IT 经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考. 机器学习的算法很多.很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的.这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性. 学习方式根据数据类型的不同,对一个问题的建模有不同的方式.在机器学习或者人工智能领域,人们首先会考虑算法的学习

【机器学习基础】机器学习算法的分类——关于如何选择机器学习算法和适用解决的问题

引子系统的学习机器学习课程让我觉得受益匪浅,有些基础问题的认识我觉得是非常有必要的,比如机器学习算法的类别. 为什么这么说呢?我承认,作为初学者,可能无法在初期对一个学习的对象有全面而清晰的理解和审视,但是,对一些关键概念有一个初步并且较为清晰的认识,有助于让我们把握对问题的认识层次,说白了,就是帮助我们有目的的去学习心得知识,带着问题去学习,充满对解决问题的动力去实验,我觉得这种方式是有益并且良性的. 之前,我遇到过很多这方面的问题,可能出于对问题分析不够,在寻找解决的问题的方法或者模型的时

python实现感知机线性分类模型

前言感知器是分类的线性分类模型,其中输入为实例的特征向量,输出为实例的类别,取+1或-1的值作为正类或负类.感知器对应于输入空间中对输入特征进行分类的超平面,属于判别模型. 通过梯度下降使误分类的损失函数最小化,得到了感知器模型. 本节为大家介绍实现感知机实现的具体原理代码: 学习从来不是一个人的事情,要有个相互监督的伙伴,需要学习python或者有兴趣学习python的伙伴可以私信回复QQ:1354124729或微信:ff186345,一起学习哦!!! O(∩_∩)O 运行结果如图所示:

机器学习基础4--评估线性分类

如线性回归一样,我们也分成了训练集和测试集. 用训练集进行分类器的学习,用测试集来评估分类错误. 分类错误: 测试集 -> 隐藏类型标签 -> 放到分类器进行处理 -> 得出结果 -> 与定义好的类型标签进行比较错误率: 分类错误数/总句子数正确率: 分类正确数/总句子数那么,什么样的正确率才是好的? 至少要比随机猜测效果要好. 如果有k个分类,那么正确率至少要大于等于1/k 同时要关注是否有意义: 2010年,全球有90%的邮件是垃圾邮件.而只要说所有邮件都是垃圾邮件,就有

机器学习理论基础学习3.4--- Linear classification 线性分类之Gaussian Discriminant Analysis高斯判别模型

一.什么是高斯判别模型? 二.怎么求解参数? 原文地址:https://www.cnblogs.com/nxf-rabbit75/p/10284255.html

如何用机器学习对文本分类

需求使用监督学习对历史数据训练生成模型,用于预测文本的类别. 样本清洗主要将重复的数据删除掉,将错误无效的数据纠正或删除,并检查数据的一致性等.比如我认为长度小于少于13的数据是无效的遂将之删掉. def writeFile(text): file_object = open('result.txt','w') file_object.write(text) file_object.close() def clear(): text = "" file_obj = open(&qu

[Machine Learning] 机器学习常见算法分类汇总

声明:本篇博文根据http://www.ctocio.com/hotnews/15919.html整理,原作者张萌,尊重原创. 机器学习无疑是当前数据分析领域的一个热点内容.很多人在平时的工作中都或多或少会用到机器学习的算法.本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考. 机器学习的算法很多.很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的.这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的分类. 博主根据原创基础上加入了遗