分类器效果分析

假设有两个分类器A,B。A在1000个样本的集合上有75%的准确率;B在200个样本的集合上有85%的准确率。我们要怎样评价这两个分类器的效果?

这就是这里要讨论的分类器效果分析。

抛硬币的例子

硬币正面的概率为50%,那么做N次随机试验,也就是N次的伯努利试验。根据概率的知识,我们知道,正面硬币个数X满足B(0.5N,0.5*0.5*N)的伯努利分布。

再根据大数定理,假设N足够大,那么X满足N(0.5N,0,5*0,5*N)的正态分布。

准确率acc=X /N,我们可以得出acc的分布:

acc~N(0.5,0.5*0.5/N)

同样的,A分类器的真实准确率是p,那么对于每个测试样本,有p的概率被预测正确。也就是,N个测试样本的预测也同上面的抛硬币一样,是概率为p的N次伯努利实验。

于是有

acc~N(p,p(1-p)/N)

以上,我们以伯努利模型,得到了关于识别率的概率公式。

置信区间

置信区间是根据观察值,对于总体分布参数的一个估计。这里我们关于真实p,也就是分布中的均值做一个估计。

根据之前正态分布的均值和方差,我们得到如下的置信区间:

以上,我们可以得到真实准确率的一个估计区间,以及这个区间的可信度。

*个人理解的置信区间,基于假设分布,根据观察值在假设分布的某个区间的概率,可以反推假设分布中其他参数的概率。

继续推导出置信区间的公式:

小结论:同样的置信区间,置信度随着N的增加而增加。

比较方法

有了置信度,置信区间,还是不好比较。假设

A:75%+-1%

B:85%+-10%

同在置信度95%下

还是看不出有什么优劣。继续推导比较方法。

误差差值建模

两个分类器之间的区别,我们可以用d=e1-e2来衡量。

其中e表示分类误差,e1表示在数据集1上,e2为数据集2上。

我们可以认为e1,e2分别为独立的正态分布。

于是,他们之间的差值:

d=e1-e2

为两个独立正态分布之和,于是,d也满足正态分布,有:

我们就可以估计训练误差之差值的一个置信区间。

比如,我们可以估计两个分类器的d形如:

d=10%+-12.8%,在置信度95%之下

这里d包含0,也就是两个分类器差异不显著。

或者:

d=10%+-1%,在置信度95%之下

那么,两个分类器差异显著,e1>e2。

交叉验证性能比较

在同一个数据集上进行K-fold交叉验证时,每个分类器进行了K次。根据概率论知识,其准确率的均值之差d=mean1-mean2为K个正态分布的均值,满足自由度为k-1的t分布。我们用t分布来估计其差异。

我们有:

我们就能得到关于两个分类器K-fold交叉验证的差异估计。

小结

*在t分布中,我们的前提是同一个数据集上,而且d是同一阶段两个准确率之差。因为在不同训练集上训练的结果没有可比性。而K-fold中不同阶段为不同的训练样本集。故计算d时要两两对应。

*以上的所有估计,也都是基于相同的训练样本集合,才有意义。

*一般的实验中,我们测试的集合都能够相等,那么单一实验的估计就可以直接比较大小,没有太大意义。这时候,我们进行K-fold验证,可以得到更好的比较估计。不过具体操作中,基本直接使用均值相减的比较,方便快捷。个人觉得,除非是很严谨的实验设置,一般的K-fold取均值就可以得到较好的比较结果。

分类器效果分析,布布扣,bubuko.com

时间: 2024-08-11 05:43:50

分类器效果分析的相关文章

css图片切换效果分析+翻译整理

Demos:http://tympanus.net/Tutorials/CSS3SlidingImagePanels/ 出处:http://tympanus.net/codrops/2012/01/17/sliding-image-panels-with-css3/ 这个教程将介绍如何使用纯CSS创建一个干净的幻灯图片面板.主要想法是在面板中使用背景图片,然后在点击标签后让动画起效. 今天我们将向您展示如何创建仅适用于CSS一些巧妙的滑动图像面板.该想法是使用背景图像的面板和一个标签上点击时动画

android listview 不显示选中效果分析

android listview有时会发现没有选中效果,解决办法 1:listview布局中设置颜色,如 android:background="@android:color/white" 2:在listview的item布局文件中背景设置为 android:background="@android:color/transparent" 原因:颜色设置在整体的listview上面,每一行布局设置透明色即可 android listview 不显示选中效果分析

手机模拟位置实现精准位置营销效果分析

对微商来说,实现位置精准营销实在太重要的一个推广方法了,位置精准营销能让你的产品展示到全世界的人身边,大大增加产品的曝光度,同时也能打造好友数量,做圈内营销,这里分享一种我们经常在用的位置精准营销方法供大家参考. 我们知道位置营销一般都基于社交软件app或者分类信息软件上来做,通过模拟位置定位让账号在不同的地方出现,我们开始进入主题,如何实现位置精准营销的步骤,首先手机上安装琢石模拟器,一键生成参数,然后在把位置定位修改一下我们的要模拟的位置,然后打开我们要模拟的app,当然前提是把我们的签名信

定量的CDN加速效果分析

指路牌 CDN 网站静态资源加速 定量展示CDN加速效果 CDN配置好了但是没有加速效果? 适用场景 "第一次接触"用户体验提升 网站具有大量图片.css.js等静态资源 ECS购买了固定带宽,带宽成为性能瓶颈 环境 一个已完成"备案"的域名 域名购买后需要实名认证+备案,大概需要花费"14-20天". 开通阿里云CDN服务 参考博客 Web项目聚集地 --- 一文读懂 CDN阿里云 --- CDN文档 背景 我曾接触过两个项目,一个是基于web

人脸识别关键点/五官定位效果分析---点击图片提供下载测试,欢迎提供建议

########################################### 1:安装好了之后,打开手机网络(只是验证网络时间),并不发生数据交互. 2:如果打开黑屏,是由于安卓手机版本太高,需要手动打开摄像头权限. ########################################## 利用神经网络开发的五官定位/人脸识别关键点的开发包,跟踪效果和切合 度还是不错的,但是一定存在很多大牛,希望你们多多分享下你们自己的经 验,大家一起进步. ###############

weui 多网页切换效果分析

weui的文档写的不怎么详尽,简单的来讲WeUI 为微信 Web 服务量身设计的h5框架. WeUI是一套同微信原生视觉体验一致的基础样式库,由微信官方设计团队为微信 Web 开发量身设计,可以令用户的使用感知更加统一.包含button.cell.dialog. progress. toast.article.icon等各式元素. 严格的讲它是一个css库.算一个精简的库. 如果要用jQuery开发的话,head部分,需要加载如下信息: <head> <meta charset=&quo

LinearLayout-layout_gravity 属性没有效果分析

今天在一个布局文件中,遇到了一个问题,先看代码 <LinearLayout android:layout_width="match_parent" android:layout_height="wrap_content" android:orientation="horizontal" android:paddingBottom="21dip" android:paddingLeft="@dimen/setup

省市区三级联动下拉框效果分析

<select id="selProvince"> <option>--请选择--</option> </select> <select id="selCity"> <option>--请选择--</option> </select> <select id="selCountry"> <option>--请选择--</op

网页效果分析 VCD分解

VCD分解分为三部分: 1. view 视觉                   HTML + CSS 基本界面模板 2. controller 控制            javascript  内容处理 事件处理 3. data 数据                   data.js  非必须 助于理解