白话——胡说图像分类器

下面信息所有是作者的个人理解,记录下来方便用简单的视角去理解复杂的问题,当中不乏胡说八道和想当然,如有与事实不符的地方,请大家多多批评指正!

图像分类器最早诞生的应该是贝叶斯分类器:

为什么?由于贝叶斯网络实际上就是把各种可能性串联起来。全然符合人脑的推理过程,

朴素贝叶斯分类器:贝叶斯网络实际上是由N种可能性构成的树组成的,比方,下图照片中一张红桃A,贝叶斯算法的判断步骤例如以下:

->一张扑克牌(90%的可能性)->一张带红心的扑克牌(80%)->一张带红心带A字母的扑克牌(80%)->一张红桃A扑克牌

->一张带红心带阿拉伯数字4的扑克牌(20%)->一张错误的红桃4扑克牌

->一张带黑桃的扑克牌(20%)->一张带黑桃带A字母的扑克牌(80%)->一张黑桃A扑克牌

->一张带黑桃带阿拉伯数字4的扑克牌(20%)->一张错误的黑桃4扑克牌

大家看上述的判断,是不是就形成了一个有主干有分叉的树。这就是最主要的朴素贝叶斯分类器,判断的可能性形成了一棵树,所以叫“朴素(树)”,那么在贝叶斯的主要思想领域内,又有一些人进行了一些优化,无非就是添加一些參数阀值之类的,把树变成图,让可能性节点能够在树枝之间流通。目的都是为了使分类更准确

尽管非常easy被理解, 可是,朴素贝叶斯分类器不能对复杂图像数据进行准确的判断和分类。数字图像信息量庞大,朴素贝叶斯分类器只只能针对特征明显或者一维空间可分的图像进行分类。

随着计算机运算能力的发展,使得大规模的分类运算带来了可能。于是就诞生了神经网络分类器。 神经网络,就是模拟人的大脑的工作方式。用大量分类器节点模拟人脑的“处突”,进行大型分类运算。

每个“处突”分类器节点能够是一个“贝叶斯分类器”

人工神经网络:由N多个类似于“贝叶斯算法”的分类器组成的集合。一起进行判断。

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvemVyZ3Nrag==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" >注:每一个蓝圆点都看作一个贝叶斯分类器,这样便于理解

好了,看到这里。也许就明确了,为啥如今这么多人都在研究神经网络了?由于在这种系统架构下,能够发挥的空间和潜力是巨大的

但这样的架构治标不治本,真正决定图像分类效果的。还是每个详细节点里的算法,而大量节点的參与。仅仅只是是一种“人海战术”(机海)

于是人们就開始思考如何让复杂而又难以分类的图像数据。变得可分, 于是“支持向量机”分类器就诞生了

支持向量机分类器:一句话概括,将低维空间中不可分的数据转换到高维度空间,使其可分

支持向量机这个名字太学术化了,让人望而生畏,事实上没那么复杂。

比方。依然是上述红桃A扑克牌。支持向量机的工作过程是如何的呢?

数字图像二维数据(x轴数据,y轴数据)->(是否可分)->三维数据(x轴灰度,y轴灰度,总体颜色值)->(是否可分)->四维数据(x轴灰度,y轴灰度,x轴颜色,y轴颜色)……

看到这里,你也许就明确了,支持向量机就是把原始混杂无规律的数据按一定规则筛选出来。寻找筛选出来的数据规律,直到找到规律为止。

所以。支持向量机分类的好坏,取决于筛选规则的设定,也就是所谓的核函数。

那么支持向量机就真正从数字的意义上对图像的内容进行学习了,所以也是如今研究的热门!

今天就先写到这里,希望能帮助大家理解这些概念,传统的资料上总是写一大堆的数学公式,事实上非常多都不是必需,用公式去表达概念,就是数学界的文言文,有点装的意思哈。

时间: 2024-10-09 20:32:52

白话——胡说图像分类器的相关文章

第3章 图像基础

  第3章图像基础 在开始构建图像分类器之前,首先要理解图像是什么.首先要理解图像的基石--像素. 1          像素--图像的基石 像素是图像最原始的构建块.每副图像由像素集合构成.通常,像素考虑为给定一副图片下,在给定位置的"颜色"或亮度的"强度".如图1所示: 图1 1000像素宽,750像素高的图像 图1的图像为1000*750分辨率,意味着1000像素宽且750像素高.我们可以用矩阵来概念化图像,在这个例子中,矩阵1000列(宽)和750行(高),

[PyTorch入门之60分钟入门闪击战]之训练分类器

训练分类器 目前为止,你已经知道如何定义神经网络.计算损失和更新网络的权重.现在你可能在想,那数据呢? What about data? 通常,当你需要处理图像.文本.音频或者视频数据时,你可以使用标准Python包来将数据导入到numpy 数组中.然后再将数组转换成torch.Tensor. 对于图像,可用的包有:Pillow.OpenCV 对于音频,可用的包有:scipy和librosa 对于文本,无论是基于原始的Python或Cython的加载,或是NLTK和SpaCy都是可以的. 对于视

面向小数据集构建图像分类模型Keras

文章信息 本文地址:http://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html 本文作者:Francois Chollet 概述 在本文中,我们将提供一些面向小数据集(几百张到几千张图片)构造高效.实用的图像分类器的方法. 本文将探讨如下几种方法: 从图片中直接训练一个小网络(作为基准方法) 利用预训练网络的bottleneck(瓶颈)特征 fine-tune预训练网

端到端的全栈实力,英特尔正在用人工智能成就未来

2017年5月27日,英特尔参加了由机器之心SYNCED主办的2017全球机器智能峰会(GMIS 2017),此次大会以"机器智能时代"为主题,全面聚焦人工智能,包括英特尔在内的众多国内外顶级专家汇聚于此,围绕人工智能展开精彩的演讲和激烈的讨论. 会议期间,英特尔AIPG数据科学部主任刘茵茵博士,发表了主题为<演变中的人工智能,与模型俱进>的精彩演讲,她表示,深度学习推动着人工智能领域的进展,每个AI模型都是理论与实践的突破,以模型为起点,通过收集数据,进行训练,基于人工智

形状文法--建筑风格分类总结

1.Shape –Talking about seeing and doing(田小娣) 在Stiny George的Shape-Talking about seeing and doing文章中,Stiny将shape designs比作“sentences”,句子由词汇,语法和句子内部关系操作组成,对于shape designs这些成分就是definited shapes, a set of rules, relationship between shapes,根据这些进行作品设计,但是这种

深度学习动手入门:GitHub上四个超棒的TensorFlow开源项目

作者简介:akshay pai,数据科学工程师,热爱研究机器学习问题.Source Dexter网站创办人. TensorFlow是Google的开源深度学习库,你可以使用这个框架以及Python编程语言,构建大量基于机器学习的应用程序.而且还有很多人把TensorFlow构建的应用程序或者其他框架,开源发布到GitHub上. 这次跟大家分享一些GitHub上令人惊奇的TensorFlow项目,你可以直接在你的应用中使用,或者根据自身所需进一步予以改进. TensorFlow简介 如果你已经知道

VGG卷积神经网络模型解析

VGG卷积神经网络模型解析 一:VGG介绍与模型结构 VGG全称是Visual Geometry Group属于牛津大学科学工程系,其发布了一些列以VGG开头的卷积网络模型,可以应用在人脸识别.图像分类等方面,分别从VGG16-VGG19.VGG研究卷积网络深度的初衷是想搞清楚卷积网络深度是如何影响大规模图像分类与识别的精度和准确率的,最初是VGG-16号称非常深的卷积网络全称为(GG-Very-Deep-16 CNN),VGG在加深网络层数同时为了避免参数过多,在所有层都采用3x3的小卷积核,

1、VGG16 2、VGG19 3、ResNet50 4、Inception V3 5、Xception介绍——迁移学习

ResNet, AlexNet, VGG, Inception: 理解各种各样的CNN架构 本文翻译自ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional Networks,原作者保留版权 卷积神经网络在视觉识别任务上的表现令人称奇.好的CNN网络是带有上百万参数和许多隐含层的"庞然怪物".事实上,一个不好的经验规则是:网络越深,效果越好.AlexNet,VGG,Inc

第4章 图像分类(image classification)基础

第4章 图像分类基础 一张图片胜过千言万语.我们不断地攫取视觉内容,解释它的含义,并且存储它们以备后用. 但是,对于计算机要解释一张图片的内容是很难的,因为计算机看到的图片是一个大的数字矩阵,它对图像传递的思想.知识和意义一无所知. 为了理解图像的内容,我们必须应用图像分类(image classification),这是使用计算机视觉和机器学习算法从图像中抽取意义的任务.这个操作可以简单的为一张图像分配一个标签,如猫.狗还是大象,或者也可以高级到解释图像的内容并且返回一个人类可读的句子. 图像