计算机视觉领域的三大任务

计算机视觉的三大分类任务:图像分类、目标检测、图像分割;

1. 图像分类(Classification),即是将图像结构化为某一类别的信息,用事先确定好的类别(category)或实例ID来描述图片。

2. 目标检测(Detection)。分类任务关心整体,给出的是整张图片的内容描述,而检测则关注特定的物体目标,要求同时获得这一目标的类别信息和位置信息(classification + localization)。相比分类,检测给出的是对图片前景和背景的理解,我们需要从背景中分离出感兴趣的目标,并确定这一目标的描述(类别和位置),因此检测模型的输出是一个列表,列表的每一项使用一个数组给出检出目标的类别和位置(常用矩形检测框的坐标表示)。

3. 图像分割(Segmentation)。分割包括语义分割(semantic segmentation)和实例分割(instance segmentation),前者是对前背景分离的拓展,要求分离开具有不同语义的图像部分,而后者是检测任务的拓展,要求描述出目标的轮廓(相比检测框更为精细)。分割是对图像的像素级描述,它赋予每个像素类别(实例)意义,适用于理解要求较高的场景,如无人驾驶中对道路和非道路的分割。

总结:图像分类(image classification)是将图像划分(divide)为单个类别,通常对应于图像中最突出的物体。但是现实世界的很多图像通常包含的不只是一个物体,此时如果使用图像分类模型为图像分配一个单一标签其实是非常粗糙的,并不准确。对于这样的情况,就需要目标检测(object detection)模型,目标检测模型可以识别一张图片的多个物体,并可以定位出不同物体(给出边界框)。目标检测在很多场景有用,如无人驾驶和安防系统。

原文地址:https://www.cnblogs.com/zhaopengpeng/p/12268404.html

时间: 2024-10-11 05:19:12

计算机视觉领域的三大任务的相关文章

[转载]涉足计算机视觉领域要知道的

                   涉足计算机视觉领域要知道的 做 机器视觉和图像处理方面的研究工作,最重要的两个问题:其一是要把握住国际上最前沿的内容:其二是所作工作要具备很高的实用背景.解决第一个问题的办法就 是找出这个方向公认最高成就的几个超级专家(看看他们都在作什么)和最权威的出版物(阅读上面最新的文献),解决第二个问题的办法是你最好能够找到一个实 际应用的项目,边做边写文章. 做好这几点的途径之一就是利用网络资源,利用权威网站和专家们的个人主页. 依照下面目录整理:[1]研究群体(国

自己整理的计算机视觉领域稍微容易中的期刊(第一版)

自己整理的计算机视觉领域稍微容易中的期刊(第一版) 模式识别,计算机视觉领域,期刊 (1)pattern recognition letters, 从投稿到发表,一年半时间 (2)Pattern recognition 不好中,时间长 (3)IEICE Transactions on Information and Systems, 作者中有一个必须是会员.收费高,审稿快.影响因子0.4 (4)International Journal of Pattern Recognition and Ar

从CVPR 2014看计算机视觉领域的最新热点

编者按:2014年度计算机视觉方向的顶级会议CVPR上月落下帷幕.在这次大会中,微软亚洲研究院共有15篇论文入选.今年的CVPR上有哪些让人眼前一亮的研究,又反映出哪些趋势?来听赴美参加会议的微软亚洲研究院实习生胡哲的所见所闻. 作者:胡哲 微软亚洲研究院实习生 计算机视觉(Computer Vision)是近十几年来计算机科学中最热门的方向之一,而国际计算机视觉与模式识别大会(Conference on Computer Vision and Pattern Recognition,简称CVP

计算机视觉领域稍微容易中的期刊

模式识别,计算机视觉领域,期刊 (1)pattern recognition letters, 从投稿到发表,一年半时间 (2)Pattern recognition 不好中,时间长 (3)IEICE Transactions on Information and Systems, 作者中有一个必须是会员.收费高,审稿快.影响因子0.4 (4)International Journal of Pattern Recognition and Artificial Intelligence , 审稿

paper 61:计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接

转载出处:blog.csdn.net/carson2005 以下链接是本人整理的关于计算机视觉(ComputerVision, CV)相关领域的网站链接,其中有CV牛人的主页,CV研究小组的主页,CV领域的paper,代码,CV领域的最新动态,国内的应用情况等等.打算从事这个行业或者刚入门的朋友可以多关注这些网站,多了解一些CV的具体应用.搞研究的朋友也可以从中了解到很多牛人的研究动态.招生情况等.总之,我认为,知识只有分享才能产生更大的价值,真诚希望下面的链接能对朋友们有所帮助.(1)goog

计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接

提示:本文为笔者原创,转载请注明出处:blog.csdn.net/carson2005 以下链接是本人整理的关于计算机视觉(ComputerVision, CV)相关领域的网站链接,其中有CV牛人的主页,CV研究小组的主页,CV领域的paper,代码,CV领域的最新动态,国内的应用情况等等.打算从事这个行业或者刚入门的朋友可以多关注这些网站,多了解一些CV的具体应用.搞研究的朋友也可以从中了解到很多牛人的研究动态.招生情况等.总之,我认为,知识只有分享才能产生更大的价值,真诚希望下面的链接能对朋

计算机视觉领域的一些牛人博客,研究机构等的网站链接

以下链接是本人整理的关于计算机视觉(ComputerVision, CV)相关领域的网站链接,其中有CV牛人的主页,CV研究小组的主页,CV领域的paper,代码,CV领域的最新动态,国内的应用情况等等.打算从事这个行业或者刚入门的朋友可以多关注这些网站,多了解一些CV的具体应用.搞研究的朋友也可以从中了解到很多牛人的研究动态.招生情况等.总之,我认为,知识只有分享才能产生更大的价值,真诚希望下面的链接能对朋友们有所帮助. (1)googleResearch: http://research.g

计算机视觉领域常见的度量指标

一:Precision, Recall, F-score 信息检索.分类.识别.翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate------注意统计学习方法中precesion称为精确率,而准确率为accuracy 是分类正确的样本除以总样本的个数.),召回率也叫查全率,准确率也叫查准率,概念公式: 召回率(Recall)=  系统检索到的相关文件 / 系统所有相关的文件总数:::亦即预测为真实正例除以所有真实正例样本的个数           

格灵深瞳赵勇:计算机视觉在安防、交通、机器人、无人车等领域的应用

赵勇关注的领域主要按照它的产业规模和离现实的关系来综合进行考量 三年前,计算机视觉对于绝大部分人来说,都是一个非常陌生的名词.但是三年过去了,今天如果你身在科技互联网圈,如果你偶尔也会参加一些科技行业的大会,相信你一定对此不再陌生. 各大媒体举办的行业大会,其主题和内容的设定反映的基本就是一个行业的发展趋势.从两年前一些敢于创新的大会引入"人工智能"的讨论环节开始,到现在几乎所有的大会都必谈"人工智能",AI的产业化发展进入了一个井喷的阶段.这其中,最受关注的,就是