机器学习(2) 自动生成图片描述

近年来很多机器学习研究者开始尝试从图片中挖掘信息,自动生成该图片的描述:

Google Research 在2011年发布正在开发的新技术,声称能侦察图片,再为图片作出文字描述:该新技术结合了计算机视觉技术(computer vision)和自然语言处理(natural language processing),先以卷积神经网络(Convolutional Neural Network,CNN)技术对影像进行分析,提取影像中的信息,再由递归神经网络(Recurrent Neural Network,RNN)产生文字。

这项工作在2010年以后就已经开始有人研究:

第一篇是CMUAbhinav Gupta的CVPR2009的Oral《Understanding Videos, Constructing Plots - Learning a Visually Grounded Storyline Model from Annotated Videos》通过AND-OR的图模型来叙述视频里面正在发生的运动的各个动作。

第二篇是UIUC的Ali Farhadi写的,发在ECCV2010的poster《Every Picture Tells a Story: Generating Sentences for Images》:通过建立图像到已经人工标记的句子的连线,来给图像标注句子。

第三篇是《Corpus-Guided Sentence Generation of Natural Images》,使用语料集增强系统功能,基本处理步骤:

  (1 )从图片中提取object

  (2 )利用corpus提取出verbs,scenes,prepositions (Syntactic information)

  (3 )利用HMM计算最可能出现的object,verb,scene,preposition

  (4) Generate sentence

Reference:

http://info.xitek.com/news/201411/20-165409.html

http://www.zhizhihu.com/html/y2011/2935.html

时间: 2024-08-03 11:28:35

机器学习(2) 自动生成图片描述的相关文章

2020.01.11 【ABAP随笔】SM30常见增强操作-自动带描述等

1.    自动带出描述类型(更新回数据库) 我们使用的是在SM30中自动带出销售订单类型的描述 首先我们创建一张表和一个维护视图(维护视图的好处就是可以方便增加字段),维护视图中维护标记为R标识字段不可输入 然后需求就是根据填入的销售订单号,去TVAKT中抓取描述,给context字段 我们根据维护视图创建表维护生成器: 函数组名称为ZVJXZHU_FG_01 接着进入到函数组ZVJXZHU_FG_01界面下: 为了防止维护程序的时候出现空的VBELN,所有我们进入到9000屏幕布局页面将VB

Apache 文件不存在跳转URL(实现指定尺寸的图片不存在,就自动生成图片)

前言 在做很多系统的时候,我们可能都有这样的需求: 在CMS中只维护一张图片,而这张图片在网站的很多地方都需要显示,而且显示的大小不同. 一般做法就是直接使用这张图片,在不同的地方使用 width 和 height 设定图片的显示大小. 场景需求 一般情况下这样做其实就可以了.如下这个场景,如果通过这样做,可能就不太合适了. 场景:CMS 有个海报管理功能,每个大的海报都是一张 1000*2000px 的图片,而且对海报的清晰度有一定的要求,质量不能太差,假定一个海报有 1MB. 然后在网站上有

基于python机器学习人脸自动补全

import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression,Ridge,Lasso from sklearn.neighbors import KNeighborsRegressor from sklearn.ensemble import ExtraTreesRegressor from sklearn.datasets import fetch_oli

如何自动生成图片用于测试 pytorch(No image? No need image)

if __name__ == '__main__': module = CAM_Module() in_data = torch.randint(0, 255, (2, 3, 7, 7), dtype=torch.float32) 原文地址:https://www.cnblogs.com/ziytong/p/10686055.html

机器学习那些事 (转)

原文为发表于Communications of the ACM 2012年第10期的“A Few Useful Things to Know About Machine Learning”,虽然发表于2012年,但是作者提出的观点对于今天仍有很多借鉴意义. 作者:佩德罗·多明戈斯(Pedro Domingos) 译者:刘知远 机器学习系统自动地从数据中学习程序.与手工编程相比,这非常吸引人.在过去的 20 年中,机器学习已经迅速地在计算机科学等领域普及.机器学习被用于网络搜索.垃圾邮件过滤.推荐

转载-机器学习那些事

[原题]A Few Useful Things to Know About Machine Learning [译题]机器学习的那些事 [作者]Pedro Domingos [译者]刘知远 [说明]译文载于<中国计算机学会通讯> 第 8 卷 第 11 期 2012 年 11 月 ,本文译自Communications of the ACM 2012年第10期的“A Few Useful Things to Know About Machine Learning”一文. 机器学习系统自动地从数据

[转] 机器学习那些事儿

原文为发表于Communications of the ACM 2012年第10期的“A Few Useful Things to Know About Machine Learning”,虽然发表于2012年,但是作者提出的观点对于今天仍有很多借鉴意义. 作者:佩德罗·多明戈斯(Pedro Domingos)译者:刘知远 机器学习系统自动地从数据中学习程序.与手工编程相比,这非常吸引人.在过去的 20 年中,机器学习已经迅速地在计算机科学等领域普及.机器学习被用于网络搜索.垃圾邮件过滤.推荐系

机器学习-贝叶斯算法

0. 前言 这是一篇关于贝叶斯方法的科普文,我会尽量少用公式,多用平白的语言叙述,多举实际例子.更严格的公式和计算我会在相应的地方注明参考资料.贝叶斯方法被证明是非常 general 且强大的推理框架,文中你会看到很多有趣的应用. 1. 历史 托马斯·贝叶斯(Thomas Bayes)同学的详细生平在这里.以下摘一段 wikipedia 上的简介: 所谓的贝叶斯方法源于他生前为解决一个"逆概"问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的.在贝叶斯写这篇文章之前,人们

使用compass自动拼css sprite

使用compass自动拼css sprite css sprite (css 雪碧)又叫css精灵,是一种图片拼合技术.多用在图标上,把几个图标拼成一个图片,页面加载的时候只需要load拼好的图片,然后使用background-position配合width.height来显示不同的图标.这样做可以减少页面请求数.但是,想想把一个个图标从psd上扣下来,合到一个图上,然后还要慢慢算background-position,这也真是醉了,而且后期如果改了图标,又要重新拼一次,拼完再算一次backgr