机器学习（2）自动生成图片描述

近年来很多机器学习研究者开始尝试从图片中挖掘信息，自动生成该图片的描述：

Google Research 在2011年发布正在开发的新技术，声称能侦察图片，再为图片作出文字描述：该新技术结合了计算机视觉技术（computer vision）和自然语言处理（natural language processing），先以卷积神经网络（Convolutional Neural Network，CNN）技术对影像进行分析，提取影像中的信息，再由递归神经网络（Recurrent Neural Network，RNN）产生文字。

这项工作在2010年以后就已经开始有人研究：

第一篇是CMUAbhinav Gupta的CVPR2009的Oral《Understanding Videos, Constructing Plots - Learning a Visually Grounded Storyline Model from Annotated Videos》通过AND-OR的图模型来叙述视频里面正在发生的运动的各个动作。

第二篇是UIUC的Ali Farhadi写的，发在ECCV2010的poster《Every Picture Tells a Story: Generating Sentences for Images》：通过建立图像到已经人工标记的句子的连线，来给图像标注句子。

第三篇是《Corpus-Guided Sentence Generation of Natural Images》，使用语料集增强系统功能，基本处理步骤：

　　（1 ）从图片中提取object

　　（2 ）利用corpus提取出verbs，scenes，prepositions (Syntactic information)

　　（3 ）利用HMM计算最可能出现的object，verb，scene，preposition

　　（4） Generate sentence

Reference:

http://info.xitek.com/news/201411/20-165409.html

http://www.zhizhihu.com/html/y2011/2935.html

时间： 2024-08-03 11:28:35

机器学习（2）自动生成图片描述的相关文章

2020.01.11 【ABAP随笔】SM30常见增强操作-自动带描述等

1. 自动带出描述类型(更新回数据库) 我们使用的是在SM30中自动带出销售订单类型的描述首先我们创建一张表和一个维护视图(维护视图的好处就是可以方便增加字段),维护视图中维护标记为R标识字段不可输入然后需求就是根据填入的销售订单号,去TVAKT中抓取描述,给context字段我们根据维护视图创建表维护生成器: 函数组名称为ZVJXZHU_FG_01 接着进入到函数组ZVJXZHU_FG_01界面下: 为了防止维护程序的时候出现空的VBELN,所有我们进入到9000屏幕布局页面将VB

Apache 文件不存在跳转URL（实现指定尺寸的图片不存在，就自动生成图片）

前言在做很多系统的时候,我们可能都有这样的需求: 在CMS中只维护一张图片,而这张图片在网站的很多地方都需要显示,而且显示的大小不同. 一般做法就是直接使用这张图片,在不同的地方使用 width 和 height 设定图片的显示大小. 场景需求一般情况下这样做其实就可以了.如下这个场景,如果通过这样做,可能就不太合适了. 场景:CMS 有个海报管理功能,每个大的海报都是一张 1000*2000px 的图片,而且对海报的清晰度有一定的要求,质量不能太差,假定一个海报有 1MB. 然后在网站上有

基于python机器学习人脸自动补全

import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression,Ridge,Lasso from sklearn.neighbors import KNeighborsRegressor from sklearn.ensemble import ExtraTreesRegressor from sklearn.datasets import fetch_oli

如何自动生成图片用于测试 pytorch（No image? No need image）

if __name__ == '__main__': module = CAM_Module() in_data = torch.randint(0, 255, (2, 3, 7, 7), dtype=torch.float32) 原文地址:https://www.cnblogs.com/ziytong/p/10686055.html

机器学习那些事 (转)

原文为发表于Communications of the ACM 2012年第10期的“A Few Useful Things to Know About Machine Learning”,虽然发表于2012年,但是作者提出的观点对于今天仍有很多借鉴意义. 作者:佩德罗·多明戈斯(Pedro Domingos) 译者:刘知远机器学习系统自动地从数据中学习程序.与手工编程相比,这非常吸引人.在过去的 20 年中,机器学习已经迅速地在计算机科学等领域普及.机器学习被用于网络搜索.垃圾邮件过滤.推荐

转载-机器学习那些事

[原题]A Few Useful Things to Know About Machine Learning [译题]机器学习的那些事 [作者]Pedro Domingos [译者]刘知远 [说明]译文载于<中国计算机学会通讯> 第 8 卷第 11 期 2012 年 11 月 ,本文译自Communications of the ACM 2012年第10期的“A Few Useful Things to Know About Machine Learning”一文. 机器学习系统自动地从数据

[转] 机器学习那些事儿

原文为发表于Communications of the ACM 2012年第10期的“A Few Useful Things to Know About Machine Learning”,虽然发表于2012年,但是作者提出的观点对于今天仍有很多借鉴意义. 作者:佩德罗·多明戈斯(Pedro Domingos)译者:刘知远机器学习系统自动地从数据中学习程序.与手工编程相比,这非常吸引人.在过去的 20 年中,机器学习已经迅速地在计算机科学等领域普及.机器学习被用于网络搜索.垃圾邮件过滤.推荐系

机器学习-贝叶斯算法

0. 前言这是一篇关于贝叶斯方法的科普文,我会尽量少用公式,多用平白的语言叙述,多举实际例子.更严格的公式和计算我会在相应的地方注明参考资料.贝叶斯方法被证明是非常 general 且强大的推理框架,文中你会看到很多有趣的应用. 1. 历史托马斯·贝叶斯(Thomas Bayes)同学的详细生平在这里.以下摘一段 wikipedia 上的简介: 所谓的贝叶斯方法源于他生前为解决一个"逆概"问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的.在贝叶斯写这篇文章之前,人们

使用compass自动拼css sprite

使用compass自动拼css sprite css sprite (css 雪碧)又叫css精灵,是一种图片拼合技术.多用在图标上,把几个图标拼成一个图片,页面加载的时候只需要load拼好的图片,然后使用background-position配合width.height来显示不同的图标.这样做可以减少页面请求数.但是,想想把一个个图标从psd上扣下来,合到一个图上,然后还要慢慢算background-position,这也真是醉了,而且后期如果改了图标,又要重新拼一次,拼完再算一次backgr

猜你喜欢

SaltStack使用教程（六）：管理服务妙用pillar实现centos6和centos7通配

随着centos7的不断稳定和新的特性吸引,公司慢慢开始用centos6向centos7迁移.因为早起写了很多专用于centos6的sls最近抽时间把一部分地方进行了修改,例如centos6的mysq ...

017: class, objects and instance: class method

类的方法所谓类的方法,也就是,这个方法会绑定到一个类上面,实例化一个instance的时候,这个方法不会再重新生成一份,它只有访问类级别的变量它用@classmethod标签来标注这是一个cla ...

html5学习（1）

1.aside标签用于展示文章相关的附加内容,它是放置有关链接,术语表或者引文的最佳场所. 2.使用<meter>元素实现进度条. <meter id="pledge_go ...

DX10引擎计划0313（附带资料推介）

今天总算吸收掉了拾取部分.也完成了许多许多杂项,最让我感到自豪的是完成了灵活的物体链表,可以咋任何时候.任意增删改物体.这个的机理很简单,就是增加了一个标识变量,说明物体有没有灭亡,处理方法上类似于P ...

android PopupWindow与键盘

一些表示方式键盘高度:keyboardHeight; 屏幕高度:screenHeight; popupwindow高度:popHeight; popupwindow距离屏顶:popTop; 第 ...

javascript 获取页面高度（多种浏览器）（转）

关于获取各种浏览器可见窗口大小的一点点研究 <script> function getInfo() { var s = ""; s += " 网页可见区域宽: ...

第一个Sprint冲刺第十天

组长:李咏江,组员:叶煜稳,谢洪跃,周伟雄进程:我们把四则运算分为三个难度:简单,中等,困难.简单难度的是两个数加减乘除运算,中等的是三个数混合加减乘除运算,困难难度的是三个数以上含分数,小树加减乘 ...

【bzoj1221】[HNOI2001] 软件开发费用流

题目描述某软件公司正在规划一项n天的软件开发计划,根据开发计划第i天需要ni个软件开发人员,为了提高软件开发人员的效率,公司给软件人员提供了很多的服务,其中一项服务就是要为每个开发人员每天提供一块消 ...

KVM之Live Migration

1.安装KVM必要的软件包 #sudo apt-get install qemu-kvm bridge-utilus 2.制作虚拟机映像ubuntu-12.04.qcow2 $qemu-img cre ...

Android -- 下载进度条(只要有网址就行)

https://github.com/giantray/stackoverflow-java-top-qa/blob/master/contents/download-a-file-with-andr ...

ubuntu14中创建python虚拟环境

一.安装python-virtualenv包 sudo apt-get install virtualenv 安装完成后,创建一个虚拟环境文件夹. mkdir VENVcd VENV 创建虚拟环境,纯 ...

Application中的路径

前提项目工程目录:E:/Work/cosmosbox/cb-client/ 我电脑当前的用户名:qingqing PersistentDataPath Application.persistentD ...

香港opencart云服务器空间(HK5000型)

香港opencart云服务器空间(HK5000型) 香港opencart云服务器空间(HK5000型) 2 评价 | 如果您对本商品有什么问题或经验,请在此留下您的意见和建议! 型号: HK ...

MySQL concat函数的使用

MySQL concat函数是MySQL数据库中众多的函数之一,下文将对MySQL concat函数的语法和使用进行说明,供您参考和学习. MySQL concat函数使用方法: CONCAT(str ...

【VB6笔记-01】读取Excel绑定到DataGrid

Private Sub cmdOpen_Click() CommonDialog1.Filter = "Excel???t(*.xlsx)|*.xlsx" CommonDialog ...

php时间格式转换

php时间格式的转换函数有date(),strtotime()函数,php 原生的时间类也可以转换时间格式. 1.Y-m-d转换为时间戳例:2017-08-22 转化为时间戳 strtot ...

控制uniFrame显示的一个管理类

利用uniGUI Frame的机制来搭建项目,是非常好的实现方式,uniGUI的主要Demo就是用这种方式来实现的.对此,我实现了一个类,来管理Frame的显示. unit FrameMgn; int ...

TCP三次握手连接与四次握手断开

http://blog.csdn.net/whuslei/article/details/6667471(三次握手与四次握手) 1. TCP的三次握手最主要是防止已过期的连接再次传到被连接的主机. 如 ...

Linux 部署ASP.NET SQLite 应用的坎坷之旅附demo及源码

Linux 部署ASP.NET SQLite 应用的坎坷之旅.文章底部附示例代码. 有一台闲置的Linux VPS,尝试着部署一下.NET 程序,结果就踏上了坑之路,不过最后算是完美解决问题,遂记 ...

【前端笔记】? Bootstrap

Bootstrap框架: 里面封装了很多组件.字体图标.和标签常用的一些样式.我们直接使用即可. 下载地址: http://www.bootcss.com/ 包下载地址(用于生产环境的 Bootstr ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.