寻找与网页内容相关的图片(一) 开放图谱计划

要想找到网页里那些图片和网页的内容相关绝不是一件容易的事,网页里有各式各样的图片,广告啦、推荐其他网页的缩略图啦、logo等等,可是在与网页相关的图片少之又少。

过去大家都觉得没必要有文字就足够了,可到了信息大爆炸的时代,面对海量网页,人们早已没有了兴趣。第一个不得不面临这个问题地是社交网站,人们除了自己发微博以外,更多的时候也许只在转微博、分享网页。如果有一张网页的缩略图,便有可能极大提高链接被点击的可能性,进而提高网站的活跃程度(当然这只是瞎想)。

也不是没可能从网页找到这样一张图片,这需要耗费很大的经历(占用很多CPU),并且不完美,不能保证找到的图片是100%正确。

于是FACEBOOK最为全球社交网络的老大,提出了开放图谱计划(Open Graph)。在网页的头部,额外加上<meta>标签,来传递网页的关键词、摘要等信息,其中也就包括了一张缩略图。

<meta property="og:type" content="article" />
<meta property="og:title" content="将出席博鳌亚洲论坛2015年年会" />
<meta property="og:description" content="将出席博鳌亚洲论坛2015年年会" />
<meta property="og:url" content="http://news.sina.com.cn/c/2015-03-19/175331624500.shtml" />
<meta property="og:image" content="" />

百科上的说明是这样子的

Open Graph通讯协定(Protocol)本身是一种制定一套Metatags的规格,用来标注你的页面,告诉我们你的网页代表哪一类型的现实世界物件。另 一伙伴网站,即Amazon旗下的Internet Movie Database(IMDb),将用这个Open Graph Protocol为每一部电影标注页面。按下IMDb上的“赞”按钮,就会自动把那部电影加入Facebook使用者profile中的“最爱的电影”。

Facebook已和Yahoo、Twitter合作采用OAuth 2.0认证标准。Graph API翻新了Facebook的平台程序代码,让Facebook里的每个物件都拥有独特的ID。通过Open Graph把其他社交网站建构的网络给连接起来,将创造一个更聪明、更与社交连接、更个人化也更具语意意识的网络。

虽然互联网没有国界,很遗憾的是,在中国加入开放图谱计划的,只有最具社交基因的新浪。这也就是说,在中国这种方式行不通。

这更能说明的是,如果你想要找的与网页相关的图片,网站在这方面绝不会配合你。每一个网站几乎都采用了完全不同的结构来展示文字和图片。如果想要找到一种终极解决方案就只能另寻它法了。

时间: 2024-12-29 11:33:36

寻找与网页内容相关的图片(一) 开放图谱计划的相关文章

寻找与网页内容相关的图片(二)reddit的做法

正如前文所述,内容聚合网站,比如新浪微博.推特.facebook等网站对于网页的缩略图是刚需.为了让分享的内容引人入胜,网页的图片缩略图是必不可少的.年轻人的聚集地.社交新闻网站reddit也是一个这样的网站,由于他们将自己网站的源代码在github上开源,我便很容易了解他们的做法. 寻找网页图片缩略图的算法,可以在这里找到:https://github.com/reddit/reddit/blob/0fbea80d45c4ce35e50ae6f8b42e5e60d79743ca/r2/r2/l

图片开发接口-美女图片API开放接口

天狗开放阅图 是基于开源的 TngouFS-天狗文件系统而独立运维的图片系统,为广大的开发者提供一点小小的爱好, 相关接口 图片API列表 API 描述 基础 www.tngou.net/tnfs/api/classify 取得热点图片分类,可以通过分类id取得图片列表 重要 www.tngou.net/tnfs/api/list 取得图片列表,也可以用分类id作为参数 一般 www.tngou.net/tnfs/api/news 取得最新的图片,通过id取得大于该id的图片 如果你是APP的开

uiimage相关问题(图片拉伸)

UIImage *backgroundImage= [UIImage imageNamed:@"bg_headimage"]; //图片拉伸 UIImage *newImage=[backgroundImage resizableImageWithCapInsets:UIEdgeInsetsMake(10, 10, 10, 10) resizingMode:UIImageResizingModeStretch]; UIImageView *backGroundImageView=[[U

【MFC相关】图片显示

CPaintDC dc(this); if (!m_hBitmap) return; image.Attach(m_hBitmap); CRect rect; GetClientRect(&rect);//获得控件所在的矩形区域 int width = rect.Width(); int height = rect.Height(); //...... CDC mDC; mDC.CreateCompatibleDC(&dc); CBitmap b; b.CreateCompatibleBi

利用机器学习算法寻找网页的缩略图

博客中的文章均为meelo原创,请务必以链接形式注明本文地址 描述一个网页 现在的世界处于一个信息爆炸的时代.微信.微博.新闻网站,每天人们在大海捞针的信息海洋里挑选自己感兴趣的信息.我们是如何判断哪条信息可能会感兴趣?回想一下,你会发现是标题.摘要和缩略图.通过标题.摘要和缩略图,就能够很好地猜测到网页的内容.打开百度搜索引擎,随便搜索一个关键字,每一条搜索结果也正是这三要素构成的. 那么一个自然的问题是搜索引擎是如何找到网页的标题.摘要和缩略图的呢. 寻找网页的标题其实是一个非常简单的问题.

怎么使用树莓派和 iPad Pro 备份图片

导读 我在很长的时间内一直在寻找一个旅行中备份图片的理想方法,把 SD 卡放进你的相机包会让你暴露在太多的风险之中:SD 卡可能丢失或者被盗,数据可能损坏或者在传输过程中失败. 介绍 比较好的一个选择是复制到另外一个介质中,即使它也是个 SD 卡,并且将它放到一个比较安全的地方去,备份到远端也是一个可行的办法,但是如果去了一个没有网络的地方就不太可行了. 我理想的备份步骤需要下面的工具: 用一台 iPad pro 而不是一台笔记本.我喜欢轻装旅行,我的大部分旅程都是商务相关的(而不是拍摄休闲的)

数字图像处理中一张常用图片

在数字图像处理中,Lena(Lenna)是一张被广泛使用的标准图片,特别在图像压缩的算法研究中. (为什么用这幅图,是因为这图的各个频段的能量都很丰富:即有低频(光滑的皮肤),也有高频(帽子上的羽毛),很适合来验证各种算法)       然而,这张图片背后的故事是颇有意思的,很多人都抱有学究都是呆子的看法,然而Lena对此就是一个有力的驳斥.lena(lenna)是一张于1972年11月出版的Playboy的中间插页,在这期杂志中使用了“Lenna”的拼写,而实际莉娜在瑞典语中的拼写是“lena

项目笔记---CSharp图片处理

原文:项目笔记---CSharp图片处理 最近由于项目上需要对图片进行二值化处理,就学习了相关的图片处理上的知识,从开始的二值化的意义到动态阀值检测二值化等等,并用C#得以应用,学到了很多的知识和大家分享下我个人的经验,希望对大家有帮助. 二值化 二值化简而言之是对一副彩色图片进行0/1运算,最终显示一副黑白相间的图片,其意义多数在于对二值化处理后的图片进行分割识别,一些自动识别的验证码工具大多是先进行二值化,然后在模式识别,最终推断出验证码:我的项目中是由于硬件只支持黑色和白色,所以要对用户的

十个jQuery图片画廊插件推荐

jQuery的画廊插件可以将分组图像和多媒体资料转成类似Flash的图像或照片.当幻灯片已经成为网站的重要组成部分,jQuery的重要性不能被忽视.下面为你介绍了10个最有美感,创新性和创造性的jQuery图片画廊插件: 1.How to Create a Simple Slideshow using Mootools / JQuery 当我们想要在有限的屏幕空间展示很多内容,这要使用到幻灯片.幻灯片是最佳的可以展现大量的信息的方式.在这篇文章中我将展示使用MooTools / Jquery做出