要想找到网页里那些图片和网页的内容相关绝不是一件容易的事,网页里有各式各样的图片,广告啦、推荐其他网页的缩略图啦、logo等等,可是在与网页相关的图片少之又少。
过去大家都觉得没必要有文字就足够了,可到了信息大爆炸的时代,面对海量网页,人们早已没有了兴趣。第一个不得不面临这个问题地是社交网站,人们除了自己发微博以外,更多的时候也许只在转微博、分享网页。如果有一张网页的缩略图,便有可能极大提高链接被点击的可能性,进而提高网站的活跃程度(当然这只是瞎想)。
也不是没可能从网页找到这样一张图片,这需要耗费很大的经历(占用很多CPU),并且不完美,不能保证找到的图片是100%正确。
于是FACEBOOK最为全球社交网络的老大,提出了开放图谱计划(Open Graph)。在网页的头部,额外加上<meta>标签,来传递网页的关键词、摘要等信息,其中也就包括了一张缩略图。
<meta property="og:type" content="article" /> <meta property="og:title" content="将出席博鳌亚洲论坛2015年年会" /> <meta property="og:description" content="将出席博鳌亚洲论坛2015年年会" /> <meta property="og:url" content="http://news.sina.com.cn/c/2015-03-19/175331624500.shtml" /> <meta property="og:image" content="" />
百科上的说明是这样子的
Open Graph通讯协定(Protocol)本身是一种制定一套Metatags的规格,用来标注你的页面,告诉我们你的网页代表哪一类型的现实世界物件。另 一伙伴网站,即Amazon旗下的Internet Movie Database(IMDb),将用这个Open Graph Protocol为每一部电影标注页面。按下IMDb上的“赞”按钮,就会自动把那部电影加入Facebook使用者profile中的“最爱的电影”。
Facebook已和Yahoo、Twitter合作采用OAuth 2.0认证标准。Graph API翻新了Facebook的平台程序代码,让Facebook里的每个物件都拥有独特的ID。通过Open Graph把其他社交网站建构的网络给连接起来,将创造一个更聪明、更与社交连接、更个人化也更具语意意识的网络。
虽然互联网没有国界,很遗憾的是,在中国加入开放图谱计划的,只有最具社交基因的新浪。这也就是说,在中国这种方式行不通。
这更能说明的是,如果你想要找的与网页相关的图片,网站在这方面绝不会配合你。每一个网站几乎都采用了完全不同的结构来展示文字和图片。如果想要找到一种终极解决方案就只能另寻它法了。