读“图”智慧:大数据“画像”的应用未来

  互联网的内容主流,已经出现从文字转向图片的趋势,这标志着互联网已经进入“读图时代”。在“读图时代”的大背景下,图像中的海量非结构化数据的挖掘成为价值潜力的集聚地,如何挖掘其中隐藏的用户“密码”,成为大数据“落地”遇到的一大挑战。

  图片大数据挖掘,主要目标是从中提取出图片的自身特征,包括语义、质量、关联度、实体义项等。由于在互联网的推动下,信息载体和用户交流媒介已经从文字转变到了图片,图片的便捷性,使得网站与用户之间的互动更加频繁,而图片的交互输入与展现,也让数据的展现更加直观。

  随着图片数据规模的增大,万亿量级的数据对算法的效率提出了更高要求,这不仅仅需要数据结构方面的优化,而且需要对数据的形态进行更深入的把 握,以往那些以结构化为主的数据形式,不再能满足图像分析所需,面向知识本身的数据模型逐步建立起来,这些模型能够支持支持用户的任务与决策支持购物、决 策,还可以支持数据自动与其任务标的、属性相结合,对图像背后隐藏的需求进行挖掘,并通过与周边环境信息进行关联计算,形成完整的大数据“画像”系统。

  另外,为了避免图片质量的良莠不齐,人工智能计算的引入,将为图片大数据分析带来自动预测和计算图片质量的能力。这一基于图像的大数据“画像”能力,在谷歌的Gmail中率先得到了应用。

  日前,谷歌利用数据库技术打击Gmail邮寄儿童色情图片的行动获得了成效,一名休斯敦男子在企图利用Gmail邮寄儿童色情图片时被警方逮捕,而通知警察的正是他的邮件服务提供商谷歌。谷歌希望利用这种技术与政府合作,防止犯罪,并降低犯罪率。

  据称,谷歌的这项数据库技术主要是通过对出现在网络上的儿童色情图片进行扫描,每一张图片都将拥有一个独特的数字ID,就如同指纹一样。而如果 谷歌在用户的Gmail邮件中发现可疑的儿童色情图片,就会比对图片“指纹”,通过人工审核之后提交给相关部门,例如警方之类。

  除了线上的应用之外,大数据图像挖掘技术在线下一样有着广阔的前景,这最明显体现就在城市管理和交通优化方面。

  通过对交通拥堵建立模型,我们不仅可以对整个城市交通的状况做实时监测,并发布交通的拥堵状况,还可以对一个城市交通可能会发生的大面积的交通 瘫痪作出提前预测。目前的城市交通路况信息还只是采集技术,告诉你现在堵和不堵。而更公众更关心的是,到底什么时间走,到底多长时间能够到达,到达之后会 不会又堵了?到底要花费多长时间,甚至我要产生多少能耗,我要花多少油钱,基于这些,进而引导公众的出行,真正实现绿色交通。如此,在交通诱导服务的基础 上,就可以实现城市交通的优化配置。

  另外,参照交通优化模型,还可以开发城市环境模型,对持续的城市雾霾给出一个明确的发生原因,以便做出实时监测和应对。例如,可以通过监测到任 何一个路段,任何一个区域或者全市实时监测,在这个时间里面所有车辆碳排放的情况,结合交通系统进行综合优化,用技术来引导公众出行,跟信息服务结合起 来,综合促进智慧城市的形成。

  尽管目前线上线下的图片数据信息已经极大丰富,但我们对图像中所蕴藏数据价值的探索,还处于初级阶段,不论是互联网方面的信息服务,还是线下结 合物联网的服务,未来的应用前景都非常广阔。可以说相关技术已渐成熟,但是普及尚需一段时间。当前的主要问题不是技术方面,而是如何应用这些技术、将技术 与相关需求有效结合。在这方面,需要综合性的跨产业支持策略和智慧协作,才能够切实推动。

读“图”智慧:大数据“画像”的应用未来

时间: 2024-10-09 19:22:56

读“图”智慧:大数据“画像”的应用未来的相关文章

如何让热点图支持大数据

所谓的热点图,是图1)构建一张灰度图,图2)在每个热点的位置上绘制并叠加形成灰色的热点图,图3)根据颜色表生成热点图.不难看出,最核心的是图2的过程.详情参考<可视化之热点图>. 图1 图2&图3 ? 1强调两处细节 这种思路效率高,缺点就是不够灵活,每个点都是同一个样式,没有考虑该点的半径和权重.创建大小不一的模版(章),每个热点根据自己的半径值选择对应的章就可以,实现思路如下: 半径&模版 权重的不同,是通过盖章的"力度",权重越大,不透明度越大,这样叠

图表推荐:甘特图与框架图,大数据流向地图重磅来袭!

帆软图表(新特性)最新版本的图表插件新增了甘特图与框架图两种图表类型,大大方便了生产管理所需,同时支持流向地图的大数据模式. 一.甘特图 甘特图又称任务计划进度图,其通常用来表示项目进展随着时间进度的变化.甘特图被广泛的应用在各行业的项目管理中,因此帆软在最新的图表插件中,新增了该图表类型,以满足任务进度可视化的需求. FineReport新甘特图功能扩展十分强大,能够满足多层级项目所需以及多系列任务:支持各个任务的里程碑设置.进度管理等:包含四种任务关联线 (开始-完成,开始-开始,完成-开始

用数字读懂一切 大数据的世界

自20世纪90年代初以来,数字技术已从根本上改变了我们的生活方式.如今,我们即将开始全面转型——将所有以模拟形式记录的人类知识,转换为数字形式.<未来之窗>带您一起回首往昔,畅想未来. 楚泽(Zuse).欧洲核子研究中心(CERN)和扎克伯格(Zuckerberg)——这三个名字标志着数字革命进程中的重要里程碑. 早在1941年,Konrad Zuse在柏林研制出了世界上第一台可以正常工作的计算机.他称这台外形庞大的数字计算机器为“Zuse Z3”.1991年,就职于瑞士欧洲核子研究中心的Ti

一文读懂工业大数据 (转)

无论是欧美老牌国家制造业的重振,还是中国制造业的转型提升,工业大数据都将发挥不可替代的作用. 当前,全球主要国家掀起了新一轮以“信息技术与制造业融合”为共同特征的工业革命,加速发展新一代信息技术,并推动其与全球工业系统的深入融合,以期抢占新一轮产业竞争的制高点.无论是欧美老牌国家制造业的重振,还是中国制造业的转型提升,工业大数据都将发挥不可替代的作用. 何为工业大数据 工业大数据是指在工业领域中,围绕典型智能制造模式,从客户需求到销售.订单.计划.研发.设计.工艺.制造.采购.供应.库存.发货和

大数据和AI的未来畅想

<今日简史> 1.   10大趋势决定了未来10年的生存发展. 库兹韦尔提出"吓尿指数",是说一个人渠道未来的多久之后会被吓尿?随着科技飞速发展,吓尿指数越来越小.以前需要经历1000年发生的翻天覆地的变化,现在可能需要几百年,甚至几十年就可以完成.未来学家雷·库兹韦尔认为,人类在21世纪的进步讲师20世纪的1000倍,下一个吓尿指数可能是几十年甚至更短. 观点1 数据是21世纪最价值连城的资产 数据巨头(百度.腾讯.谷歌.facebook脸书)评估APP和产品已经不是能赚

一篇文章为你解读大数据的现在和未来

大数据的发展前提 关于大数据的概念其实在1998年已经就有人提出了,但是到了现在才开始有所发展,这些其实都是和当下移动互联网的快速发展分不开的,移动互联网的高速发展,为大数据的产生提供了更多的产生大数据的硬件前提,比如说智能手机,智能硬件,车联网,pda等数据的产生终端.这些智能通过移动通信技术和人们的生活紧密的结合在一起,在人流.车流的背后产生了信息流,也就产生了大量的数据. 其次就是移动通信技术的快速发展,在2G时代,无线网速慢,数据产生也非常慢,数据体量也不够,所以还是无法形成大数据,而到

一篇文章为你解读大数据的如今和未来

大数据的发展前提 关于大数据的概念事实上在1998年已经就有人提出了,可是到了如今才開始有所发展,这些事实上都是和当下移动互联网的快速发展分不开的,移动互联网的快速发展,为大数据的产生提供了很多其它的产生大数据的硬件前提,比方说智能手机.智能硬件.车联网,pda等数据的产生终端.这些智能通过移动通信技术和人们的生活紧密的结合在一起.在人流.车流的背后产生了信息流,也就产生了大量的数据. 其次就是移动通信技术的高速发展,在2G时代,无线网速慢.数据产生也很慢.数据体量也不够.所以还是无法形成大数据

区块链与大数据的整合,未来必然趋势

大数据与区块链是当今最热门的两个话题,带动了一系列的投资热潮.不论是风投领域,还是传统的金融领域,只要有这两个关键词出现,往往能让企业获得特别的关注.这也说明了这两个词在当今社会的火爆程度. 各个维度对 区块链 进行了详细阐述,那么大数据又是什么呢?现在很多人都认为,大数据的本质是「大」.也就是说,它的数据量必须非常的广泛和巨大,可能是海量级的.其实这并不准确. 大数据所指的「大」其实更偏向于全,也就是尽可能地接近某个统计范畴内最全面的数据,甚至达到全数据的统计结果.只有这样才能真正实现大数据的

大数据究竟是什么?一篇文章让你认识并读懂大数据[转]

来源:互联网分析沙龙     日期:2013-11-10 在写这篇文章之前,我发现身边很多IT人对于这些热门的新技术.新趋势往往趋之若鹜却又很难说的透彻,如果你问他大数据和你有什么关系?估计很少能说出一二三来.究其原因,一是因为大家对新技术有着相同的原始渴求,至少知其然在聊天时不会显得很“土鳖”:二是在工作和生活环境中真正能参与实践大数据的案例实在太少了,所以大家没有必要花时间去知其所以然. 我希望有些不一样,所以对该如何去认识大数据进行了一番思索,包括查阅了资料,翻阅了最新的专业书籍,但我并不