《大数据分析中的计算智能研究现状与发展》—— 读后感

  《大数据分析中的计算智能研究现状与发展》这篇文章是郭平、王可、罗阿理、薛明志发于2015年11月发表于软件学报。

  该篇文章讨论了大数据分析中计算智能研究存在的问题和进一步的研究方向,阐述了数据源共享问题,并建议利用以天文学为代表的数据密集型基础科研领域的数据开展大数据分析研究。

   大数据和人工智能是现代计算机技术应用的重要分支,近年来这两个领域的研究相互交叉促进,产生了很多新的方法、应用和价值。大数据和人工智能具有天然的联系,大数据的发展本身使用了许多人工智能的理论和方法,人工智能也因大数据技术的发展步入了一个新的发展阶段,并反过来推动大数据的发展。

在阅读过程中,我的第一个问题:什么是大数据?

  这是一种文化基因(meme),一个营销术语,确实如此,不过也是技术领域发展趋势的一个概括,这一趋势打开了理解世界和制定决策的新办法之门。根据技术研究机构IDC的预计,大量新数据无时不刻不在涌现,它们以每年50%的速度在增长,或者说每两年就要翻一番多。并不仅仅是数据的洪流越来越大,而且全新的支流也会越来越多。比方说,现在全球就有无数的数字传感器依附在工业设备、汽车、电表和板条箱上。它们能够测定方位、运动、振动、温度、湿度、甚至大气中的化学变化,并可以通信。将这些通信传感器与计算智能连接在一起,你就能够看到所谓的物联网(Internet of Things)或者工业互联网(Industrial Internet)的崛起。对信息访问的改善也为大数据趋势推波助澜。 
大数据技术是继移动互联技术和云计算技术之后一项颠覆性的信息技术,它使得我们拥有了对一些数量巨大、种类繁多、价值密度极低、本身快速变化的数据有效和低成本存取、检索、分类、统计的能力。但这并不意味着我们今天能够有效和低成本地了解这些数据中蕴藏的巨大价值,尤其是这些数据中隐性的社会科学规律和经验所代表的巨大价值。所幸,人工智能领域的一些理论和比较实用的方法,已经开始用于大数据分析方面,并显现出初步令人振奋的结果。本文就大数据和人工智能未来发展的相互关系和潜力进行一些初步探讨。 
我们认为,人工智能领域的一些理论和比较实用的方法,能够显著和有效地提升我们所拥有的大数据的使用价值,与此同时,大数据技术的发展也将在为人工智能提供用武之地的同时,唤醒人工智能巨大的潜力,从而使这两个领域的技术和应用出现加速发展的趋势。     
  关于大数据技术和人工智能的应用 ,人工智能的应用域非常广泛,下面我将具体从几个方面进行说明: 
   机器人 
  目前机器人已经能在受控制的条件下进行一些自动化操作,比如汽车制造。不过让它们像人类一样做出复杂的行为仍旧十分困难。尽管如此,一些前沿机器人的表现还是令人惊叹,它们可以解放人类劳动力,从事一些更具创造性的工作。亚马逊的机器人大军就能林立的货架中取出物品交给人类。 
  研究人员正在训练机器人读取人类行为的信息,从而能在更复杂的项目上与人类合

作。人类和机器可以各发挥所长,人类更灵巧,而机器人的动作更精确。卡内基梅隆大学的专家David Bourne制作了一款机器人手臂,可以帮助汽车焊接。在测试中,机器人会告诉人类将各部件放在哪里,然后时行精确的焊接,对更复杂的任务,它会交给人类伙伴。

机器学习 
它是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论等多门学科。机器学习的目的是从数据中自动分析并获得规律,并利用规律对未知数据进行预测。目前机器学习已经广泛应用于我们的生活中,例如互联网搜索、垃圾邮件过滤、机器翻译、在线广告、手写识别等。然而机器学习本身也有硬伤,即容易过拟合和容易引起维数灾难(CurseofDimensionality)。而且经典的机器学习算法并不能真正表达“学习”的过程,无法产生具有确切现实意义的事物的概念,比如人脸识别,其实机器并没有得到“人脸”真正的实际意义,只是把人脸与其他事物区分开来。 
 
  大数据下的“精准”生活 
出门问问在谷歌眼镜上装置了第一款中文语音搜索应用,当你戴上这款眼镜时,你就能看到眼前出现“开始语音问答”字眼,然后你只需说出“附近有什么饭店”、“银行在哪里”„„眼镜上就会自动出现附近饭店、银行所在的位置等信息,然后你可以挑选一家,眼镜上接着出现路线导航„„ 
    出门问问创始人、首席执行官李志飞说,除了这些服务,更难得的是,人的语音有普通话、方言,还有带有各种口音的普通话。该中文语音搜索能利用大数据来理解各种场景和口音,进行智能化判断。此外,用户利用GPS传感器搜索导航、收听音乐等,每天会产生很多数据,服务器能收集数据并进行处理,在未来可为用户提供更智能、快捷服务。 
  通过搜索数据,拥堵景点、路线早知道     中国工程院院士、中国互联网协会理事长邬贺铨说,大数据在热点检索中也有很好的应用。如在长假前,很多人在网络上搜索旅游景点、旅店、火车与飞机航班信息等,由此可分析得出哪些旅游景点和交通路线会发生拥塞。如去年国庆节,九寨沟景点极度拥堵。该情况已引起有关部门的重视,一些省的旅游局已与百度达成协议,让百度通过搜索情况,提前预警哪些时候哪些地方会出现旅游拥堵。 
对零售商的贡献 
       沃尔玛和Kohl’s等世界著名的零售商,通过分析销售、定价和经济、人口、天气方面的数据来为特定的门店选择合适的产品,并确定降价的时机。物流公司,如UPS,挖掘货车交付时间和交通模式方面的数据以调整路线。 
     全球最大的传统零售业巨头,沃尔玛自然不会忽略现在如日中天的移动互联网浪潮。在其收购了一系列电商创业公司之后,沃尔玛实验室试图通过大数据挖掘技术来改变现在的电子商务市场。 
        据沃尔玛全球电子商务总监Stephen O’Sullivan介绍,沃尔玛实验室计划将这家零售业巨头的10个不同的网站整合成一个,同时将一个10个节点的Hadoop集群扩展到250个节点的Hadoop集群。目前实验室正在设计几个能将当前像Oracle、Neteeza这样的开放资源的数据库进行迁移、整合的工具。 
       而这次开发大数据挖掘工具,是因为O’Sullivan和他的团队在大数据整

合过程中碰到了一些麻烦,同时发现目前适用于开源大数据的工具较少。所以计划自行开发一些适合开源数据库的大数据整合分析工具,未来还会将这些工具的源代码进行开放,为更多从事大数据挖掘的人士提供帮助。         在此之前,沃尔玛曾进行了一系列的收购。包括3亿美元收购的Kosmix(沃尔玛实验室前身)、OneRiot、Small Society、Social Calenda、Set Direction、Grabble等多家中小型创业公司。这些创业公司无一例外的要么精于数据挖掘和各种算法、要么在移动社交领域有其专长,这些都是沃尔玛进军移动互联网的重要力量。 
     而沃尔玛这个零售商巨头企业不仅在大数据挖掘方面投入较大,在具体销售过程中也有自己的特色,比如我们耳熟能详的啤酒尿布的故事就是该企业通过大数据挖掘以后得出的结论,他们在这样的搭配销售中尝到了甜头,由此也证实了大数据挖掘的必要性。 
     作为一家传统的零售业企业,能够在移动互联网和大数据挖掘上投入如此多的财力物力,说明沃尔玛已经看到了未来大数据的重要性。而在沃尔玛的带领下,相信未来传统企业也会更快的踏入大数据时代。      购物   
    传感数据,精准找到最佳顾客    
      大数据还能精准针对顾客来投放广告。邬贺铨举例说,美国超市的最好顾客是女性顾客,特别是孕妇。超市发现,孕妇会关注或购买一些没有刺激性的化妆品,还关心婴幼儿用品。但关心不等于购买,超市无法从购物数据上找到这些最佳顾客。那该怎么办呢?     于是,超市在推车上安装GPS和传感器,只要顾客在没有刺激性化妆品或婴幼儿用品柜台前站立时间长,尽管不购买这些商品,但超市也知道哪些顾客在关注这些商品,进而判断该顾客是否是孕妇或准备怀孕,并把相应广告发送到这些顾客的手上。 
    “本来这个事情进展得很顺利,结果《纽约时报》刊登了一个顾客的投诉信,说超市把孕妇和婴儿广告发送到自己一个上初中女儿的手机里。第二天,超市在《纽约时报》上发了一封道歉信,说‘大数据也有搞错的时候’。时隔不久,又有一封信刊登在《纽约时报》上,顾客道歉说,‘我错怪超市了,我后来发现我女儿意外怀孕了’。”邬贺铨说。如此精准地找到顾客的情况,在我国也在进行中。时趣首席技术官张首华说,褚橙是云南特产橙类,以味甜著称,其售卖季节仅一个月。时趣通过大数据分析,提出了“励志”、“创业”等关键卖点信息,再筛选出一批喜欢在网上购买生鲜水果的微博用户,精准地把褚橙信息发送到这些用户的微博上。 
三.大数据和人工智能的发展前景 
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

虽然大数据目前在国内还处于初级阶段,但是商业价值已经显现出来。首先,手中握有数据的公司站在金矿上,基于数据交易即可产生很好的效益;其次,基于数据挖掘会有很多商业模式诞生,定位角度不同,或侧重数据分析。比如帮企业做内部数据挖掘,或侧重优化,帮企业更精准找到用户,降低营销成本,提高企业销售率,增加利润。据统计,目前大数据所形成的市场规模在51亿美元左右,而到2017年,此数据预计会上涨到530亿美元。 
时至今日,包括IBM、HP、EMC、Oracle、微软、Intel、TeraData等的IT企业纷纷推出自己的大数据解决方案。大数据技术应用前景广阔,2012年大数据市场已经达到116亿美元。IDC预计,到2017年,大数据市场将到达470亿美元。   到目前为止,大数据技术已能够有效地对一些数量巨大、种类繁多、价值密度极低、本身快速变化的数据有效和低成本存取已有的人工智能技术已经能够使大数据的使用价值凸显出来,初步展现大数据的价值。 
建立具有真正意义的人工智能系统,是人类一直以来的梦想。面向大数据和人工智能的研究近来呈现出螺旋上升式发展态势,大数据时代的到来,赋予人工智能新的起点、新的使命和新的召唤。因此,在不久的将来,我们不难想象,大数据和人工智能领域的各种理论和方法,会有加速的发展趋势,从而史无前例地影响整个人类的发展进程。 
下面介绍大数据的四大发展趋势: 
 趋势一数据的资源化 
  何谓资源化,是指大数据成为企业和社会关注的重要战略资源,并已成为大家争相抢夺的新焦点。因而,企业必须要提前制定大数据营销战略计划,抢占市场先机。 
  趋势二:与云计算的深度结合 
  大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一。自2013年开始,大数据技术已开始和云计算技术紧密结合,预计未来两者关系将更为密切。除此之外,物联网、移动互联网等新兴计算形态,也将一齐助力大数据革命,让大数据营销发挥出更大的影响力。   趋势三:科学理论的突破

随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。   趋势四:数据科学和数据联盟的成立 
  未来,数据科学将成为一门专门的学科,被越来越多的人所认知。各大高校将设立专门的数据科学类专业,也会催生一批与之相关的新的就业岗位。与此同时,基于数据这个基础平台,也将建立起跨领域的数据共享平台,之后,数据共享将扩展到企业层面,并且成为未来产业的核心一环。 
  另外,大数据作为一种重要的战略资产,已经不同程度地渗透到每个行业领域和部门,其深度应用不仅有助于企业经营活动,还有利于推动国民经济发展。它对于推动信息产业创新、大数据存储管理挑战、改变经济社会管理面貌等方面也意义重大。 
  现在,通过数据的力量,用户希望掌握真正的便捷信息,从而让生活更有趣。对于企业来说,如何从海量数据中挖掘出可以有效利用的部分,并且用于品牌营销,才是企业制胜的法宝

时间: 2024-10-12 19:59:40

《大数据分析中的计算智能研究现状与发展》—— 读后感的相关文章

大道至简第五章读后感

第五章 失败的过程也是过程 今天照样老师带领着我们阅读了大道至简第五章,阅读了<大道至简>的第五章,这章在前面的基础上又进了一步,有了技术和团队,加上有效的沟通,接下来就要接项目做工程. “虚有其表耳”,本章以<明皇实录>中的一句话来告诉我们一个深刻的道理:不要只求外表,只做形象工程,而是要透过表象,力求实质. 失败了不要紧,没有失败也就找不到自己的不足,也就不会发现自己的问题,更不用谈改进了.我们的前辈们就是在不断的失败中才总结出了“瀑布模型”“螺旋模型”等模型,方便了我们.但是

大道至简 第五章读后感

第五章 失败的过程也是过程 以得失而论,在瀑布模型与RUP模型之间,学习前者而不成,可思过程的本质:学习后者而不成,可得文字的架子. 如果懂得了所谓的模型原本都演化自那个简单的瀑布,那么文档是按XP写还是按RUP写,也就可以应时.应需,因地置宜,择善而从了. 越是简单的东西,往往越是接近于本质. 项目经理的工作,就是要去组织这个工程中的各个角色,使得分工明确,步调一致,共同地完成这个项目.四川有句地方话叫“做过场”,也有说成“走过场”的.“过场”是舞台术语,意思是角色从舞台一端出场,再走到另一端

大道至简 第五章 失败的过程也是过程 读后感

今天该写一写大道至简第五章读后感了. 首先是“做过程不是做工程”,过程是为了实现某种目的而经历的一些事情,过程有很多种,虽然经历了某种过程,但不一定能实现某种功能.做完过程的每一个阶段,并不等于做工程.做过程不是做工程的精义,也不是最终目的. 然后是“做过场”,做过场就好像是一种形式一样,做了没必要做的事情,就是浪费时间. 我们为什么做工程,不要忘了最终目的.目的,是实现客户的要求,工程只是一种实现的途径.最初做开发的前辈们,不用什么工程或者过程,也一样编出了程序,也一样解决了问题,也一样实现了

大道至简第七章读后感

大道至简第七章读后感——现实中的软件工程 “王不如远交而近攻,得寸,则王之寸:得尺,亦王之尺也.”——<战国策.秦策> 1:大公司手中的算盘 文中列举了IBM,Borland和Microsoft的一些体系,来说明大公司眼中的世界. 大公司们在标准.理论.语言上的争来夺去,未必全然出于“软件实现”的考虑.对统一理论.统一工具.统一过程的企图,其最终目的是在整个软件工程体系中的全面胜出.算 盘 上 的 绝 大 多 数 人 , 只 是 用 于 计 算 胜 负 的 一 枚 算子.所谓编程语言,只不过是

大道至简第五章阅读感想

第五章失败的过程也是过程 今天王建民老师依旧带领着我们阅读了大道至简第五章,第五章是失败的过程也是过程.通过前面的技术.团队和沟通,这章主要讲了关于做工程的问题. 文章开篇以一句<明皇实录>中的“虚有其表耳”来说明一个很重要的问题就是:不能只求外表,而是要透过表象,力求实质. 第五章的整体思想是让我们注重过程,因为有很多人从来不注重过程,只注重结果.然而过程对于一个编程人员也是非常重要,如果一个好的编程员从来不在乎程序的过程,只是关心最后程序是否能够实现,那么这个编程员一定不是一个好的编程员.

大道至简 第六章 读后感

说点什么呢,今天看了看大道至简第六章<从编程到工程>. 文章以<列子·说符>的“得其精而忘其粗,在其内而忘其外:见其所见,不见其所不见,视其所视,而遗其所不视.”为题记.第一节讲了“语言只是工具”,作者讲述了他曾经对一些编程语言的看法.他曾经也热衷于讨论语言的优劣,但是他现在不这样了,他已经不再专注于语言, 正如他在第一章中写到的一样:成天讨论这门语言好,或者那门语言坏的人,甚至是可悲的.确实,程序的好坏不在于语言,在于算法. 第二节又写了“程序”,程序=算法+结构,编程的精义于此

《大道至简》第一章读后感

经常听见有人抱怨编程太难,说自己不是学软件的料,那么他们真该好好看看<大道至简>这本书,相信他们看完这本书后会有很大收获. <大道至简>第一章引用了一个很简单的故事“愚公移山”,用这个故事很好的概述了我们在完成一个项目时所要进行的步骤.听上去“愚公移山”和编程简直是风马牛不相及,但是看过作者的叙述又有原来如此的感觉.其实编程并没有什么难懂的,就和我们日常生活一样,发现问题,分析问题,提出解决问题的方案,实施,和后续的验收.例如某天我们突然发现家里放不出水了,这就是发现问题,我们会观

大道至简第三章读后感

---恢复内容开始--- 大道至简第三章的是团队的问题.我们知道,随着人们生活水平的不断提高,用户对计算机软件的功能要求也日趋上升.这样一来,计算机软件就变得越来越复杂,规模变得越来越庞大,源代码的量也越来越多.在这种市场需求和自身发展的共同要求之下,一个团结而高效的开发团队的作用就不言而喻了.那么如何打造一支强有力.听指挥.能干活的开发团队呢?这一章作者就这个问题和我们展开了讨论. 作者着重的强调了项目经理在开发团队中的作用.首先声明一点,这并不是说团队的开发人员不重要,作者从始至终都认为编程

一切都是为了实现-大道至简第六章读后感

大道至简第六章的内容比较多,也比较深.或者说这一章作者是从一个更高的层次.更开阔的视野.更独特的角度来解读软件工程这四个字的具体含义的. 作者的这些肺腑之言都是作者在软件行业工作了多年之后总结出来的.开发技术对一个软件产品质量的好坏和最终的成功的影响并虽然不能说是一点也没有,但也不是很大.真正起到决定性因素的不是那些技术细节,而是一个高度过程化.通晓方法论.拥有大量工具的开发团队或者是开发公司.在这个团队里面,无论是对项目经理还是开发经理甚至是一个普通的开发人员的要求都是很高的.团队内的每个人必

《大道至简》第一章读后感和伪代码

阅读了<大道至简>第一章,感到作者对编程的精义分析非常具体形象,引用<愚公移山>的故事,说明了编程的本质.又将他们扮演的管理者,技术人员,程序分析师众多形象展现出来.又在困惑人们的"我能不能学会编程"这一问题做出回答,作者列举生活实例,给出了肯定的答案,将很多抽象的东西,简单化,通过最常见的生活中的实例介绍"大道". import java.大道至简.*; public class.yishan.*; { public static void