大数据应用案例

  2012年大数据公司Splunk公司成功上市,对风投机构价格向大数据领域投资力度起到推波助澜的作用,数据分析和商业智能等与大数据有关的其他版块也将获得发展机会。

Splunk的技术方案在于帮组IT部门监控并分析来自不同来源、设备或机器的数据,其中包括日志、性能指标、事件等等。

Splunk只是是运营比较成功的大数据公司之一,还有其它更多的大数据应用在各行各业发挥其巨大的作用。

例如:

1. 梅西百货的实时定价机制。根据需求和库存的情况,该公司基于SAS的系统对多达7300万种货品进行实时调价。

  2. Tipp24 AG针对欧洲博彩业构建的下注和预测平台。该公司用KXEN软件来分析数十亿计的交易以及客户的特性,然后通过预测模型对特定用户进行动态的营销活动。这项举措减少了90%的预测模型构建时间。SAP公司正在试图收购KXEN。

  3. 沃尔玛的搜索。这家零售业寡头为其网站Walmart.com自行设计了最新的搜索引擎Polaris,利用语义数据进行文本分析、机器学习和同义词挖掘等。根据沃尔玛的说法,语义搜索技术的运用使得在线购物的完成率提升了10%到15%。“对沃尔玛来说,这就意味着数十亿美元的金额。”Laney说。

  4. 快餐业的视频分析。该公司通过视频分析等候队列的长度,然后自动变化电子菜单显示的内容。如果队列较长,则显示可以快速供给的食物;如果队列较短,则显示那些利润较高但准备时间相对长的食品。

  5. Morton牛排店的品牌认知。当一位顾客开玩笑地通过推特向这家位于芝加哥的牛排连锁店订餐送到纽约Newark机场(他将在一天工作之后抵达该处)时,Morton就开始了自己的社交秀。首先,分析推特数据,发现该顾客是本店的常客,也是推特的常用者。根据客户以往的订单,推测出其所乘的航班,然后派出一位身着燕尾服的侍者为客户提供晚餐。

  6. PredPol Inc.。PredPol公司通过与洛杉矶和圣克鲁斯的警方以及一群研究人员合作,基于地震预测算法的变体和犯罪数据来预测犯罪发生的几率,可以精确到500平方英尺的范围内。在洛杉矶运用该算法的地区,盗窃罪和暴力犯罪分布下降了33%和21%。

  7. Tesco PLC(特易购)和运营效率。这家超市连锁在其数据仓库中收集了700万部冰箱的数据。通过对这些数据的分析,进行更全面的监控并进行主动的维修以降低整体能耗。

  8. American Express(美国运通,AmEx)和商业智能。以往,AmEx只能实现事后诸葛式的报告和滞后的预测。“传统的BI已经无法满足业务发展的需要。”Laney认为。于是,AmEx开始构建真正能够预测忠诚度的模型,基于历史交易数据,用115个变量来进行分析预测。该公司表示,对于澳大利亚将于之后四个月中流失的客户,已经能够识别出其中的24%。

9.对于体育爱好者,追踪电视播放的最新运动赛事几乎是一件不可能的事情,因为有超过上百个赛事在8000多个电视频道播出。

  而现在市面上开发了一个可追踪所有运动赛事的应用程序RUWT,它已经可以在iOS和Android设备,以及在Web浏览器上使用,它不断地分析运动数据流来让球迷知道他们应该转换成哪个台看到想看的节目,在电视的哪个频道上找到,并让他们在比赛中进行投票。对于谷歌电视和TiVo用户来说,实际上 RUWT就是让他们改变频道调到一个比赛中。

  该程序能基于赛事的紧张激烈程度对比赛进行评分排名,用户可通过该应用程序找到值得收看的频道和赛事。

10.五年前,LinkedIn只是一家普通的科技公司。而现在,其俨然成为一个工程强国。 LinkedIn建成的一个最重要的数据库是Espresso。不像Voldemort,这是继亚马逊Dynamo数据库之后的一个最终一致性关键值存储,用于高速存储某些确定数据,Espresso作为一个事务一致性文件存储,通过对整个公司的网络操作将取代遗留的Oracle数据库。它最初的设计就是为了提供LinkedIn InMail消息服务的可用性,该公司计划今年晚些时候将推出开源Espresso。

11.Seton Healthcare是采用IBM最新沃森技术医疗保健内容分析预测的首个客户。该技术允许企业找到大量病人相关的临床医疗信息,通过大数据处理,更好地分析病人的信息。

  在加拿大多伦多的一家医院,针对早产婴儿,每秒钟有超过3000次的数据读取。通过这些数据分析,医院能够提前知道哪些早产儿出现问题并且有针对性地采取措施,避免早产婴儿夭折。

  它让更多的创业者更方便地开发产品,比如通过社交网络来收集数据的健康类App。也许未来数年后,它们搜集的数据能让医生给你的诊断变得更为精确,比方说不是通用的成人每日三次一次一片,而是检测到你的血液中药剂已经代谢完成会自动提醒你再次服药。

  Express Scripts就是这么一家处方药管理服务公司,目前它正在通过一些复杂模型来检测虚假药品,这些模型还能及时提醒人们何时应该停止用药。 Express Scripts能够解决该问题的原因在于所有有关数据。因为它每年管理着1.4亿处方,覆盖了一亿美国人和65,000家药店,虽然该公司是能够识别潜在问题的信号模式,但它也使用数据来尝试解决某些情况下之前曾经发现的问题。

  同时,Express Scripts还着眼于一些事情,如他们所开处方的药物种类,甚至有人在网上谈论医生。如果一个医生的行为被标记为红色的旗帜,那么他在网络上是个好人的形象,更是你所需要的医生。

12.保险行业并非技术创新的指示灯,然而MetLife保险公司已经投资3亿美金建立一个新式系统, 其中的第一款产品是一个基于MongoDB的应用程序,它将所有客户信息放在同一个地方。

  MongoDB汇聚了来自70多个遗留系统的数据,并将它合并成一个单一的记录。它运行在两个数据中心的6个服务器上,目前存储了24TB的数据。这包括MetLife的全部美国客户,尽管它的目标是扩大它的国际客户和多种语言,同时也可能创建一个面向客户的版本。它的更新几乎是实时的,当新客户的数据输入时,就好像Facebook墙一样。

  大多数疾病可以通过药物来达到治疗效果,但如何让医生和病人能够专注参加一两个可以真正改善病人健康状况的干预项目却极具挑战。安泰保险目前正尝试通过大数据达到此目的。

  安泰保险为了帮助改善代谢综合症患者的预测,从千名患者中选择102个完成实验。在一个独立的实验室工作内,通过患者的一系列代谢综合症的检测试验结果,在连续三年内,扫描600,000个化验结果和18万索赔事件。将最后的结果组成一个高度个性化的治疗方案,以评估患者的危险因素和重点治疗方案。这样,医生可以通过食用他汀类药物及减重5磅等建议而减少未来10年内50%的发病率。或者通过你目前体内高于20%的含糖量,而建议你降低体内甘油三酯总量。

13.专业篮球队会通过搜集大量数据来分析赛事情况,然而他们还在为这些数据的整理和实际意义而发愁。通过分析这些数据,可否找到两三个制胜法宝,或者至少能保证球队获得高分? Krossover公司正致力于此。

  在每场比赛过后,教练只需要上传比赛视频。接下来,来自Krossover团队的大学生将会对其分解。等到第二天教练再看昨晚的比赛时,他只需检查任何他想要的——数据统计、比赛中的个人表现、比赛反应等等。通过分析比赛视频,毫不夸张地分析所有的可量化的数据。

14.智能电网现在欧洲已经做到了终端,也就是所谓的智能电表。在德国,为了鼓励利用太阳能,会在家庭安装太阳能,除了卖电给你,当你的太阳能有多余电的时候还可以买回来。通过电网收集每隔五分钟或十分钟收集一次数据,收集来的这些数据可以用来预测客户的用电习惯等,从而推断出在未来2~3个月时间里,整个电网大概需要多少电。有了这个预测后,就可以向发电或者供电企业购买一定数量的电。因为电有点像期货一样,如果提前买就会比较便宜,买现货就比较贵。通过这个预测后,可以降低采购成本。

  维斯塔斯风力系统,依靠的是BigInsights软件和IBM超级计算机,然后对气象数据进行分析,找出安装风力涡轮机和整个风电场最佳的地点。利用大数据,以往需要数周的分析工作,现在仅需要不足1小时便可完成。

15.印度有一档非常受欢迎的电视节目Satyamev jayate,该节目整理并分析社会民众关于争议话题的各种意见,包括女性堕胎、种姓歧视和虐待儿童等社会热点问题,并使用这些数据来推进政治改革。

  -来自印度电视和世界各地的YouTube上的400万观众;

  -超过1.2亿人在其网站、Facebook,Twitter,YouTube和移动设备上已连接Satyamev jayate;

  -超过800万的人通过Facebook,网络注释,文本消息及电话热线等方式发送14万个回应,每周有超过10万个新观众进行回应。

16.在洛杉矶开过车的人一定都经历过那里噩梦般的交通拥堵情况。目前政府在I-10和I-110州际公路上建立了一条了收费的快速通道。政府可通过大数据引导驾驶人员在该通道上的行驶情况,保证交通畅通。

  施乐就是参与此次项目的公司,它的抗拥塞项目,包括用ExpressLanes、动态定价,上升的需求等等以维持某种秩序的想法。施乐公司的首席技术执行官Natesh Manikoth表示,如果司机支付给驾驶热车道(高占用收费系统),他必须保证车速每小时45英里左右。如果交通开始拥堵,私家汽车的支付价格将上升,以减少他们进入,而将车道用于高占用率的车辆,例如公共汽车和大巴车。

  施乐还有另一个项目在洛杉矶称为ExpressPark, 目标是让人们知道他们何时即将离开房子,在哪能找到停车场和花费金额。不仅要确保定价,同时更要确保数据实时到达用户手中。例如,应当提前40分钟告知用户停车位置。

17.当问起汽车的制造过程,大多数人脑子里随即浮现的是各种生产装配流水线和制造机器。然而在福特,在产品的研发设计阶段,大数据就已经对汽车的部件和功能产生了重要影响。

  比如,福特产品开发团队曾经对SUV是否应该采取掀背式(即手动打开车后行李箱车门)或电动式进行分析。如果选择后者,门会自动打开、便捷智能,但这种方式会影响到车门开启有限的困恼。此前采用定期调查的方式并没有发现这个问题,但后来根据对社交媒体的关注和分析,发现很多人都在谈论这些问题。

18.“我们的某个客户,是一家领先的专业时装零售商,通过当地的百货商店、网络及其邮购目录业务为客户提供服务。公司希望向客户提供差异化服务,如何定位公司的差异化,他们通过从 Twitter 和 Facebook 上收集社交信息,更深入的理解化妆品的营销模式,随后他们认识到必须保留两类有价值的客户:高消费者和高影响者。希望通过接受免费化妆服务,让用户进行口碑宣传,这是交易数据与交互数据的完美结合,为业务挑战提供了解决方案。”Informatica的技术帮助这家零售商用社交平台上的数据充实了客户主数据,使他的业务服务更具有目标性。

  零售企业也监控客户的店内走动情况以及与商品的互动。它们将这些数据与交易记录相结合来展开分析,从而在销售哪些商品、如何摆放货品以及何时调整售价上给出意见,此类方法已经帮助某领先零售企业减少了17%的存货,同时在保持市场份额的前提下,增加了高利润率自有品牌商品的比例。

19.许多人通过Facebook更新个人状态、分享图片以及他们"喜欢"的内容。奥巴马的总统竞选运动也通过使用社交网络的各种数据功能完成了竞选,他们不仅通过社交网络寻找支持者,而且还通过社交网络召集了一批志愿军。

  早在2006年,Facebook联合创始人,克里斯·休斯就建议扎克伯格在网站上推出相关服务,帮助总统候选人在Facebook上建立个人主页,以便他们进行形象推广。2006年9月,Facebook全面开放,用户数量爆炸式增长,在年底达到1200万。这一过程恰好有利地推升了奥巴马的知名度。此后,在克里斯的辅佐下,奥巴马掀起了一系列的网络活动,在Facebook、MySpace等社交网站上发表公开演讲、推广施政理念,赢得大量网民支持,募集到5亿多美元的竞选经费。

  最终,"黑人平民"战胜了实力雄厚的对手,成为美国历史上第一位黑人总统,之后,在第二次的选举中更获得连任。此次选举被认为是美国民主的巨大进步,而互联网则提供了前所未有的实施手段,其中尤以Facebook代表的社交网站最为突出,以至于有人戏称之为"Facebook之选"。

20.MailChimp的核心业务是提供电子邮件服务,它在一年内为大约300万用户发送了350亿封邮件。不过真正能体现MailChimp未来价值的则是该公司对这些邮件数据的处理和分析。

  MailChimp的一个重要任务就是搞清楚如何帮助客户更好地了解他们所发送的信息。考虑到这一点,该公司建立了一个服务叫Wavelength,向客户展示了与他们相似的其他讯息。这个系统使得Wavelength能够储存公司数据库中每个邮件地址发生的互动。这意味着告诉了你,用户打开了什么样的邮件,何时打开,他们点击了什么链接,还有订阅了什么邮件。MailChimp也有一个功能叫做Ecommerce360,能让客户通过转换来跟踪点击。

21.十多年前,音乐元数据公司Gracenote收到来自苹果公司的神秘忠告,建议其购买更多的服务器。Gracenote照做了,而后苹果推出iTunes和iPod,Gracenote从而成为了元数据的帝国。

  在车内听的歌曲很可能反映你的真实喜好, Gracenote就拥有此种技术。它采用智能手机和平板电脑内置的麦克风识别用户电视或音响中播放的歌曲,并可检测掌声或嘘声等反应,甚至还能检测用户是否调高了音量。这样,Gracenote可以研究用户真正喜欢的歌曲,听歌的时间和地点。

  Gracenote拥有数百万首歌曲的音频和元数据,因而可以快速识别歌曲信息,并按音乐风格、歌手、地理位置等分类。

时间: 2024-10-05 12:01:46

大数据应用案例的相关文章

大数据高冷?10个有趣的大数据经典案例

马云说:互联网还没搞清楚的时候,移动互联就来了,移动互联还没搞清楚的时候,大数据就来了.近两年,“大数据”这个词越来越为大众所熟悉,“大数据”一直 是以高冷的形象出现在大众面前,面对大数据,相信许多人都一头雾水.下面我们通过十个经典案例,让大家实打实触摸一把“大数据”.你会发现它其实就在身边 而且也是很有趣的. 啤酒与尿布 全 球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的 促销手段.没想到这个举措

大数据应用案例之——如何做生意?

数据本身不产生价值,如何分析和利用大数据对实际业务产生帮助才是关键;从事大数据的生意要重视投入与产出;许多人已经默默地通过大数据获利. 1.大数据应用案例之分析微博数据炒股 “过去往往是把数据静止到程序当中分析,但现在不可能等它停下来.”中国工程院院士邬贺铨表示,数据规模越大,处理的难度也越大,但对其进行挖 掘可能得到的价值更大,这就是大数据热的原因.华尔街德温特资本市场公司分析全球3.4亿微博帐户留言,判断民众情绪,高兴买股票,焦虑抛售股票,判断全 世界高兴的多还是焦虑多,从而判断股票抛售情况

大数据应用案例之医疗行业

案例一:基因推出肿瘤基因检测服务 数据源: 检测数据:患者血清.口腔黏膜数据.基因测序等. 其它数据:体检数据.电子病历.遗传记录.患者调查.地理区域以及生活条件等. 实现路径: 首先采取患者样本,通过测序得到基因序列,接着采用大数据技术与原始基因比对,锁定突变基因,通过分析做出正确的诊断,进而全面.系统.准确地解读肿瘤药物与突变基因的关系,同时根据患者的个体差异性,辅助医生选择合适的治疗药物,制定个体化的治疗方案,实现" 同病异治" 或" 异病同治" ,从而延长患

大数据风控案例(总结他人)

转自于:http://blog.csdn.net/liberty_xm/article/details/53185252 一.行业背景 1.1风控行业背景 当前,经济下行导致中小企业经营成本不断增加吗,产品销售价格因结构原因和市场原因相对走低,企业利润空间被进一步压缩,许多中小企业陷入经营困境,导致企业经营风险加大.连锁性风险陡增.潜在信用风险上升.企业主的道德风险聚升.一些重点领域的银行等金融机构信贷风险进入了一个暴露期,一些地区的金融机构已经出现不良贷款回升苗头,不良贷款高危行业中,钢铁与建

第二篇:智能电网(Smart Grid)中的数据工程与大数据案例分析

前言 上篇文章中讲到,在智能电网的控制与管理侧中,数据的分析和挖掘.可视化等工作属于核心环节.除此之外,二次侧中需要对数据进行采集,数据共享平台的搭建显然也涉及到数据的管理.那么在智能电网领域中,数据工程到底是如何实施的呢? 本文将以IBM的Itelligent Utility Network产品为例阐述智能电网中的数据工程,它是IBM声称传统电网向智能电网转变的整体方案(看过上篇文章的童鞋想必会清楚这样的说法是片面狭隘的,它只能算是智能电网中的数据工程). 另一方面,如今是一个数据爆炸的时代,

CIO必须知道的十个大数据案例

在听Gartner的分析师Doug Laney用55分钟讲述55个大数据应用案例之前,你可能对于大数据是否落地还心存疑虑.Laney的演讲如同莎士比亚的全集一样,不过可能“缺乏娱乐性而更具信息量”(也许对于技术人员来说是这样的).这个演讲是对大数据3v特性的全面阐释:variety(类型).velocity(产生速度)和volume(规模).术语的发明者就是用这种方式来描述大数据的 – 可以追溯到2001年. 这55个例子不是用来虚张声势,Laney的意图是说明大数据的实际应用前景,听众们应该思

[大数据性能调优] 第二章:彻底解密Spark的HashShuffle

本課主題 Shuffle 是分布式系统的天敌 Spark HashShuffle介绍 Spark Consolidated HashShuffle介绍 Shuffle 是如何成为 Spark 性能杀手 Shuffle 性能调优思考 Spark HashShuffle 源码鉴赏 引言 Spark HashShuffle 是它以前的版本,现在1.6x 版本默应是Sort-Based Shuffle,那为什么要讲 HashShuffle 呢,因为有分布式就一定会有 Shuffle,而且 HashShu

[大数据性能调优] 第一章:性能调优的本质、Spark资源使用原理和调优要点分析

本課主題 大数据性能调优的本质 Spark 性能调优要点分析 Spark 资源使用原理流程 Spark 资源调优最佳实战 Spark 更高性能的算子 引言 我们谈大数据性能调优,到底在谈什么,它的本质是什么,以及 Spark 在性能调优部份的要点,这两点让直式进入性能调优都是一个至关重要的问题,它的本质限制了我们调优到底要达到一个什么样的目标或者说我们是从什么本源上进行调优.希望这篇文章能为读者带出以下的启发: 了解大数据性能调优的本质 了解 Spark 性能调优要点分析 了解 Spark 在资

大数据经验分享

大数据经验分享 随着互联网的发展,尤其是近期互联网大会召开,再一次谈到大数据,大数据发展趋势已经成为一种必然.那么我们怎样去迎接这样一个新的数据时代?我们可以看到越来越多的人想学习大数据,可是却无从下手,根据自己的经验为大家分享一下大数据的知识: 一.大数据是什么?它的特征? 大数据指一般的软件工具难以捕捉.管理和分析的大容量数据. 大数据有4V特征:Volume(大量).Velocity(实时).Variety(多样).Value(价值). 大数据(big data),或称海量资料,指的是所涉