大数据分析工具采购指南

 

大数据分析工具使用户能够分析各种各样的信息——包括结构化事务数据和社交媒体帖子、Web服务器日志文件及其他形式的非结构化和半结构化数据。一旦组织决定要购买一个大数据分析工具,下一步就是制定一个流程,评估可用的产品,然后从中找到一个最适合你需求和要求的产品。

下面我们将介绍在评估各种大数据分析工具符合企业需求的程度时可能用到的必备特性和特定属性。然后,你再编写一个预案请求(RFP),说明使用这些工具将如何解决组织的需求。

一、  建模技术的广度与深度

供应商已经应用了不同级别的建模,并且相应地开发了不同复杂度的分析功能。单个工具支持的分析建模广度反应了所提供的不同方法。其中一些例子包括回归技术、根据过去趋势预测变化值的时间序列模型、分类与回归树(也称为CART)和神经网络。

建模技术的深度反映了所使用方法的两个方面特征:支持更精准开发模型的算法成熟度和建模技术的灵活性。换而言之,数据挖掘和预测分析时需要使用哪一种级别的专业知识才能理解目前能够开发哪一些类别的模型及如何使用一个特定工具完成建模?经验一般的数据分析师感兴趣的是提供大量分析功能的供应商产品,而更专业的分析师和统计师则更偏好于那些能够更深入分析特定分析模型的工具。

二、  集成与可访问性

大数据分析应用通常依赖于越来越多的内部和外部数据源,其中包括结构化和非结构化数据。这促成了支持数据可访问性和系统集成的功能需求。

三、  非结构化数据使用率

确认产品能够使用不同类型的非结构化数据(文档、电子邮件、图像、视频、演示文稿、社交媒体渠道信息等),并且能够解析和利用收到的信息。

四、大数据可访问性

对比供应商工具连接大数据架构的方式,其中包括存储在Hadoop的分布式数据,以及各种横向扩展存储中存储的文件(例如,MongoDB或Apache Cassandra等NoSQL数据)。

五、  与现有平台组件的互操作性

如果要在一些传统数据管理和BI技术中混搭分析方法,那么这一点非常重要。例如,许多分析工具支持通过传统的SQL查询去调用分析模型。这种形式的互操作性允许使用预测模型的结构去产生一些传统数据分析师通常都能使用的查询与报表。

1.连接性  一定要评估连接性,或者说产品访问其他系统的能力,以及作为数据源给现有平台提供用于生成报表和分析的能力。

2.易用性  有一些大数据分析产品是供应商从零开始开发的,而有一些则基于开源的R统计语言。无论是哪一种情况,这种评估类别主要关注于产品用于分析数据、开发模型和确定模型有效性与准确性的易用性。

3.业务分析师可用性

没有统计背景的商业分析师是否也能够轻松地开发分析和应用呢?确定产品是否提供了方便开发和分析的可视化方法。

4.部署不同业务用例的灵活性

相同的算法方法可以应用到许多不同行业的不同业务场景中。如果你的组织准备做的这类分析数量有限,并且集中在更为普通的用例上(如客户生命周期价值分析、欺骗行为分析或存留预防),那么你可能应该在技术选择牺牲一些灵活性。然而,如果你的组织想要一种广度更大、约束更小的分析方法,则应该寻找一些灵活性更高的建模技术。

时间: 2024-10-08 11:13:40

大数据分析工具采购指南的相关文章

推荐五个大数据分析工具

大数据分析工具主要是针对规模巨大的大数据进行分析.随着大数据时代的到来,大数据分析工具也应运而生,今天小编来给大家推荐五个最好的大数据分析工具. 一.Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架.但是 Hadoop 是以一种可靠.高效.可伸缩的方式进行处理的.Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理.Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度.Hadoop 还是

大数据分析工具为你保驾护航

前言: 谈到大数据分析工具,可能很多人都还不了解什么是大数据分析工具.至少在大多数行业里少提到大数据分析工具.大数据分析.大数据可视化这个说法,可以说大数据技术架构,大数据分析软件,也可能说数据挖掘软件.这里提到的大数据分析工具是指各种大数据分析,大数据挖掘软件.今天我们来看看大数据分析工具到底有哪些应用前景: 大数据分析工具在营销中的作用: 接下来,谈谈大数据分析工具,在营销领域中发挥的作用.营销监控与评估:这个是容易被忽视的领域,因为是涉及到具体战术的工作. 以后大多数人都关注营销效果的最终

大数据分析工具

  随着互联网科技日益成熟,各种类型的数据增长将会超越历史上任何一个时期.用户想要从这庞大的数据库中提取对自己有用的信息,就离不开大数据分析技术和工具.大数据商务智能平台是革命性的商务智能工具,搜索级商务智能,分析过去,监控现在,预测未来,即刻发现业务,做出更智慧的决策.ETHINK大数据商务智能平台提供一站式数据存储平台和一站式管理平台,能够连接各类不同的数据库或分布式数据库,并支持对各种大数据存储平台的连接和访问,对数据进行合并.搜索.可视化和分析.通过为客户提供一站式存储与管理服务,帮助客

大数据分析工具盘点-你不知道的15个新技术

大数据中的大作为,最近几周业内都忙碌着,很多初创公司和一些老牌的公司都推出了数据分析和数据管理产品,以及更新了现有产品,提供更丰富的功能与性能. 虽然这些技术都还只是蓝图规划,但是一些常见的主题还是对其贯穿始终:为用户提供简单的获得数据的访问方式,更好的管理大规模数据以及预先分析的功能,例如Spark.HAWQ和Geode等新兴的大数据技术来实现更多的功能. 下面一起来看看吸引眼球的十五项大数据公告.虽然罗列了很多,但还不是全部内容,只是最近在加利福尼亚州圣何塞市Strata + Hadoop

大数据分析案例

部分数据来源于网络,如有侵权请告知. 一.大数据分析在商业上的应用 1.体育赛事预测 世界杯期间,谷歌.百度.微软和高盛等公司都推出了比赛结果预测平台.百度预测结果最为亮眼,预测全程64场比赛,准确率为67%,进入淘汰赛后准确率为94%.现在互联网公司取代章鱼保罗试水赛事预测也意味着未来的体育赛事会被大数据预测所掌控. “在百度对世界杯的预测中,我们一共考虑了团队实力.主场优势.最近表现.世界杯整体表现和博彩公司的赔率等五个因素,这些数据的来源基本都是互联网,随后我们再利用一个由搜索专家设计的机

大数据简介与大数据分析

最近几年,大数据热得像烫手山芋!什么是大数据?通过查阅资料,整理一番,博文将给您带来福利了! 大数据概念 "大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取.管理和处理. "大数据"首先是指数据体量(volumes)?大,指代大型数据集,一般在10TB?规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量:其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐

案例解读|江苏银行—智多星大数据分析云平台实践

2014年10月,江苏银行夏平董事长确立了利用大数据实现弯道超车的发展战略,将大数据应用提升到全行发展的战略层面.2015年上半年,江苏银行完成了大数据平台选型和建设,选择发布版Hadoop进行底层数据存储加工.接着,进行内外部数据整合. 三个阶段的完成,意味着大数据基础设施建设工作已完成,如果把大数据建设工作看做一颗大树,前两个阶段完成意味着树干和树枝已长成,接下来的大数据应用像树枝上的树叶一样,热点频出,精彩纷呈.业务的创新带来大量新增的大数据分析需求,传统的数据库工具和报表工具遭遇瓶颈.

大数据分析,利用向外扩展技术深入挖掘商业价值

导语:大数据分析技术的价值在企业领域已经非常明确.充分利用良好信息的能力一直是摆在IT部门面前的重要难题与挑战.现在我们已经拥有了足以解决这一难题的工具,接下来要做的就是想办法使其为自己服务了. 方方面面的发展改进已经让从半结构化数据中获取有价值信息成为可能.以Hadoop为代表的新型解决方案在构建层面就充分考虑到了要如何适应跨商用服务器集群的分布式运行环境. 大数据:以需求为导向的审视角度 新型分析工具与极大丰富的处理能力为我们敞开了一道大门,如今企业已经能够借此对庞大的业务及外部数据加以审视

Azure HDInsight 和 Spark 大数据分析(一)

What is HDInsight? Microsoft Azure HDInsight 是基于 Hortonoworks Data Platform (HDP) 的 Hadoop 集群,包括Storm, HBase, Pig, Hive, Sqoop, Oozie, Ambari等(具体的组件请参看最后的附录).Azure HDInsight 支持 Windows的集群部署,也支持 Linux 集群部署.Hortonworks 是我目前所知唯一支持在 Windows 上部署的 Hadoop C