论各类BI工具的“大数据”特性!

市面上的BI工具形形色色,功能性能包装得十分亮丽,但实际应用中我们往往更关注的是朴实的技术特性和解决方案。对于大数据,未来的应用趋势不可抵挡,很多企业也正存在大数据分析处理展现的需求,以下我们列举市面上主流的三款BI系统,就“大数据”特性展开探讨,主要是与Hadoop、Spark、多维分析数据库的对接和性能。

Tableau的大数据策略

1、目前,Tableau适用的大数据生态系统连接包括:

  • Hadoop:Cloudera Impala 和 Hive、Hortonworks Hive、MapR Hive、支持 Impala 和 Hive 的Amazon EMR、Pivotal HAWQ、IBM BigInsights
  • NoSQL:MarkLogic、Datastax
  • Spark:Apache Spark SQL
  • 多维分析数据库: Teradata Aster、HP Vertica、SAP Hana、SAP Sybase、Pivotal Greenplum

2、Tableau 可实时连接到数据源,或将其调入内存。在快速交互式查询分析时,实时连接作用很大。但由于内存式分析,对硬件要求较高,数据量较大时效率会比较低。

3、面向业务用户的大数据自助式可视化。业务用户可使用拖放操作可视化其数据,而无需编写复杂的SQL、Java代码或 MapReduce作业。Tableau简化了分析数据的任务,用户可比以前更快地从数据中发现形象可见的见解。

FineBI的双套大数据方案

1、FineBI支持的大数据生态系统连接包括

  • 大数据平台:Vertica、GreenPlum、Apache Kylin、Impala/hive、hive、星环,
  • NO SQL数据库:MongoDB
  • 多维分析数据库:Teradata、SAP Hana、Greenplum、SAP Sybase、Essbase、SSAS

2、FineBI支持FineIndex和FineDirect两种数据连接和处理模式,应对的是不同的数据方案。

  • FineDirect应对的是一些需要实施展现结果,比如银行交易风险的流水分析,直接对接hadoop,kylin,greenplum等大数据平台。
  • FineIndex采用cube连,也就是说数据库-FineIndex-前端分析,FineIndex相当于一个中间库的形式,用来存储数据表,关联转义索引等。这些都对后续前台分析处理数据效率有很大的提升(因为直接sql取数,效率受数据库本身的限制,数据量大时,一般分析工具很容易就卡死升职内存溢出导致系统无响应)

3、用于执行跨数据源分析的数据混合。FineBI可以将大数据和其他数据源(如MySQL、Excel 文件等)混合,让用户能够跨越各种数据源存取数据,并整合到一个库内(FineIndex)。

Qlikview

1、Qlikview也是基于内存的BI,能实时响应用户的分析需求,与Tableau相似,性能大多决定于数据库。能直接从用户的业务系统中采集数据并进行多维分析,剔除了传统BI基于数据仓库(集市)才能实施的弊病。(作者从网上和其资料库中并没有查到太多关于大数据方面的阐述,官方也并没有这方面的可以宣传)。

2、QlikView的核心是一个获得专利的AQL构架。在分析时不需要传统OLAP立方体,也不一定要使用数据库,完全利用了基础硬件平台,来对上亿的数据进行业务分析。QlikView应用使各种各样的终端用户以一个高度可视化,功能强大和创造性的方式,互动分析重要业务信息。

时间: 2024-10-28 13:35:52

论各类BI工具的“大数据”特性!的相关文章

论各类BI工具的“大数据”特性

市面上的BI工具形形色色,功能性能包装得十分亮丽,但实际应用中我们往往更关注的是朴实的技术特性和解决方案.对于大数据,未来的应用趋势不可抵挡,很多企业也正存在大数据分析处理展现的需求,以下我们列举市面上主流的三款BI系统,就"大数据"特性展开探讨,主要是与Hadoop.Spark.多维分析数据库的对接和性能. Tableau的大数据策略 1.目前,Tableau适用的大数据生态系统连接包括: Hadoop:Cloudera Impala 和 Hive.Hortonworks Hive.

读懂BI商业智能与大数据应用的区别

之所以要区分大数据应用与BI(商业智能),是因为大数据应用与BI.数据挖掘等,并没有一个相对完整的认知. BI(BusinessIntelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策. 伴随着BI的发展,是ETL,数据集成平台等概念的提出.ETL,Extraction Transformation Loading,数据提取.转换和加载,数据集成平台主要功能对各种业务数据进行抽取和相关转化

10款超好用的工具助力大数据与分析技术

考虑到现有技术解决方案的复杂性与多样化,企业往往很难找到适合自己的收集与分析工具.然而,混乱的时局之下已经有多种方案脱颖而出,证明其能够帮助大家切实完成大数据分析类工作.下面我们将整理出一份包含十款工具的清单,从而有效压缩选择范畴. 数据已经成为现代化企业中最为重要的宝贵资源.一切决策.策略或者方法都需要依托于对数据的分析方可实现.随着逐步替代其上代版本,即"商务智能",企业正面临着一个更加复杂.且商业情报规模更为庞大的新时代. 考虑到现有技术解决方案的复杂性与多样化,企业往往很难找到

大数据时代的新BI系统架构发展趋势

商业智能(BI,Business Intelligence),它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策. 商业智能的概念最早在1996年提出.当时将商业智能定义为一类由数据仓库(或数据集市).查询报表.数据分析.数据挖掘.数据备份和恢复等部分组成的.以帮助企业决策为目的技术及其应用.目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具.商务智能系统中的数据来自企业其他业务

关于BI商业智能的“8大问”|一文读懂大数据BI

这里不再阐述商业智能的概念了,关于BI,就从过往的了解,搜索以及知乎的一些问答,大家困惑的点主要集中于大数据与BI的关系,BI的一些技术问题,以及BI行业和个人职业前景的发展.这里归纳成8个问题点,每个问题都做了精心的解答,希望能给大家带来帮助. 问题1:商业智能BI和大数据是什么关系,如何选择? BI(BusinessIntelligence)即商业智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策. 大数据(B

大数据分析BI工具有哪些,该怎么选择呢?

随着大数据技术与物联网.云计算.人工智能等新技术的相互融合***,多技术融合的新应用正在不断涌现,大数据已广泛应用于各个领域.我国大数据产业发展快速增长,产业规模不断扩大,产业链条加速完善,企业实力不断增强.围绕大数据智能应用.用户行为画像.可视化分析等创新服务模式的公司正在快速崛起,涌现出一批像思迈特软件.帆软.神策数据以及东软等一批优秀企业. 1.大数据BI产业链结构分析 大数据BI产业链结构总体上由数据源.数据获取.数据处理.数据分析以及数据展现五个方面构成.其中数据源由企业内部数据和外部

大数据下BI产品如何发挥最大价值

看到这个题目,你是否总感觉云里雾里?你是否真正懂什么叫“大数据”?商业智能BI和大数据又有着什么千丝万缕的联系?为什么说商业智能BI能在大数据中发挥价值? 大数据,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取.管理.处理.并整理成为帮助企业经营决策更积极目的的资讯.大数据拥有四个特征:数据量大.数据种类多.更新速度快.蕴藏的价值大但密度低.大数据虽然蕴含极大的价值,但是如果仅仅停留在数据收集.整理.存储和简单报表阶段的话,大数据就是一堆“IT库存”,成本高

BI与大数据

微博的诞生.云计算.物联网.移动互联网等各种爆炸式数据,给商业智能的蓬勃发展提供了良好的"大数据"环境.大数据为BI带来了海量数据.对挖掘来说,大数据量要更容易对比.抢夺大数据市场,需要具备一定的实力,报表的呈现和简易分析只是停留在"B"的阶段,要想达到"I"的阶段,必须要结合整个大环境.大行业的数据来判断分析并给出真正有价值的信息和决策建议,这取决于你能拿到多广多深的数据和你的数据挖掘分析以及建模能力. BI与大数据的区别在于,大数据能够基于B

民生银行十五年的数据体系建设,深入解读阿拉丁大数据生态圈、人人BI 是如何养成的?(转载)

早在今年的上半年我应邀参加了由 Smartbi 主办的一个小型数据分析交流活动,在活动现场第一次了解到了民生银行的阿拉丁项目.由于时间关系,嘉宾现场分享的内容非常有限.凭着多年对行业研究和对解决方案的嗅觉与敏感性,意识到这个阿拉丁项目的完整性和独特性超出了以往我所接触过的所有 BI 领域的项目案例,很值得再次深入的探讨.学习与研究.对于很多公司在建设自身的 BI 或者大数据平台体系上,这个项目案例有很好的参考与借鉴意义.(另外一个我个人比较推崇的大数据建设的案例是美的的大数据平台建设案例.) 在