某公司基于FineBI数据决策平台的试运行分析报告

一、数据平台的软硬件环境

二、组织机构和权限体系

组织机构平台中已集成一套组织机构可以建立部门、人员。也可以与现有系统的组织机构集成将组织机构导入到平台中。

功能权限通过配置功能点URL的方式实现各个用户相应的BI访问权限。用户第一次访问受保护的资源某个功能点时会发出访问请求服务器接收到请求后会验证用户权限如果没有通过验证则返回登录页面。

数据权限很多系统的权限认证只是限制模块的使用使得合法用户能够行使自己的权利。平台在满足这种整体权限认证的同时权限的控制力度可以达到同一张BI的内容在不同权限下展示的效果不一样这样就免除了制作大量的BI来实现同样效果尤其是在企业内部业务繁杂审批麻烦时一张BI就可以解决所有问题。平台通过对业务包的权限控制从数据包层面控制了不同的用户对于数据的权限以达到数据的细粒度控制。

权限控制的层次

  1. 不同用户对于数据业务包的数据权限仅限于自己权限范围内。
  2. 不同的用户可以访问权限范围内的报表。
  3. 不同的用户对于同一张报表只能够访问权限范围内的数据。

三、数据处理

数据源支持Oracle,DB2,SQLServer,MySQL,SqlServer,Informix等数据源。支持ODBC数据源支持JNDI数据源支持共享应用服务器数据源。支持程序数据接口。支持文本数据源。支持内置数据集。

业务数据包即Cube是用于即时分析的数据基础。数据业务包由数据管理员创建其中包含着能够提供给分析人员的所有业务数据表、数据集、接口数据、文本数据等。以文件的形式(后缀名为fcube)存放在服务器目录中。

数据转义 
可以对数据业务包中的表名以及字段名进行转义成为能够让业务人员理解的数据转义的信息可以直接集成数据库中的注释也可以直接手动编辑。

数据关联

数据之间的关联是用于给多个表之间建立表间关系也可以直接继承数据库中定义的外键关系 。参与关联关系的表必须有主键支撑。

四、数据转化

数据转化提供各种样式的表格和多种图表服务配合各种业务需求展现数据。包括列表、分组、交叉表格图表类型包括柱形图、条形图、饼图、面积图、组合图、仪表盘和地图。

新增列通过自定义数据列来实现数据转换和数据计算。包括根据现有的数据新增列构建自循环列根据公式构建自定义数据列。更方便地用于后面的分析。

根据现有的数据新增列在现有的数据列的基础上通过自定义分组形成新的列。主要用于建立公用的自定义分组的方式提供给所有的分析人员使用。

构建自循环列可以根据一列数据库中只有一列组织ID或者两列数据库中有组织ID和父ID数据分层将组织机构的层级关系分层展示。主要用于组织树展示。

新增公式列公式引擎支持数据类型转化常用函数、数学和三角函数、文本函数、日期和时间函数、逻辑函数、数组函数、报表函数以及其他自定义函数 
。 
行列转换行列转换主要用于将数据库中某一列的字段值与其他指标字段结合成新的字段。

五、定时更新

全量更新所有的数据业务包建立的时候数据平台会在后台自动生成对应的cube。数据平台的cube采用MOLAP的形式所以在处理大数据量的问题上具有优良的支撑。cube中的数据可以设置定时全量更新。

增量更新只能单独对业务包中的表和数据集进行设置。并且只对新增数据有效。

六、数据分析

维度指标分析可以灵活地从业务包中选择任意指标、维度进行自主地拖拽分析。由于数据业务包中的数据已经关联在了一起这就决定了数据平台即时分析的自由度。在分析某个指标的影响因素时可以选择任意的维度去分析他们之间的关系。从而确定某个因素对指标的影响大小。

分析组件组件支持各种样式的表格配合各种业务需求展现数据。包括列表、分组、交叉表格。组件支持多种图表图表类型包括柱形图、条形图、饼图、面积图、组合图、仪表盘和地图。页面上生成表格转换图表、添加钻取、过滤筛选、添加控件等一系列交互设置操作简单。通过拖拽指标和维度生成的表格可以一键切换至图表。

平台支持多种图表且类型可以随意切换支持的图标类型有柱形图、柱形堆积图、折线图、堆积面积图、组合图、条形图、堆积条形图、饼图、仪表盘、地图。

汇总数据统计方式多样指标支持求和平均最大值、最小值等等一系列统计方式提供选择。

支持多种计算指标的方式指标可以来自于字段同时也可以是通过公式计算得来。在计算同比、环比、排名的时候只需配置一下界面即可得到想要的结果。无需通过复杂的公式。

数据预警支持数据预警功能对于在某个数据区间的数据可以进行红绿灯预警或者数据前景预警。

多维OLAP分析平台提供了各种常见的OLAP分析操作可以进行任意多维度的分析钻取分析、排序、过滤等等分析功能。

任意多维度分析平台提供任意维度的数据分析针对要分析的数据可以任意添加需要分析的维度。图表设置过程类似需要注意的是绝大多数的图表无需刻意添加分析。支持任意维度切换可以对已有的表样切换维度来进行自由分析。

多层钻取由于维度数据的关系在建立数据cube的时候已经建立好则可以对维度直接通过分组以及层级设置进行多层钻取。设置了数据关联的数据之间可以进行多层钻取设置通过多层钻取查看数据的详细值。

排序基于查询出来的结果的排序根据维度自身进行排序根据汇总指标的大小对维度进行排序展示根据公式值进行排序。可以进行升序、降序和自定义排序。选择了排序方式数据会根据所选排序方式自动排序。排序为全局排序分页显示后并不影响排序结果。

七、技术特性

数据平台数据仓库技术要点


  • 动态生成的位图索引技术处理字符串等类型. NIO内存映射文件技术快速读取处理数字类型.
  • 支持离线使用的cube数据存储支持cube数据定时全量以及增量更新. 动态的内存数据立方体技术并行计算的数据处理模式.
  • 基于位图索引的快速分组过滤钻取支持多线程运算互不干扰. 的位图索引压缩技术. 避免重复计算的缓存机制.

数据平台数据建模及数据应用流程


  • 数据库生成Cube文件该cube文件会根据原始数据建立一定的数据模型。
  • 访问设计报表时预先加载需要使用的字段的位图索引到内存增大命中率。
  • 处理分组时使用位图索引对数据进行处理经过转换生成需要的结果再使用多线程分组多线程与内存映射文件生成汇总结果。并将结果建立一定的数据立方体模型在下次取数和部分取数时避免重复计算。

数据平台模块



分析数据关联

当最终用户在分析数据时很可能需要将数据建模时没有建立关联关系的数据关联起来做为整体查看分析而在处理此类问题时就往往需要技术人员的支持需要额外的数据建模工作平台根据用户的语义提供关联设置并将数据关联只要明白语义即可得到所需数据。

指标影响因素分析

某个指标或者汇总数据往往会受到很多因素的影响例如销售额会受到产品质量销售地区时间销售人员代理商销售策略同类竞争产品价格等等因素的影响而当最终客户进行分析时需要对全盘的影响因素都有了解。以往的BI工具是提前将这些分析维度加入最终展现层让领导或者业务人员去选择这样的问题有两个不利因素沟通成本高需要让技术人员清晰明了业务需求修改影响因素复杂添加删除因素需要通知技术人员。平台的因素分析直接面向最终分析人员通过优化的算法提供所有影响因素并且判断重点因素。

八、优势总结

  • 大数据量的处理性能优秀

数据平台的数据处理采用表间自动关联以及手动建立关联来实现数据之间的关系使得数据根据业务关系有着完整的数据结构。理解业务的用户只需要根据业务选择相应的数据即可以进行分析数据。

  • 数据平台数据建模及数据应用流程

  • 数据库生成cube文件该cube文件会根据原始数据建立一定的数据模型。
  • 访问设计报表时预先加载需要使用的字段的位图索引到内存增大命中率。
  • 处理分组时使用位图索引对数据进行处理经过转换生成需要的结果再使用多线程分组多线程与内存映射文件生成汇总结果。并将结果建立一定的数据立方体模型在下次取数和部分取数时避免重复计算。 
    分组速度快各个分组汇总之间互不干扰利于多线程计算以及分布式部署优化。
  • 支持部分计算分组汇总不需要计算所有的值。列表速度不受限于数据量。
  • 当最终用户在分析数据时很可能需要将数据建模时没有建立关联关系的数据关联起来做为整体查看分析而在处理此类问题时就往往需要技术人员的支持需要额外的数据建模工作平台根据用户的语义提供关联设置并将数据关联只要明白语义即可得到所需数据。
  • 非IT人员可以进行即时分析

传统BI的繁杂之处主要体现在两个方面

第一技术人员需要花费大量时间准备数据。用于分析的底层数据分布在不同的地方如果要让这些数据百分百地满足业务需求那么就需要对数据进行额外的处理根据传统BI提供的工具建立符合其工具的数据模型而这个过程根据业务的复杂程度所需的时间在几个月不等。

第二业务人员基于数据偶得的一些分析需求实现过程复杂。传统BI的模式都是预先了解领导和业务人员的所有业务需求然后基于这些需求准备数据设计以报表形式展现数据的分析过程当决策分析者在分析过程中有额外的想法时基于传统的设计模式她们还需要和技术人员进行沟通准备新的数据或者设计新的分析过程然后才能得到自己想要的分析这个过程还包括了让技术人员理解自己的需求所以综上看来整个过程是相当复杂的。

平台的Data Service模块具有的分析设计模式和指标影响因素智能分析模块能够解决以上问题让技术人员准备数据时无需任何代码和复杂的设置过程让非IT人员参与开发编程成为可能。

时间: 2024-10-13 22:02:47

某公司基于FineBI数据决策平台的试运行分析报告的相关文章

数据标注平台—竞品分析

前言:排版真的很丑,我已经尽力了…… 以后相关产品的文章,可能不会在博客园发布,我会写在知乎(最近决定要在知乎装逼),有兴趣的朋友可以关注一下:https://www.zhihu.com/people/zhang-cheng-liang-64.祝各位19年快乐! 一.项目背景 在进行用户访谈的过程中,有多位受访者对公司内部开发的标注工具满意度不高,纷纷表示希望有一个操作更为方便.上手快.不卡的标注工具,基于此展开本竞品分析. 工具满意度 期待目标产品的特性 二.竞品概述 在竞品选择上,我们对标s

看看美团如何进行数据治理平台的建设与实践?

背景 作为一家高度数字化和技术驱动的公司,美团非常重视数据价值的挖掘.在公司日常运行中,通过各种数据分析挖掘手段,为公司发展决策和业务开展提供数据支持.经过多年的发展,美团酒旅内部形成了一套完整的解决方案,核心由数据仓库+各种数据平台的方式实现.其中数据仓库整合各业务线的数据,消灭数据孤岛:各种数据平台拥有不同的特色和定位,例如:自助报表平台.专业数据分析平台.CRM数据平台.各业务方向绩效考核平台等,满足各类数据分析挖掘需求.早期数据仓库与各种数据平台的体系架构如图1所示: 图1 酒旅早期各数

【教程分享】基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析

基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析 课程讲师:迪伦 课程分类:Java 适合人群:高级 课时数量:96课时 用到技术:MapReduce.HDFS.Map-Reduce.Hive.Sqoop 涉及项目:Greenplum Hadoop大数据分析平台 更新程度:完毕 对这个课程有兴趣的朋友可以加我的QQ2059055336和我联系 下载地址:链接:   pan.baidu.com/s/1nthYpKH 密码: niyi 随着云计算.大数据迅速发展,亟需

基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析

随着云计算.大数据迅速发展,亟需用hadoop解决大数据量高并发访问的瓶颈.谷歌.淘宝.百度.京东等底层都应用hadoop.越来越多的企 业急需引入hadoop技术人才.由于掌握Hadoop技术的开发人员并不多,直接导致了这几年hadoop技术的薪水远高于JavaEE及 Android程序员. Hadoop入门薪资已经达到了 8K 以上,工作1年可达到 1.2W 以上,具有2-3年工作经验的hadoop人才年薪可以达到 30万—50万 . 一般需要大数据处理的公司基本上都是大公司,所以学习had

基于datax的数据同步平台

一.需求 由于公司各个部门对业务数据的需求,比如进行数据分析.报表展示等等,且公司没有相应的系统.数据仓库满足这些需求,最原始的办法就是把数据提取出来生成excel表发给各个部门,这个功能已经由脚本转成了平台,交给了DBA使用,而有些数据分析部门,则需要运维把生产库的数据同步到他们自己的库,并且需要对数据进行脱敏,比如客户的身份证号.手机号等等,且数据来源分散在不同的机器,不同的数据库实例里,这样就无法使用MySQL的多源复制,只能用写脚本通过SQL语句实现,随着业务的发展,导致堆积到运维部门的

如何修改报表平台中数据决策系统登陆地址

用FineRepor搭建的数据决策系统,系统自动生成的地址一般都比较长,比如原来的登陆地址:http://196.128.1.2/WebReport/ReportServer?op=fs,地址太长不易记忆,这就产生了一个问题:如何实现直接在在浏览器输http://196.128.1.2就能访问数据决策系统? 对于这个问题,一般有两个解决思路: 一.设置跳转 在FineReport服务器的初始加载页面进行跳转,这个方法技术上比较容易实现,具体实现方法也多样,就不赘述了. 二.iframe嵌入 修改

怎样改动报表平台中数据决策系统登陆地址

用FineRepor搭建的数据决策系统.系统自己主动生成的地址一般都比較长,比方原来的登陆地址:http://196.128.1.2/WebReport/ReportServer?op=fs,地址太长不易记忆.这就产生了一个问题:怎样实现直接在在浏览器输http://196.128.1.2就能訪问数据决策系统? 对于这个问题.一般有两个解决思路: 一.设置跳转 在FineReportserver的初始载入页面进行跳转.这种方法技术上比較easy实现,详细实现方法也多样,就不赘述了. 二.ifra

基于大数据技术的手机用户画像与征信研究

内容提要:手机用户画像是电信运营商实现“数据驱动业务与运营”的重要举措.首先,介绍了手机用户画像过程中对个人隐私保护的方法,然后分析手机用户画像的数据来源与大数据实现技术,最后,通过数据样本实例分析手机用户画像在个人征信中的应用. 引言 随着计算机网络技术的不断发展,“数据即资源”的大数据时代已经来临.用户画像是电信运营商为了避免管道化风险,实现“数据驱动业务与运营”的重要举措.用户画像与应用大数据技术对客户分类密切相关,是单个客户的众多属性标签的累积:另一方面,在运营商涉足的消费金融领域,对手

基于大数据的线上线下电商用户数据挖掘研究

From:http://www.thebigdata.cn/JieJueFangAn/11932p2.html Online-to-Offline( 简称 O2O)电子商务模式,是一个连接线上用户和线下商家的多边平台商业模式. O2O 商业模式将实体经济与线上资源融合在一起,使网络成为实体经济延伸到虚拟世界的渠道; 线下商业可以到线上挖掘和吸引客源,而消费者可以在线上筛选商品和服务并完成支付,再到实体店完成余下消费. 它最先由 TrialPay 创始人 AlexRampell提出,在 2006