大数据分析工具盘点-你不知道的15个新技术

  大数据中的大作为,最近几周业内都忙碌着,很多初创公司和一些老牌的公司都推出了数据分析和数据管理产品,以及更新了现有产品,提供更丰富的功能与性能。

  虽然这些技术都还只是蓝图规划,但是一些常见的主题还是对其贯穿始终:为用户提供简单的获得数据的访问方式,更好的管理大规模数据以及预先分析的功能,例如Spark、HAWQ和Geode等新兴的大数据技术来实现更多的功能。

  下面一起来看看吸引眼球的十五项大数据公告。虽然罗列了很多,但还不是全部内容,只是最近在加利福尼亚州圣何塞市Strata + Hadoop World大会上亮相的部分技术。

  1.Altiscale Insight Cloud

  Altiscale作为大数据服务的提供者,最近推出了Altiscale Insight Cloud产品,是一个自主服务型的数据分析服务产品,能够帮助业务分析人员使用BI工具等类似于Tableau和Excel的产品,实现快速的数据湖查询,而不需要IT部门投入过多的精力参与。

  Altiscal Insight

  Cloud可以驱动SQL查询、动态可视化、实时仪表板和其他报告及分析能力。它不再因为聚合数据而需要一个单独的关系数据存储,绕过了价格昂贵的、专属的数据库系统。

  Altiscale还与Tableau建立了一个战略联盟,能够让Altiscale客户通过使用Tableau的数据可视化软件与Altiscale服务结合的产品,而实现数据发现的应用服务。

  2.AtScale Intelligence Platform 4.0

  AtScale软件提供了一种使用流行的商业智能工具的方法,包括Tableau和Qlik,可以访问存储在Hadoop集群中的数据。该软件创建了Hadoop和第三方工具之间的语义层级,从本上来说,通过联机分析处理服务器而实现多维分析的方法。

  4.0版本提供了多达100项的新功能和系统改进,其中许多都与企业的安全和性能有关。

  新AtScale Hybrid Query

  Service(AtScale混合查询服务),是可以在本地实现支持SQL和MDX查询语言的商业智能工具。由于许多企业和组织在其整个组织中使用多种BI工具,所以说AtScale对于SQL和MDX的支持也就意味着这些企业不需要在其用户的电脑中下载新的客户端软件或者自定义驱动了。

  3.BlueData EPIC Spring Release

  BlueData EPIC是一个大数据即服务平台,旨在减少实施大数据技术的复杂性,例如Hadoop 和Spark。

  EPIC发布的春季版本中提供了几十种的新性能和功能改进,包括在多租户部署中提高服务的安全性和服务质量。该清单包括更多的颗粒资源管理控制、基于QoS的分配、性能优化和用于多租户部署的配额执行功能。

  新版本还支持更大范围的大数据的应用程序和工具,包括用于数据管理和安全管理的Cloudera Navigator以及Ranger,用于大规模并行处理分析的HAWQ,以及Geode、Cassandra和用于实时分析的Kafka。

  4.Domo商务云

  Domo 商务云是一个对于商务管理应用的生态系统,包括免费和付费的预包装,为企业决策者提供数据、见解和访问的支持,以及所有可以帮助找到商务问题的答案,甚至是特定行业和特定角色中。该公司提供云计算的免费版本,如果用户需要存储更多的数据或者获取更先进的企业功能,例如行政管制得话需要另行付费。

  Domo最近还推出了应用商店,带有1000多个商务管理应用以扩张商务云系统,并开始了Domo应用发布合作伙伴计划,为第三方独立软件开发商开发商务云软件。

  Domo同时还推出了Buzz,是与商务云一起工作的社交协作平台,以及允许商务云访问任何移动设备的Domo Mobile产品。

  5.Kyvos Insights With Azure HDInsight

  Kyvos Insights的旗舰产品运行在Hadoop系统上,并允许企业用户通过可视化,探索和分析的存储在Hadoop中大数据的可大规模扩展的联机分析处理(OLAP)系统。

  该Kyvos软件现在与Azure的HDInsight协同工作,微软基于云计算的Hadoop的平台,可以帮助Azure HDInsight用户通过部署Kyvos从而实现分析任务。

  6.IBM云数据服务的Looker Blocks

  Looker为基于Web的商业智能平台提供了访问驻留在数据库中或者云中的数据。去年,该公司推出了被称为Looker Blocks的可复用、可定制的业务逻辑组件,可以创建完整的业务分析查询功能。

  Looker与IBM合作开发了一套Looker

  Blocks组件,通过利用IBM的云数据服务实现更加简化和可定制的数据分析服务。根据这两家公司所称,该组合将允许客户在数天内部署一个完整的数据平台。

  7.MapD Technologies GPU-Powered Database

  MapD Technologies推出了新的数据库和可视化分析软件,利用图形处理单元芯片帮助数据分析师交互式地探索大型数据集。

  通过利用GPU的强大动力,数据库可以在每台服务器将近4000个核上并行查询,比领先的内存数据库提供更快的性能。使用带有MapD

  Immerse分析前端工具的数据库可以更快的处理复杂数据库的可视性问题。(例如政治捐款,在此地图上就可以看到数据)。

  8.MemSQL 5

  MemSQL开发了其同名的数据库,用于事务处理和实时分析。在该公司公布的最新版本MemSQL5中,提供了一系列的新技术和增强的功能,以提高软件的数据库、数据仓库和流媒体的工作负载性能。

  在新版本中,通过混合的事务处理或者分析处理将事务和分析合并成一个单一的数据库,以支持OLTP和OLAP查询。用户可以在大量的写入负载中实现实时查询。借助于可插拔的认证模块以及类似于Kerberos的工具提高了安全性。用户可以通过使用MemSQLStreamliner来部署Apache Spark,创建了用户可视化界面的实时数据管道,同时消除了批量的ETL任务。

  9.Paxata Spring ’16 Release

  Paxata的自适应数据准备平台,建立在Apache Spark之上,运行在最优化的Hadoop环境中,提供了数据集成、数据质量、语义丰富、协作和管理能力。

  新版本提高了软件的能力,通过先进filtergrams综合数据分析,跨越列宽数据集的细粒度搜索,对于数据发现与统计选项的新的选择,以及在Hadoop压缩文件下集成复杂的嵌套JSON/XML数据,为用户提供了连接信息的能力。

  该版本还包括新的IT控制,以提高系统的管理、安全性和规模。

  10.Platfora Big Data Discovery 5.2

  Platfora是一个很大的数据发现平台,建立本地的Apache Hadoop和Spark。最新的版本”democratizes(民主化)”大数据,使其更容易使用现有的商业智能工具来访问Hadoop数据。

  新版本提供了本地Tableau直接出口,用以准备和丰富数据集成的Tableau

  (画面数据提取)数据到Tableau桌面和Tableau服务器中。其他前端BI工具可以通过lens-accelerated SQL访问Platfora数据,通过SparkSQL和ODBC处理查询。

  Platfora5.2也直接运行在Hadoop集群上,除了传统的专用配置外,可以助其更容易地利用现有的硬件,并重新调整计算资源。用于数据可视化的Platfora

  Vizboard已经得到增强,能够”更加智能化”的默认可视化效果。

  11.Ryft One Cluster

  Ryft系统开发的硬件/软件设备,使用FPGA的并行处理能力处理器加速了tb和pb级别的数据分析能力。

  新版的Ryft One Cluster使用带有开放API接口的混合FPGA/x86计算架构,该公司表示,这可以实现以100倍的速度加速大数据生态系统的发展,同时降低70%的成本。

  新系统扩展了数据分析性能和存储线性,处理分析速度达到每秒200GB以上。它可以作为一个独立的群集或作为现有的Apache Spark系统或其他大数据生态系统的一部分工作。

  12.Tableau 9.3

  Tableau公布了Tableau 9.3全面上市,在最新的版本中,其最受欢迎的数据可视化软件可以永久地连接桌面功能和Snowflake Elastic Data数据仓库。

  Tableau Desktop的”一直连接”功能可以更容易的与他人分享结果,同时留存在流动的分析过程中。该软件的全球地图覆盖功能获得了显著地提升,新数据添加到了地址解析数据库和Tableau Map Service中。

  在9.3版本中,本地连接到本机连接到Snowflake Computing的云数据仓库系统更易于Tableau用户执行简单和复杂数据探索和分析。这两家公司还将继续合作,帮助客户将他们的业务分析过程转移到云端。

  13.Talena ActiveRx

  Telena的软件是用于在测试和开发、备份和恢复、归档和法规遵从和灾难恢复系统中优化数据。

  Talena最近推出了ActiveRx,是一款新的预测分析软件,它采用机器学习算法和数据可视化,以更好地管理大数据的管理工作负载,和更准确地预测数据的可用性。

  ActiveX软件还提供了”驱动副本分析”功能,企业可以用它来把闲置的备份数据转换成有用的资产。

  14.Tamr Apache Spark Compatibility

  Tamr的数据统一平台拥有丰富的企业的数据 ,汇聚了从企业内部和外部的数百甚至数千数据源进行分析。

  Tamr宣布其软件可与Apache Spark兼容,其内存处理引擎可用于扩展机器学习,Tamr表示,其补充了机器驱动方式以备企业数据之需。

  Tamr也在开发开放的接口和核心组件来支持由Spark驱动的数据监护系统。

  15.Trifacta Photon

  Trifacta开发了”数据争论”软件,揭开了光子计算框架,新技术的核心用户界面,在大规模的内存数据集时为用户提供了丰富的交互式数据探索和转型的经验。

  数据争论是原始数据的转化过程,将复杂的数据转换成清洁的,结构化的数据转化成可分析的,这是数据分析过程中最具有挑战性的一个部分。

  Photon产品符合Apache Arrow内存数据架构的说明要求,在与数据内容交互的时候为用户提供了即时的反馈。Photon引擎在更高水平的计算中实现更多的数据探索。

时间: 2024-10-09 01:34:02

大数据分析工具盘点-你不知道的15个新技术的相关文章

大数据分析工具采购指南

  大数据分析工具使用户能够分析各种各样的信息--包括结构化事务数据和社交媒体帖子.Web服务器日志文件及其他形式的非结构化和半结构化数据.一旦组织决定要购买一个大数据分析工具,下一步就是制定一个流程,评估可用的产品,然后从中找到一个最适合你需求和要求的产品. 下面我们将介绍在评估各种大数据分析工具符合企业需求的程度时可能用到的必备特性和特定属性.然后,你再编写一个预案请求(RFP),说明使用这些工具将如何解决组织的需求. 一.  建模技术的广度与深度 供应商已经应用了不同级别的建模,并且相应地

推荐五个大数据分析工具

大数据分析工具主要是针对规模巨大的大数据进行分析.随着大数据时代的到来,大数据分析工具也应运而生,今天小编来给大家推荐五个最好的大数据分析工具. 一.Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架.但是 Hadoop 是以一种可靠.高效.可伸缩的方式进行处理的.Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理.Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度.Hadoop 还是

大数据分析工具为你保驾护航

前言: 谈到大数据分析工具,可能很多人都还不了解什么是大数据分析工具.至少在大多数行业里少提到大数据分析工具.大数据分析.大数据可视化这个说法,可以说大数据技术架构,大数据分析软件,也可能说数据挖掘软件.这里提到的大数据分析工具是指各种大数据分析,大数据挖掘软件.今天我们来看看大数据分析工具到底有哪些应用前景: 大数据分析工具在营销中的作用: 接下来,谈谈大数据分析工具,在营销领域中发挥的作用.营销监控与评估:这个是容易被忽视的领域,因为是涉及到具体战术的工作. 以后大多数人都关注营销效果的最终

大数据分析工具

  随着互联网科技日益成熟,各种类型的数据增长将会超越历史上任何一个时期.用户想要从这庞大的数据库中提取对自己有用的信息,就离不开大数据分析技术和工具.大数据商务智能平台是革命性的商务智能工具,搜索级商务智能,分析过去,监控现在,预测未来,即刻发现业务,做出更智慧的决策.ETHINK大数据商务智能平台提供一站式数据存储平台和一站式管理平台,能够连接各类不同的数据库或分布式数据库,并支持对各种大数据存储平台的连接和访问,对数据进行合并.搜索.可视化和分析.通过为客户提供一站式存储与管理服务,帮助客

MySQL管理员珍藏:十大必备工具盘点

作者:dongdongzzcs 第1页: [IT168 专稿]本文的作者Daniel Nichter是MySQL工具的开发者,他为MySQL管理员推荐了十款必备工具.以下是全文内容: MySQL是一套需要大量辅助工具加以修复.诊断及优化的复杂系统.幸运的是,对于管理员来说,MySQL的高普及度吸引了大量软件开发商为其打造高品质的各类开源工具,内容涵盖MySQL系统的复杂性均衡.性能表现维持及稳定运行保障,而且其中大部分是免费工具. 下列十款开源工具对于使用MySQL的用户来说是极为宝贵的财富,其

大数据分析,利用向外扩展技术深入挖掘商业价值

导语:大数据分析技术的价值在企业领域已经非常明确.充分利用良好信息的能力一直是摆在IT部门面前的重要难题与挑战.现在我们已经拥有了足以解决这一难题的工具,接下来要做的就是想办法使其为自己服务了. 方方面面的发展改进已经让从半结构化数据中获取有价值信息成为可能.以Hadoop为代表的新型解决方案在构建层面就充分考虑到了要如何适应跨商用服务器集群的分布式运行环境. 大数据:以需求为导向的审视角度 新型分析工具与极大丰富的处理能力为我们敞开了一道大门,如今企业已经能够借此对庞大的业务及外部数据加以审视

大数据分析案例

部分数据来源于网络,如有侵权请告知. 一.大数据分析在商业上的应用 1.体育赛事预测 世界杯期间,谷歌.百度.微软和高盛等公司都推出了比赛结果预测平台.百度预测结果最为亮眼,预测全程64场比赛,准确率为67%,进入淘汰赛后准确率为94%.现在互联网公司取代章鱼保罗试水赛事预测也意味着未来的体育赛事会被大数据预测所掌控. “在百度对世界杯的预测中,我们一共考虑了团队实力.主场优势.最近表现.世界杯整体表现和博彩公司的赔率等五个因素,这些数据的来源基本都是互联网,随后我们再利用一个由搜索专家设计的机

大数据简介与大数据分析

最近几年,大数据热得像烫手山芋!什么是大数据?通过查阅资料,整理一番,博文将给您带来福利了! 大数据概念 "大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取.管理和处理. "大数据"首先是指数据体量(volumes)?大,指代大型数据集,一般在10TB?规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量:其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐

案例解读|江苏银行—智多星大数据分析云平台实践

2014年10月,江苏银行夏平董事长确立了利用大数据实现弯道超车的发展战略,将大数据应用提升到全行发展的战略层面.2015年上半年,江苏银行完成了大数据平台选型和建设,选择发布版Hadoop进行底层数据存储加工.接着,进行内外部数据整合. 三个阶段的完成,意味着大数据基础设施建设工作已完成,如果把大数据建设工作看做一颗大树,前两个阶段完成意味着树干和树枝已长成,接下来的大数据应用像树枝上的树叶一样,热点频出,精彩纷呈.业务的创新带来大量新增的大数据分析需求,传统的数据库工具和报表工具遭遇瓶颈.