Apache Gora介绍

介绍

Gora是一个开源的ORM框架,主要为大数据提供内存数据模型与数据的持久化。目前Gora支持对于列数据、key-value数据,文档数据与RDBMS数据的存储,还支持使用Apache Hadoop来对对大数据进行分析

特点

虽然目前市面上有很多不错的关系数据库的ORM框架,但是基于数据模型的框架如JDO还是有一些不足,如对于列数据模型的存储与持久化。Gora正好弥补了这个问题,它能使用户很容易对大数据时行 内存建模与持久化,而且支持Hadoop来对大数据进行分析。

Gora就是一个大数据的表示与持久化框架,它有如下特点

  1. 数据持久化:它可以对列数据进行持久化,如HBase,Cassandra,Hypertable; key-value数据进行持久化,如Voldermort,Redis等,SQL数据库进行持久化,如MySQL,HSQLDB,也可以对文件进行HDFS存储 。
  2. 数据访问:可以使用Java API对数据进行轻松的访问
  3. 索引:可以持久化对象到Lucene或者Solr中去,可以使用Gora API来进行查询
  4. 分析:可以使用Apache Pig,Hive,cascading来对数据进行分析
  5. MR的支持:原生支持Hadoop的MR框架,这个已经被用在Nutch 2.0上了
  6. 支持使用Pig,lucene,hive等针对数据进行持久化,索引和分析工作

更多信息请参考:http://gora.apache.org

缺点

目前除Nutch2外,在其他开源产品中使用Gora的好像没有看到

Nutch2系列通过gora对存储层进行了扩展,可以选择使用HBase、Accumulo、Cassandra 、MySQL 、DataFileAvroStore、AvroStore中任何一种来存储数据,但其中一些并不成熟。

目前gora还亟待改进。对于追求性能极致的朋友来说,nutch2.x还不稳定,建议使用nutch1.x,利用HDFS和MapReduce的数据本地化及天然的并行性,可以优化到非常快的速度。

时间: 2024-11-25 18:31:06

Apache Gora介绍的相关文章

1.Apache StratOS介绍

关于Apache Stratos ApacheStratos介绍 平台即服务(PaaS)是云计算的一种模式,通过PaaS给开发人员提供平台和环境,使得他们可以通过互联网进行应用开发和构建工作.Apache Stratos是源于Apache社区的PaaS框架,用于解决当前PaaS所面临的不同挑战.同时,也充当多种不同类型PaaS平台的基础,例如:Application PaaS(aPaaS).Integration PaaS(iPaaS)和Data PaaS(dPaaS). Stratos可以部署

WebServer 之http与httpd(apache)基础介绍

httpd是Apache超文本传输协议(HTTP)服务器的主程序.被设计为一个独立运行的后台进程,它会建立一个处理请求的子进程或线程的池.说到httpd,首先就要了解HTTP协议,HTTP协议(HyperText Transfer Protocol,超文本传输协议)是用于从WWW服务器传输超文本到本地浏览器的传输协议.它可以使浏览器更加高效,使网络传输减少.它不仅保证计算机正确快速地传输超文本文档,还确定传输文档中的哪一部分,以及哪部分内容首先显示(如文本先于图形)等. 以下是个人对WebSer

Apache详细介绍 - [ Apache v2.4.10 for Windows ]

详细介绍 - [ Apache v2.4.10 for Windows ] 下载:http://down.admin5.com/fuwuqi/Apache_Windows.html Apache是世界使用排名第一的Web服务器软件.它可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件.同时Apache音译为阿帕奇,是北美印第安人的一个部落,叫阿帕奇族,在美国的西南部.也是一个基金会的名称.一种武装直升机等等. Apacheweb服务器软件拥有以

www服务及apache软件介绍

www服务使用排名 来源:http://news.netcraft.com/ apache -- 中小型静态web服务的主流,web服务老大哥 Nginx --> 大型新兴网站服务主流,web服务器中的出生牛犊 lightted --> 静态web服务不温不火,社区不活跃,静态效率恒爱 tomcat --> 中小企业动态web服务器,互联网java容器主流 resion --> 大型动态web服务主流,互联网java容器主流 php(fcgi) --> 大中小网站,php程序

7.PHP内核探索:Apache模块介绍

Apache概述 Apache是目前世界上使用最为广泛的一种Web Server,它以跨平台.高效和稳定而闻名.按照去年官方统计的数据,Apache服务器的装机量占该市场60%以上的份额.尤其是在 X(Unix/Linux)平台上,Apache是最常见的选择.其它的Web Server产品,比如IIS,只能运行在Windows平台上,是基于微软.Net架构技术的不二选择. Apache支持许多特性,大部分通过模块扩展实现.常见的模块包括mod_auth(权限验证).mod_ssl(SSL和TLS

Apache Commons介绍(转载)

一.Commons BeanUtils说明:针对Bean的一个工具集.由于Bean往往是有一堆get和set组成,所以BeanUtils也是在此基础上进行一些包装. 二.Commons CLI说明:这是一个处理命令的工具.比如main方法输入的string[]需要解析.你可以预先定义好参数的规则,然后就可以调用CLI来解析. 三.Commons Codec说明:这个工具是用来编码和解码的,包括Base64,URL,Soundx等等.用这个工具的人应该很清楚这些,我就不多介绍了. 四.Common

apache的介绍和安装详解

apache介绍 介绍: Apache:Apache HTTP Server是开源软件项目的杰出代表,基于标准的HTTP协议提供网页浏览服务.Apache可以运行在Windows,Linux,Unix等多种操作系统平台上 安装 apache默认在系统镜像里有,名为httpd包,可以用yum直接安装,也可以用源码包编译安装.源码包编译安装方式可以定制所需功能,加载特定的模块.所以生产环境下一般都是源代码编译安装 下面介绍怎么用源码报编译安装apache.版本为(httpd-2.4.4) 1)卸载系

第15章01章节 Apache服务介绍,安装及排错

第15章 Apache服务· 15.1Apache介绍 Apache是一款Web服务器软件,有多种产品,可以支持SSL技术,支持多个虚拟主机.它快速.可靠并且可通过简单的API扩充,将Perl/Python等解释器编译到服务器中. Apache的特点是简单.速度快.性能稳定,并可做代理服务器来使用.它可以在大多数计算机操作系统中运行,由于其跨平台和安全性被广泛使用. Apache HTTP Server(简称Apache)是Apache软件基金会的一个开放源码的网页服务器,可以在大多数计算机操作

Apache配置介绍

Apache在互联网上非常广泛的web服务程序,在Linux系统上是httpd的服务器名称.而且属于开源程序,可以跨平台使用,经过多次修改,成为世界使用排名第一的Web服务器软件. Apache的安装: 配置yum源,系统光盘上直接提供rmp包,centos7上版本2.4以上.2.4新加了很多特性,模块化管理为维护提供了很多方便之处.这里就centos6上的2.2.15版本来说明. 工作特性: Apache的工作方式有3种:prefork,worker,event. prefork:多进程工作,