Apache Gora介绍

介绍

Gora是一个开源的ORM框架，主要为大数据提供内存数据模型与数据的持久化。目前Gora支持对于列数据、key-value数据，文档数据与RDBMS数据的存储，还支持使用Apache Hadoop来对对大数据进行分析

特点

虽然目前市面上有很多不错的关系数据库的ORM框架，但是基于数据模型的框架如JDO还是有一些不足，如对于列数据模型的存储与持久化。Gora正好弥补了这个问题，它能使用户很容易对大数据时行内存建模与持久化，而且支持Hadoop来对大数据进行分析。

Gora就是一个大数据的表示与持久化框架，它有如下特点

数据持久化：它可以对列数据进行持久化，如HBase,Cassandra,Hypertable; key-value数据进行持久化，如Voldermort,Redis等，SQL数据库进行持久化，如MySQL,HSQLDB，也可以对文件进行HDFS存储。
数据访问：可以使用Java API对数据进行轻松的访问
索引：可以持久化对象到Lucene或者Solr中去，可以使用Gora API来进行查询
分析：可以使用Apache Pig,Hive,cascading来对数据进行分析
MR的支持：原生支持Hadoop的MR框架，这个已经被用在Nutch 2.0上了
支持使用Pig,lucene,hive等针对数据进行持久化，索引和分析工作

更多信息请参考：http://gora.apache.org

缺点

目前除Nutch2外，在其他开源产品中使用Gora的好像没有看到

Nutch2系列通过gora对存储层进行了扩展，可以选择使用HBase、Accumulo、Cassandra 、MySQL 、DataFileAvroStore、AvroStore中任何一种来存储数据，但其中一些并不成熟。

目前gora还亟待改进。对于追求性能极致的朋友来说，nutch2.x还不稳定，建议使用nutch1.x，利用HDFS和MapReduce的数据本地化及天然的并行性，可以优化到非常快的速度。

时间： 2024-11-25 18:31:06

Apache Gora介绍的相关文章

1.Apache StratOS介绍

关于Apache Stratos ApacheStratos介绍平台即服务(PaaS)是云计算的一种模式,通过PaaS给开发人员提供平台和环境,使得他们可以通过互联网进行应用开发和构建工作.Apache Stratos是源于Apache社区的PaaS框架,用于解决当前PaaS所面临的不同挑战.同时,也充当多种不同类型PaaS平台的基础,例如:Application PaaS(aPaaS).Integration PaaS(iPaaS)和Data PaaS(dPaaS). Stratos可以部署

WebServer 之http与httpd(apache)基础介绍

httpd是Apache超文本传输协议(HTTP)服务器的主程序.被设计为一个独立运行的后台进程,它会建立一个处理请求的子进程或线程的池.说到httpd,首先就要了解HTTP协议,HTTP协议(HyperText Transfer Protocol,超文本传输协议)是用于从WWW服务器传输超文本到本地浏览器的传输协议.它可以使浏览器更加高效,使网络传输减少.它不仅保证计算机正确快速地传输超文本文档,还确定传输文档中的哪一部分,以及哪部分内容首先显示(如文本先于图形)等. 以下是个人对WebSer

Apache详细介绍 - [ Apache v2.4.10 for Windows ]

详细介绍 - [ Apache v2.4.10 for Windows ] 下载:http://down.admin5.com/fuwuqi/Apache_Windows.html Apache是世界使用排名第一的Web服务器软件.它可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件.同时Apache音译为阿帕奇,是北美印第安人的一个部落,叫阿帕奇族,在美国的西南部.也是一个基金会的名称.一种武装直升机等等. Apacheweb服务器软件拥有以

www服务及apache软件介绍

www服务使用排名来源:http://news.netcraft.com/ apache -- 中小型静态web服务的主流,web服务老大哥 Nginx --> 大型新兴网站服务主流,web服务器中的出生牛犊 lightted --> 静态web服务不温不火,社区不活跃,静态效率恒爱 tomcat --> 中小企业动态web服务器,互联网java容器主流 resion --> 大型动态web服务主流,互联网java容器主流 php(fcgi) --> 大中小网站,php程序

7.PHP内核探索：Apache模块介绍

Apache概述 Apache是目前世界上使用最为广泛的一种Web Server,它以跨平台.高效和稳定而闻名.按照去年官方统计的数据,Apache服务器的装机量占该市场60%以上的份额.尤其是在 X(Unix/Linux)平台上,Apache是最常见的选择.其它的Web Server产品,比如IIS,只能运行在Windows平台上,是基于微软.Net架构技术的不二选择. Apache支持许多特性,大部分通过模块扩展实现.常见的模块包括mod_auth(权限验证).mod_ssl(SSL和TLS

Apache Commons介绍（转载）

一.Commons BeanUtils说明:针对Bean的一个工具集.由于Bean往往是有一堆get和set组成,所以BeanUtils也是在此基础上进行一些包装. 二.Commons CLI说明:这是一个处理命令的工具.比如main方法输入的string[]需要解析.你可以预先定义好参数的规则,然后就可以调用CLI来解析. 三.Commons Codec说明:这个工具是用来编码和解码的,包括Base64,URL,Soundx等等.用这个工具的人应该很清楚这些,我就不多介绍了. 四.Common

apache的介绍和安装详解

apache介绍介绍: Apache:Apache HTTP Server是开源软件项目的杰出代表,基于标准的HTTP协议提供网页浏览服务.Apache可以运行在Windows,Linux,Unix等多种操作系统平台上安装 apache默认在系统镜像里有,名为httpd包,可以用yum直接安装,也可以用源码包编译安装.源码包编译安装方式可以定制所需功能,加载特定的模块.所以生产环境下一般都是源代码编译安装下面介绍怎么用源码报编译安装apache.版本为(httpd-2.4.4) 1)卸载系

第15章01章节 Apache服务介绍，安装及排错

第15章 Apache服务· 15.1Apache介绍 Apache是一款Web服务器软件,有多种产品,可以支持SSL技术,支持多个虚拟主机.它快速.可靠并且可通过简单的API扩充,将Perl/Python等解释器编译到服务器中. Apache的特点是简单.速度快.性能稳定,并可做代理服务器来使用.它可以在大多数计算机操作系统中运行,由于其跨平台和安全性被广泛使用. Apache HTTP Server(简称Apache)是Apache软件基金会的一个开放源码的网页服务器,可以在大多数计算机操作

Apache配置介绍

Apache在互联网上非常广泛的web服务程序,在Linux系统上是httpd的服务器名称.而且属于开源程序,可以跨平台使用,经过多次修改,成为世界使用排名第一的Web服务器软件. Apache的安装: 配置yum源,系统光盘上直接提供rmp包,centos7上版本2.4以上.2.4新加了很多特性,模块化管理为维护提供了很多方便之处.这里就centos6上的2.2.15版本来说明. 工作特性: Apache的工作方式有3种:prefork,worker,event. prefork:多进程工作,

猜你喜欢

python基础随学笔记

1.python字符串输出有很多种.a='''name:{0},age:{1},sex:{2}'''.format(name,age,sex)第一种 name="lijiaxiang&quo ...

js中的一元加法和一元减法

大多数人都熟悉一元加法和一元减法,它们在 ECMAScript 中的用法与您高中数学中学到的用法相同. 一元加法本质上对数字无任何影响: 1 var iNum = 20; 2 iNum = +iNum ...

Android深度探索心得（四）

本章主要学的是下载.编译.和测试Android源代码.其次就是学到了下载和编译Linux内核源代码. 首先是编译Android源代码,由于Android源代码中的每一个工程目录都有Android.mk ...

三年回想——大学毕业工作后的感悟

从2012年9月到2016年1月,从大学毕业到现在就业,已经有3个多年头了.在这三个多年头里自己学到了不少的东西,也明白了一些做人的道理我的大学是一个一点儿也不知名的专科院校,落后的环境.师资.教育 ...

【白话篇】10分钟搞懂字符编码

如上图所示为常见的,让人看了头晕的几个种编码. 看懂下面几条规则,你就明白他们的关系了. [1]有些人说,GBK严格来说是字符集,而utf-8则是编码,这种区分已经相当模糊了,他们都是"字 ...

poj3126

被坑了3个小时,本来以为算法错了,谁知道,竟然是素数筛弄错了 !!! #include <iostream>#include <stdio.h>#include <str ...

Android-broadcast静态动态广播

广播的静态和动态类型静态广播: 1.继承之broadcastreceiver public class MyStaticBroadcastReceiver extends BroadcastRece ...

to refactor for refactor

v1.1 if all algorithm are in one function, it will expand. so each operate type should be separated. ...

STL 源码剖析算法 stl_algo.h -- nth_element

本文为senlie原创,转载请保留此地址:http://blog.csdn.net/zhengsenlie nth_element ---------------------------------- ...

[Tool] Open Live Writer 插件更新

一.更新内容 cnblog 页签中增加 Lua 和 Matlab 语法高亮:(SyntaxHighlight 页签中尚未添加) 增加折叠区域插件,见效果展示: 增加 bat 执行文件,直接拷贝插件所需 ...

这种情况下,将所有的数据追加到NSMutableArray中. dispatch_queue_t queue = dispatch_get_global_queue(DISPATCH_QUEUE_PR ...

html和css简单的布局方式

在写网站时,一个好的布局会直接影响到这个网站的好坏.而很多人刚刚学前端的人对CSS的布局都有一定的困惑,实际上的应用场景中,会由于多种原因而造成布局种类多而难以选择.现在我就说说自己对CSS布局的理解 ...

Ubunto VMware-Tools

PHPExcel说明下面是总结的几个使用方法 include 'PHPExcel.php'; include 'PHPExcel/Writer/Excel2007.php'; //或者include ...

Js上传图片，兼容ie

var upImg_config = { e0:'上传出错,请重试!', e2:'今日上传超过限制次数', e3:'照片格式不符合要求!', e4:'上传出错,请重试!', e5:'照片大小超过限制! ...

想控制GIF图片动画播放吗？试试gifffer.js

在线演示:http://www.gbtags.com/gb/demoviewer/3578/c6bec39a-61ae-4017-8e23-e0bc1eeb740f/example|index.htm ...

CMD和AMD探秘

踏上前端这条道路以来,我一直以为自己就是个娴熟的切图工,每天只需要做着重复的劳动,切图,做网站.然而,技术的发展是日新月异的,切图工早就面临淘汰.随着浏览器功能越来越完善,前端项目越来越大,代码越来越 ...

iOS 美丽说瀑布流界面纯AutoLayout光速布局

最近在Github上看到三个库,分别是 GSKStretchyHeaderView,CHTCollectionViewWaterfallLayout ,JZNavigationExtension, 其 ...

Python不归路_文件操作(一)

Python文件操作 Python文件操作的语法是: open(file,mode,buffering,encoding,erros,newline,closefd) 我们先来看下各个参数, file ...

Spring Boot Dubbo applications.properties 配置清单

参考链接:http://blog.csdn.net/jeffli1993/article/details/71480627

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.021 s.