Nutch的发展历程(转)

2002年8月由Doug Cutting发起,托管于Sourceforge,之后发布了0.4、0.5、0.6三个版本

2004年9月Oregon State University(俄勒冈州立大学)采用Nutch

2004年9月Creative Commons(知识共享)推出基于Nutch的搜索服务

2005年1月加入Apache的孵化器

2005年6月孵化结束成为Lucene的子项目

2005年8月发布版本0.7( Apache Lucene sub-project)

2005年10月发布版本0.7.1

2006年3月发布版本0.7.2

2006年7月发布版本0.8(全新的架构,基于Hadoop 0.4 ,Hadoop诞生)

2006年9月发布版本0.8.1

2007年4月发布版本0.9

2009年3月发布版本1.0(Tika诞生,0.1-incubating)

2010年4月Nutch成为Apache顶级项目

2010年6月发布版本1.1

2010年9月发布版本1.2

2011年6月发布版本1.3( 从搜索引擎到网络爬虫)

2011年11月发布版本1.4

2012年6月发布版本1.5

2012年7月发布版本2.0( 2.X  Gora诞生,table-based architecture )

2012年7月发布版本1.5.1

2012年8月Nutch诞生十周年

2012年10月发布版本2.1( 2.X开始支持elastic search )

2012年12月发布版本1.6

2013年6月发布版本2.2(crawler-commons 诞生)

2013年6月发布版本1.7(crawler-commons 诞生)

2013年7月发布版本2.2.1

时间: 2024-10-26 12:40:39

Nutch的发展历程(转)的相关文章

Nutch的发展历程

Nutch的创始人是Doug Cutting,他同时也是Lucene.Hadoop和Avro开源项目的创始人 下面是Nutch的发展历程: 2002年8月由Doug Cutting发起,托管于Sourceforge,之后发布了0.4.0.5.0.6三个版本 2004年9月Oregon State University(俄勒冈州立大学)采用Nutch 2004年9月Creative Commons(知识共享)推出基于Nutch的搜索服务 2005年1月加入Apache的孵化器 2005年6月孵化结

豆瓣网技术架构的 发展历程(一)

豆瓣简介: •2005年3月上线 •以分享和发现为核心的社区 •读书.电影.音乐.小组.同城.九点 •我的豆瓣.友邻  一些数据: •2.8M注册用户,约1/4活跃用户•千万级非注册用户•20M动态请求/天,峰值500~600/sec•23台普通PC服务器(1U*15/2U*8) •12台提供线上服务•38G memcached 单服务器: • 单台1U服务器 (frodo)• 单核AMD Athlon 64 1.8GHz• 1G内存,160G SATA*2• Gentoo Linux• MyS

【Kinect开发笔记之(二)】Kinect for windows发展历程

新版本SDK和旧版本的SDK完全兼容,如果您之前安装过旧版本的,可以直接安装新版本的SDK,但是如果您之前的开发版本是Beta版的,则需要卸载之后再安装新版本.在Kinect for Windows SDK 1.0版本中,SDK和示例文件是打包一起安装的.而在之后的版本,为了可以分别升级,微软把这两者分开独立为Kinect for Windows SDK和Kinect for Windows Developer Toolkit这两部分,所以需要分别下载安装, Kinect for Windows

大数据发展历程

一:大数据概念 大数据是由数量巨大.结构复杂.类型众多的数据结构的数据集合,在合理时间内,通过对该该数据集合的管理.处理.并整理成为能帮助政府机构和企业进行管理.决策的讯息. 二:大数据特点 大数据通常具有以下几种特点: 1.大量:即数据体量庞大,包括采集.存储和计算的量都非常大. 2.高速:要求处理速度快,从各类型的数据中快速获得高价值的信息 3.多样:数据种类繁多 4.价值:价值密度低,由于数据产生量巨大且速度非常快,必然形成各种有效数据和无效数据错杂的状态,因此数据价值的密度低. 5.在线

1.编程语言发展历程介绍

1.编程语言的发展历程. 最开始的编程语言代码是010101等形式的编程->机器码->汇编语言->C语言(需要自己管理内存:现有内库和工具不多)->Java/C#/PHP/Python等高级语言(不需要自己管理内存,每一种语言都有自己专门的虚拟机或者叫解释器处理类似这些事情:现存内库和工具相对齐全). 2.Python的种类 Cpython/PYPY(特殊)/JavaPyhong/IronPython/Rubypython 我们常说的python就是Cpython; 针对Cpyth

3D显示技术发展历程与现状

前言: <阿凡达>上映后,3D显示就一发不可收拾.人们惊叹于这项技术通过电影带给人们的视觉冲击力,立体的画面让观众仿佛身临其境,更加接近真实世界的感受.为了让3D显示技术走进大众的视野,广播电视总局发文一系列有关推进3D显示文件,其中北京电视台.央视等多个频道已着手3D制作,有望明年上线. 阿凡达效应仍在持续,无数影迷已如痴如醉,甚至一度出现,无3D不观影之势.如是,3D便如忽如一夜春风来,千树万树梨花开;然而,这时众多伪3D也趁机而入,真正3D却为之甚少.近期,随着国产首部IMAX+3D电影

一 GPU 编程技术的发展历程及现状

前言 本文通过介绍 GPU 编程技术的发展历程,让大家初步地了解 GPU 编程,走进 GPU 编程的世界. 冯诺依曼计算机架构的瓶颈 曾经,几乎所有的处理器都是以冯诺依曼计算机架构为基础工作的. 该系统架构简单来说就是处理器从存储器中不断取指,解码,执行. 但如今,这种系统架构遇到了瓶颈:内存的读写速度已经跟不上 CPU 的时钟频率了.具有此特征的系统被称为内存受限型系统,目前的绝大多数计算机系统都属于此类型. 为了解决这个问题,传统的解决方案是使用缓存技术.通过给 CPU 设立多级缓存,能够大

Java的发展历程

Java的发展历程充满了传奇色彩. 最初,Java是由Sun公司的一个研究小组开发出来的, 该小组起先的目标是想用软件实现对家用电器进行集成控制的小型控制装置. 开始,准备采用C++,但C++太复杂,而且安全性差,最后基于C++开发了一种新的语言Oak, 据说当时是小组成员之一Gosling在苦思冥想这种语言的名字时,正好看到了窗外的一颗橡树, Oak在英文里是"橡树"的意思,所以给该语言命名为Oak. 它是一种用于网络的精巧而安全的语言,但是这个在技术上非常成功的产品在商业上却几近失

Android的发展历程及搭建

Android的发展历程: 对于Android我比较不熟悉,因为我的第一只手机就是iphone,我没用过Android系统,但在中国使用带有Android系统的手机的人数是最多的,所以我想学习Android系统的软件开发,接下来我就简单介绍一下Android的发展历程. Android系统的开发使用的是Java语言.Android系统主要由Google和开放手机联盟领导和开发.Android公司在2003年创建,后由Google收购.经过几年的开发,2008年Android系统最早的版本终于面世