【转】如何在eclipse下配置Heritrix

如何配置在eclipse下配置Heritrix

在其他帖子上看到有Eclipse 配置 Heritrix 1.14.4的文章,这里有很多内容是引用自那里。如http://extjs2.javaeye.com/blog/699751
不过这里对配置有一些进一步的说明。

Eclipse 配置 Heritrix 1.14.4的配置过程如下:

1. 首先从http://sourceforge.net/projects/archive-crawler/ 中下载
heritrix-1.14.4.zip 和 heritrix-1.14.4-src.zip(Windows)

2. 在Eclipse 中创建一个java project的工程(可以命名为Heritrix)

3. 将heritrix-1.14.4-src.zip解压中的src/java 中的 com、org、st三个文件夹复制到工程src下。

4. 将heritrix-1.14.4-src.zip解压中src中conf文件夹复制到项目根目录。

5. 将heritrix-1.14.4-src.zip解压中lib文件夹复制到项目根目录。

6. 将heritrix-1.14.4-src.zip解压中src/resources/org/archive/util中tlds-alpha-by-domain.txt文件复制到工程中org.archive.util包下。

7. 将heritrix-1.14.4.zip解压中webapps文件夹复制到项目根目录。
如果文件夹名称不是webapps 需要在Heritrix.java中进行相应的更改。

Java代码 :/**   * @throws IOException   * @return Returns the directory under which reside the WAR files   * we‘re to load into the servlet container.   */  
  public static File getWarsdir()  throws IOException {         return getSubDir("webapps");     }

/** * @throws
IOException * @return Returns the directory under which reside the WAR files *
we‘re to load into the servlet container. */ public static File getWarsdir()
throws IOException { return getSubDir("webapps"); }

8. 配置文件进行修改,找到conf下heritrix.properties文件

Java代码 :  //设置版本    heritrix.version
= 1.14.4

//设置用户密码
heritrix.cmdline.admin = admin:admin

//设置端口
heritrix.cmdline.port = 8080

9. 对工程进行jar包引入,将lib下面所有的jar包引入工程。

10.Eclipse中导入Heritrix,报错找不到类
sun.net.www.protocol.file.FileURLConnection,sun包是受保护的包,默认只有sun公司的软件才能使用。Eclipse会报错,把对保护使用warning就可以了。Windows ->
Preferences -> Java -> Compiler -> Errors/Warnings-> Deprecated and
trstricted API -> Forbidden reference (access rules): -> change to
warning

11. 添加配置文件夹。如果你运行Heritrix时,在配置页面中没有可选项,这一步可以解决问题。在工程中找到org.archive.crawler.Heritrix.java右键选运行方式配置,选择Classpath ,选择User Entries -- Advanced ,选择Add Folders,将conf文件夹添加进去。

点击Run 开始运行

java代码 :

16:17:09.500
EVENT  Starting Jetty/4.2.23
16:17:09.843 EVENT  Started WebApplicationContext[/,Heritrix Console]
16:17:09.968 EVENT  Started SocketListener on 127.0.0.1:8080
16:17:09.968 EVENT  Started
Heritrix version: 1.14.4

http://www.cnblogs.com/sl-shilong/articles/2829411.html

遇见问题及修复:

heritrix.java 代码文件中语句:“import sun.net.www.protocol.file.FileURLConnection;”

报错如下:

“The type FileURLConnection is not accessible due to restriction on
required library C:\Programe Files\Java\Jre6\lib\rt.jar”

请问如何解决?

补充一下Heritirx 的版本是1.14.4

编程小强 回答于 2012-03-07 11:31

这是 JRE 的访问限制导致报错,在 MyHeritrix 工程上右键单击选择“Build
Path?Configure Build Path …”,然后选择 Library 选项卡,将“JRE System Library”删除然后重新导入一下即可修复。(OK)

或者选择“Windows?Preferences?Java?Compiler?Errors/Warnings”找到“Deprecated and restricted API”下的“Forbidden reference (access rules)”,将默认设置“Error”改为“Warning”或“Ignore”。

时间: 2024-10-30 12:03:36

【转】如何在eclipse下配置Heritrix的相关文章

如何在Eclipse下,实现ant的web项目修改保存后,实时部署,直接刷新即可看到结果

最近碰到了一个老项目,是ant的web项目,把项目导入到Eclipse以后,发现修改了文件之后,要先执行build.xml,再把打包好的war丢到Tomcat下,再刷新才能看到效果.由于以前没用过ant,所以自己研究了一套办法(如果ant确实有像Eclipse下修改后直接刷新就可看到结果的方法,还望众客官不吝赐教). 本项目参考了以下4个帖子: 帖子1:  http://blog.csdn.net/futurelight/article/details/624950 帖子2: http://we

在Eclipse中配置Heritrix

一.新建项目并将Heritrix源码导入 1.下载heritrix-1.14.4-src.zip和heritrix-1.14.4.zip两个压缩包,并解压,以后分别简称SRC包和ZIP包: 2.在Eclipse下新建Java项目,取名Heritrix.1.14.4: 3.复制SRC包下面src/java文件夹下org和st两个文件夹到项目中的src包下: 4.复制SRC包下src下conf文件夹到项目根目录: 5.复制SRC包下lib文件夹到项目根目录: 6.复制ZIP包下webapps文件夹到

如何在Eclipse中配置Tomcat(免安装版)

如何在Eclipse中配置Tomcat(免安装版) 2013-10-09 23:19wgelgrsh | 分类:JAVA相关 | 浏览642次 分享到: 2013-10-10 17:10提问者采纳 一.确定你的Tomcat的安放路径. 这里我以自己的为例子:“E:\安装包\Apache-tomcat-6.0.29-windows-x86\apache-tomcat-6.0.29”.二.安装Eclipse和jdk(推荐1.4以上)(这个就不详细说了)三.下载插件TomcatPlugin 这里我用的

Eclipse下配置TinyOS开发环境

通过给Eclipse安装Yeti 2 - TinyOS 2 Plugin for Eclipse来配置TinyOS IDE,从而可建立TinyOS Project Yeti 2的介绍请参考网站:http://tos-ide.ethz.ch/wiki/pmwiki.php?n=Site.TinyOSEclipsePlugin 1.下载.解压并打开Eclipse(我用的是Eclipse IDE for Java Developers) 2.打开Install对话框:Help->Install New

Eclipse下配置tomcat7的几个重要问题

这段时间开始接触的servlet,今天尝试在eclipse下配置tomcat 7的时候,发现了几个需要注意的问题,相信对新人们会很重要的.我也是新手,在此,将今天一下午外加一晚上配置的经验传播给大家一起来分享(tomcat的安装以及eclipse下配置tomcat的大概步骤,网上很多,在这我就略过了,只列出一些特别的问题) 工具/原料 操作系统: win7 64位 开发工具:eclipse-jee-juno-SR2-win32-x86_64 服务器:apache-tomcat-7.0.35-wi

ubuntu eclipse下配置C++ 环境

首先你通过以下3个命令确定已安装好eclipse cdt sudo apt-get install eclipse sudo apt-get install eclipse-pde sudo apt-get install eclipse-jdt 如果没有出现问题.那你算完成任务了. 但是多数人是会出现问题的,比如我: Unresolved  inclusion <iostream> error 我打开eclipse项目属性 下的Path and Symbols  找到GNU C ++ 下为空

如何在Eclipse下查看JDK源代码 (转)

不会看JDK源代码,相当于没学过JAVA. 从百度上找到一篇帮助我解决了如何在Eclipse下查看JDK源代码 的文章. 在Eclipse中查看JDK类库的源代码!!! 设置: 1.点 “window”-> "Preferences" -> "Java" -> "Installed JRES" 2.此时"Installed JRES"右边是列表窗格,列出了系统中的 JRE 环境,选择你的JRE,然后点边上的

【转】Eclipse下配置CDT和MinGW终极方法。

网上关于Eclipse中配置CDT和MinGW的教程很多,但大部分都比较早,有些方法已经不适合现在的版本了.为了让那些喜爱Eclipse,计划在Eclipse平台下开发C++的爱好者不至于因为第一步没有迈开,而放弃一个绚丽多彩的Eclipse世界,我就在这介绍一些在Eclipse下配置CDT和MinGW的方法. 网上有许多介绍Eclipse配置的文章,但大多步骤较多,令人望而却步.在这里,第一部分先介绍Eclipse的安装,第二部分是CDT+MinGW的傻瓜式安装教程.第三部分是CDT+MinG

Eclipse下配置j2ee开发环境及与MySQL数据库的连接

Eclipse下配置j2ee开发环境 a.配置tomcat  windows->perferences->server->server runtime environments->Add…… b.installes JREs,然后点击Add 默认的standard VM就可以,点击next,然后点击directory 选择本机jdk安装的路径,finish. 与MySQL数据库的连接 与数据库连接要做的事情就是要用jdbc 首先要下载jdbc,在官网上下载,在将其mysql-con