开源商务智能软件Pentaho

1 简介

Pentaho是世界上最流行的开源商务智能软件,以工作流为核心的,强调面向解决方案而非工具组件的,基于java平台的商业智能(Business Intelligence,BI)套件BI,之所以说是套件是因为它包括一个web server平台和几个工具软件:报表,分析,图表,数据集成,数据挖掘等,可以说包括了商务智能的方方面面。它整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案,侧重于大 中型企业应用。它允许商业分析人员或开发人员创建报表,仪表盘,分析模型,商业规则和 BI 流程。

注:以上感觉高大上,但笔者比较鄙视Pentaho这个项目,从布署的角度看,完全没有支撑该项目的标准文档,只有零星的资料,要部署好只能靠反复测试和摸索。

2 实践部分

2.1 环境部分

2.1.1 运行环境

IP Address = 10.168.0.76

HostName = pentaho.cmdschool.org

OS = CentOS 7.3

2.1.2 安装辅助工具

yum install -y unzip

2.1.3 配置防火墙

firewall-cmd --permanent --add-port 8080/tcp
firewall-cmd --reload
firewall-cmd --list-all

2.2 MySQL配置

2.2.1 配置MySQL的源

vim /etc/yum.repos.d/mysql56-community.repo

输入如下内容:

# Enable to use MySQL 5.6
[mysql56-community]
name=MySQL 5.6 Community Server
baseurl=http://repo.mysql.com/yum/mysql-5.6-community/el/7/$basearch/
enabled=1
gpgcheck=1
gpgkey=http://repo.mysql.com/RPM-GPG-KEY-mysql

2.2.2 安装相关包

yum install -y mysql-community-server mysql-community-devel mysql-community-client

2.2.3 启动并配置默认开机启动

systemctl start mysqld
systemctl enable mysqld

2.2.4 初始化数据库

mysql_secure_installation

向导如下:

[...]
Set root password? [Y/n] y
New password:
Re-enter new password:
[...]
Remove anonymous users? [Y/n] y
[...]
Disallow root login remotely? [Y/n] n
[...]
Remove test database and access to it? [Y/n] y
[...]
Reload privilege tables now? [Y/n] y
[...]

2.3 Java配置

2.3.1 创建java目录

mkdir /usr/java

2.3.2 下载JDK

cd /usr/java
wget http://download.oracle.com/otn/java/jdk/8u121-b13/e9e7ea248e2c4826b92b3f075a80e441/jdk-8u121-linux-x64.tar.gz?AuthParam=1495873209_eea482e2b59774918c970cf5dc383fdb

2.3.3 解压安装包

tar -xf jdk-8u121-linux-x64.tar.gz

2.3.4 配置环境变量

vim /etc/profile

末尾加入如下内容:

export JAVA_HOME=/usr/java/jdk1.8.0_121
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

2.3.5 使环境变量生效

source /etc/profile

2.3.6 测试环境变量

java -version

2.4 Pentaho安装包配置

2.4.1 下载程序包

mkdir /usr/pentaho
cd /usr/pentaho
wget https://nchc.dl.sourceforge.net/project/pentaho/Business%20Intelligence%20Server/7.0/pentaho-server-ce-7.0.0.0-25.zip
wget https://nchc.dl.sourceforge.net/project/pentaho/Data%20Integration/7.0/pdi-ce-7.0.0.0-25.zip
wget https://nchc.dl.sourceforge.net/project/pentaho/Report%20Designer/7.0/prd-ce-7.0.0.0-25.zip

注:下载链接,https://sourceforge.net/projects/pentaho/files/

2.4.2 解压程序包

unzip pentaho-server-ce-7.0.0.0-25.zip
unzip pdi-ce-7.0.0.0-25.zip
unzip prd-ce-7.0.0.0-25.zip

2.4.3 更换mysql连接驱动

cd ~
wget https://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.41.tar.gz
tar -xf mysql-connector-java-5.1.41.tar.gz
cp mysql-connector-java-5.1.41/mysql-connector-java-5.1.41-bin.jar /usr/pentaho/pentaho-server/tomcat/lib/
mv /usr/pentaho/pentaho-server/tomcat/lib/mysql-connector-java-5.1.17.jar ~/

注:下载链接,https://dev.mysql.com/downloads/connector/j/

2.4.4 修改Tomcat运行环境变量

vim /usr/pentaho/pentaho-server/tomcat/bin/setenv.sh

修改内容如下:

export JAVA_HOME=/usr/java/jdk1.8.0_121
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
export PENTAHO_JAVA_HOME=${JAVA_HOME}
export INSTALL_HOME=/usr/pentaho/pentaho-server
export DI_HOME=${INSTALL_HOME}/pentaho-solutions/system/kettle
export CATALINA_OPTS="-Xms4096m -Xmx6144m -XX:MaxPermSize=256m -Dsun.rmi.dgc.client.gcInterval=3600000 -Dsun.rmi.dgc.server.gcInterval=3600000 -DDI_HOME=$DI_HOME"

2.4.5 创建程序运行用户

useradd -s /sbin/nologin -b /usr/pentaho

确认用户家目录

ls -ld /usr/pentaho

2.4.6 预配置esapi目录

mkdir /usr/pentaho/esapi

2.4.7 配置目录权限

chown -R pentaho:pentaho /usr/pentaho/
chmod -R 770 /usr/pentaho

2.5 数据库服务配置

2.5.1 修改quartz库的授权

vim /usr/pentaho/pentaho-server/data/mysql5/create_quartz_mysql.sql

注释掉如下行:

# grant all on quartz.* to ‘pentaho_user‘@‘localhost‘ identified by ‘password‘;

2.5.2 修改hibernate库的授权

vim /usr/pentaho/pentaho-server/data/mysql5/create_repository_mysql.sql

注释掉如下行:

# GRANT ALL ON hibernate.* TO ‘hibuser‘@‘localhost‘ identified by ‘password‘;

2.5.3 修改jackrabbit库的授权

vim /usr/pentaho/pentaho-server/data/mysql5/create_jcr_mysql.sql

注释掉如下行:

# grant all on jackrabbit.* to ‘jcr_user‘@‘localhost‘ identified by ‘password‘;

2.5.4 导入数据库

mysql -uroot -p < /usr/pentaho/pentaho-server/data/mysql5/create_quartz_mysql.sql
mysql -uroot -p < /usr/pentaho/pentaho-server/data/mysql5/create_repository_mysql.sql
mysql -uroot -p < /usr/pentaho/pentaho-server/data/mysql5/create_jcr_mysql.sql

2.5.5 配置数据库权限

mysql -uroot -p
grant all on quartz.* to ‘pentaho‘@‘localhost‘ identified by ‘passwd‘;
grant all on hibernate.* to ‘pentaho‘@‘localhost‘ identified by ‘passwd‘;
grant all on jackrabbit.* to ‘pentaho‘@‘localhost‘ identified by ‘passwd‘;
flush privileges;

2.5.6 测试数据库

mysql -upentaho -ppasswd

2.6 迁移数据库等配置

2.6.1 配置Quartz

cd /usr/pentaho/pentaho-server/
cp pentaho-solutions/system/quartz/quartz.properties pentaho-solutions/system/quartz/quartz.properties.default
vim pentaho-solutions/system/quartz/quartz.properties

修改并启用如下参数:

org.quartz.jobStore.driverDelegateClass = org.quartz.impl.jdbcjobstore.StdJDBCDelegate
org.quartz.dataSource.myDS.jndiURL = Quartz

2.6.2 配置hibernate数据源

cd /usr/pentaho/pentaho-server/
cp pentaho-solutions/system/hibernate/mysql5.hibernate.cfg.xml pentaho-solutions/system/hibernate/mysql5.hibernate.cfg.xml.default
vim pentaho-solutions/system/hibernate/mysql5.hibernate.cfg.xml

修改如下标签参数:

<property name="connection.username">pentaho</property>
<property name="connection.password">passwd</property>

2.6.3 配置Hibernate

cd /usr/pentaho/pentaho-server/
cp pentaho-solutions/system/hibernate/hibernate-settings.xml pentaho-solutions/system/hibernate/hibernate-settings.xml.default
vim pentaho-solutions/system/hibernate/hibernate-settings.xml

修改如下标签参数:

<config-file>system/hibernate/mysql5.hibernate.cfg.xml</config-file>

2.6.4 配置审计日志

cd /usr/pentaho/pentaho-server/
cp pentaho-solutions/system/audit_sql.xml pentaho-solutions/system/audit_sql.xml.default
cp pentaho-solutions/system/dialects/mysql5/audit_sql.xml pentaho-solutions/system/

2.6.5 配置repository.xml

cd /usr/pentaho/pentaho-server/
cp pentaho-solutions/system/jackrabbit/repository.xml pentaho-solutions/system/jackrabbit/repository.xml.default
vim pentaho-solutions/system/jackrabbit/repository.xml

注解以下标签和内容:

  <FileSystem class="org.apache.jackrabbit.core.fs.local.LocalFileSystem">
     <param name="path" value="${rep.home}/repository"/>
  </FileSystem>

去掉以下标签和内容注解并修改账号密码:

  <FileSystem class="org.apache.jackrabbit.core.fs.db.DbFileSystem">
    <param name="driver" value="com.mysql.jdbc.Driver"/>
    <param name="url" value="jdbc:mysql://localhost:3306/jackrabbit"/>
    <param name="user" value="pentaho"/>
    <param name="password" value="passwd"/>
    <param name="schema" value="mysql"/>
    <param name="schemaObjectPrefix" value="fs_repos_"/>
  </FileSystem>

注解以下标签和内容:

  <DataStore class="org.apache.jackrabbit.core.data.FileDataStore"/>

去掉以下标签和内容注解并修改账号密码:

  <DataStore class="org.apache.jackrabbit.core.data.db.DbDataStore">
    <param name="url" value="jdbc:mysql://localhost:3306/jackrabbit"/>
    <param name="user" value="pentaho"/>
    <param name="password" value="passwd"/>
    <param name="databaseType" value="mysql"/>
    <param name="driver" value="com.mysql.jdbc.Driver"/>
    <param name="minRecordLength" value="1024"/>
    <param name="maxConnections" value="3"/>
    <param name="copyWhenReading" value="true"/>
    <param name="tablePrefix" value=""/>
    <param name="schemaObjectPrefix" value="ds_repos_"/>
  </DataStore>

注解以下标签和内容:

    <FileSystem class="org.apache.jackrabbit.core.fs.local.LocalFileSystem">
      <param name="path" value="${wsp.home}"/>
    </FileSystem>

去掉以下标签和内容注解并修改账号密码:

    <FileSystem class="org.apache.jackrabbit.core.fs.db.DbFileSystem">
      <param name="driver" value="com.mysql.jdbc.Driver"/>
      <param name="url" value="jdbc:mysql://localhost:3306/jackrabbit"/>
      <param name="user" value="pentaho"/>
      <param name="password" value="passwd"/>
      <param name="schema" value="mysql"/>
      <param name="schemaObjectPrefix" value="fs_ws_"/>
    </FileSystem>

注解以下标签和内容:

    <PersistenceManager class="org.apache.jackrabbit.core.persistence.pool.H2PersistenceManager">
      <param name="url" value="jdbc:h2:${wsp.home}/db"/>
      <param name="schemaObjectPrefix" value="${wsp.name}_"/>
    </PersistenceManager>

去掉以下标签和内容注解并修改账号密码:

    <PersistenceManager class="org.apache.jackrabbit.core.persistence.bundle.MySqlPersistenceManager">
      <param name="driver" value="com.mysql.jdbc.Driver"/>
      <param name="url" value="jdbc:mysql://localhost:3306/jackrabbit"/>
      <param name="user" value="pentaho" />
      <param name="password" value="passwd" />
      <param name="schema" value="mysql"/>
      <param name="schemaObjectPrefix" value="${wsp.name}_pm_ws_"/>
    </PersistenceManager>

注解以下标签和内容:

    <FileSystem class="org.apache.jackrabbit.core.fs.local.LocalFileSystem">
      <param name="path" value="${rep.home}/version" />
    </FileSystem>

去掉以下标签和内容注解并修改账号密码:

    <FileSystem class="org.apache.jackrabbit.core.fs.db.DbFileSystem">
      <param name="driver" value="com.mysql.jdbc.Driver"/>
      <param name="url" value="jdbc:mysql://localhost:3306/jackrabbit"/>
      <param name="user" value="pentaho"/>
      <param name="password" value="passwd"/>
      <param name="schema" value="mysql"/>
      <param name="schemaObjectPrefix" value="fs_ver_"/>
    </FileSystem>

注解以下标签和内容:

    <PersistenceManager class="org.apache.jackrabbit.core.persistence.pool.H2PersistenceManager">
      <param name="url" value="jdbc:h2:${rep.home}/version/db"/>
      <param name="schemaObjectPrefix" value="version_"/>
    </PersistenceManager>

去掉以下标签和内容注解并修改账号密码:

    <PersistenceManager class="org.apache.jackrabbit.core.persistence.bundle.MySqlPersistenceManager">
      <param name="driver" value="com.mysql.jdbc.Driver"/>
      <param name="url" value="jdbc:mysql://localhost:3306/jackrabbit"/>
      <param name="user" value="pentaho" />
      <param name="password" value="passwd" />
      <param name="schema" value="mysql"/>
      <param name="schemaObjectPrefix" value="pm_ver_"/>
    </PersistenceManager>

2.6.6 配置Tomcat的JDBC连接信息context.xml

cd /usr/pentaho/pentaho-server/
cp tomcat/webapps/pentaho/META-INF/context.xml tomcat/webapps/pentaho/META-INF/context.xml.default
vim tomcat/webapps/pentaho/META-INF/context.xml

修以下配置:

                maxWaitMillis="10000" username="pentaho" password="passwd"
                driverClassName="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost/hibernate"
                validationQuery="select 1" />

                maxWaitMillis="10000" username="pentaho" password="passwd"
                driverClassName="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost/quartz"
                validationQuery="select 1"/>

2.6.7 配置web.xml

cd /usr/pentaho/pentaho-server
cp tomcat/webapps/pentaho/WEB-INF/web.xml tomcat/webapps/pentaho/WEB-INF/web.xml.default
vim tomcat/webapps/pentaho/WEB-INF/web.xml

删除以下标签和配置:

  <!-- [BEGIN HSQLDB DATABASES] -->
  <context-param>
    <param-name>hsqldb-databases</param-name>
    <param-value>[email protected]/../data/hsqldb/sampledata,[email protected]/../data/hsqldb/hibernate,[email protected]/../data/hsqldb/quartz</param-value>
  </context-param>
  <!-- [END HSQLDB DATABASES] -->

删除以下标签和配置:

  <!-- [BEGIN HSQLDB STARTER] -->
  <listener>
    <listener-class>org.pentaho.platform.web.http.context.HsqldbStartupListener</listener-class>
  </listener>
  <!-- [END HSQLDB STARTER] -->

2.6.8 配置applicationContext-spring-security-hibernate.properties(可选)

cd /usr/pentaho/pentaho-server/
cp pentaho-solutions/system/applicationContext-spring-security-hibernate.properties pentaho-solutions/system/applicationContext-spring-security-hibernate.properties.defautl
vim pentaho-solutions/system/applicationContext-spring-security-hibernate.properties

修改如下参数:

jdbc.driver=com.mysql.jdbc.Driver
jdbc.url=jdbc:mysql://localhost:3306/hibernate
jdbc.username=pentaho
jdbc.password=passwd
hibernate.dialect=org.hibernate.dialect.MySQL5InnoDBDialect

2.6.9 配置applicationContext-spring-security-jdbc.properties(可选)

cd /usr/pentaho/pentaho-server/
cp pentaho-solutions/system/applicationContext-spring-security-jdbc.properties pentaho-solutions/system/applicationContext-spring-security-jdbc.properties.default
vim pentaho-solutions/system/applicationContext-spring-security-jdbc.properties

修改如下参数:

datasource.driver.classname=com.mysql.jdbc.Driver
datasource.url=jdbc:mysql://localhost:3306/hibernate
datasource.username=pentaho
datasource.password=passwd
datasource.validation.query=SELECT 1

2.6.10 配置jdbc.properties(可选)

cd /usr/pentaho/data-integration
cp simple-jndi/jdbc.properties simple-jndi/jdbc.properties.default
vim simple-jndi/jdbc.properties

注释掉原来参数并增加如下参数且修改账号密码:

SampleData/type=javax.sql.DataSource
SampleData/driver=com.mysql.jdbc.Driver
SampleData/url=jdbc:mysql://localhost:3306/hibernate
SampleData/user=pentaho
SampleData/password=passwd
Hibernate/type=javax.sql.DataSource
Hibernate/driver=com.mysql.jdbc.Driver
Hibernate/url=jdbc:mysql://localhost:3306/hibernate
Hibernate/user=pentaho
Hibernate/password=passwd
Quartz/type=javax.sql.DataSource
Quartz/driver=com.mysql.jdbc.Driver
Quartz/url=jdbc:mysql://localhost:3306/quartz
Quartz/user=pentaho
Quartz/password=passwd
Shark/type=javax.sql.DataSource
Shark/driver=com.mysql.jdbc.Driver
Shark/url=jdbc:mysql://localhost:3306/hbibernate
Shark/user=pentaho
Shark/password=passwd
SampleDataAdmin/type=javax.sql.DataSource
SampleDataAdmin/driver=com.mysql.jdbc.Driver
SampleDataAdmin/url=jdbc:mysql://localhost:3306/hibernate
SampleDataAdmin/user=pentaho
SampleDataAdmin/password=passwd

2.6.11 配置pentaho.xml(可选)

cd /usr/pentaho/pentaho-server/
cp pentaho-solutions/system/pentaho.xml pentaho-solutions/system/pentaho.xml.defautl
vim pentaho-solutions/system/pentaho.xml

修改如下配置:

<login-show-users-list>false</login-show-users-list>
<login-show-sample-users-hint>false</login-show-sample-users-hint>

注解或删除如下配置:

  <sampledata-datasource>
          <name>SampleData</name>
          <host>localhost</host>
          <type>Hypersonic</type>
          <port>9001</port>
          <access>NATIVE</access>
          <username>pentaho_user</username>
          <password>password</password>
          <max-active>20</max-active>
          <max-idle>5</max-idle>
          <max-wait>1000</max-wait>
          <query>select count(*) from INFORMATION_SCHEMA.SYSTEM_SEQUENCES</query>
  </sampledata-datasource>

2.7 测试和配置服务启动

2.7.1 测试服务启动

sudo -u pentaho /usr/pentaho/pentaho-server/tomcat/bin/startup.sh

2.7.2 监视日志排错

建议监控如下日志:

tail -f /usr/pentaho/pentaho-server/tomcat/logs/catalina.out

建议搜索如下日志:

grep -i -E "error|fail" /usr/pentaho/pentaho-server/tomcat/logs/catalina.out | sort -u

2.7.3 网页测试

http://10.168.0.76:8080/pentaho

参阅资料:

=================================================

安装教程:

https://help.pentaho.com/Documentation/7.0

其他参考资料:

http://www.cnblogs.com/driftingshine/p/6065454.html

http://community.pentaho.com/

驱动下载链接:

http://www.oracle.com/technetwork/apps-tech/jdbc-112010-090769.html

http://www.oracle.com/technetwork/database/features/jdbc/jdbc-ucp-122-3110062.html

ojdbcx.jar, ora18n.jar

启动安装教程:

https://help.pentaho.com/Documentation/7.0/0D0/160/010#Oracle

LDAP项目:

https://help.pentaho.com/Documentation/7.0/0P0/Setting_Up_User_Security/Implement_Advanced_Security/010

https://help.pentaho.com/Documentation/7.0/0P0/Setting_Up_User_Security/Implement_Advanced_Security/030

下载页面:

https://sourceforge.net/projects/pentaho/files/

手动LDAP配置:

https://help.pentaho.com/Documentation/7.0/0P0/Setting_Up_User_Security/Implement_Advanced_Security/030

http://diethardsteiner.github.io/biserver/2014/11/08/LDAP.html

切换到LDAP:

https://help.pentaho.com/Documentation/7.0/0P0/Setting_Up_User_Security/Implement_Advanced_Security/010

LDAP界面配置:

https://help.pentaho.com/Documentation/7.0/0P0/Setting_Up_User_Security/Implement_Advanced_Security/010

http://wiki.pentaho.com/display/ServerDoc2x/Using+LDAP+and+JDBC+Simultaneously

Jar下载:

http://mvnrepository.com/

安装文档:

https://help.pentaho.com/Documentation/7.0/0F0/0P0/Starting_the_Pentaho_Server_after_Manual_Installation

https://help.pentaho.com/Documentation/7.0/0F0/0P0/020/0B0

数据库配置:

https://help.pentaho.com/Documentation/7.0/0F0/0P0/030/020

时间: 2024-11-07 08:22:27

开源商务智能软件Pentaho的相关文章

2019开源BI软件排行榜

在这个“拖拖拽拽就能做报表”已经成为所有BI厂商共识的时代,有哪些开源BI软件居于排行榜单的前列呢?作为一个自诩对该行业了如执掌的资深数据从业人员,给各位分享分享2019年主流的开源BI软件排行榜. 1.FineBI 国内做的一流的BI工具,很炫酷,也比较实用.主打的是超大数据量性能和自助式分析2个特点,在功能方面跟Tableau很接近,适用于企业中的技术人员.业务人员和数据分析师,可以完全自主的进行探索式分析,软件在易用性和功能上做的都很不错.帆软自主搭建了实施团队和服务团队,在服务上的优势较

开源资产管理软件-GLPI(9.13)操作手册

1.简介 GLPI是法语Gestionnaire libre de parc informatique的缩写,是一款历史悠久的资产管理软件: GLPI提供功能全面的IT资源管理接口,可以用来建立数据库全面管理IT的电脑,显示器,服务器,打印机,网络设备,电话,甚至硒鼓和墨盒等.提供Helpdesk用户支持平台:联系人,合同,合作商,以及文档的管理:提供资源预定,知识库的管理等功能." 日常工作中偶然接触到GLPI,通过安装部署,配置LDAP,Fusioninventory,OCS Invento

开源爬虫软件汇总!

世界上已经成型的爬虫软件多达上百种,本文对较为知名及常见的开源爬虫软件进行梳理,按开发语言进行汇总,如下表所示.虽然搜索引擎也有爬虫,但本次我汇总的只是爬虫软件,而非大型.复杂的搜索引擎,因为很多兄弟只是想爬取数据,而非运营一个搜索引擎.

开源备份软件bacula安装记录--含备份-恢复演练

公司原来的备份机器用的是oracle-linux 5.7 运行的不是很稳定,经常出现死机,新装了一个centos6.5, 准备使用bacula来对数据进行备份,在这里记录一下安装过错,备忘. 操作系统:centos6.5 1.安装mysql 用yum安装 yum install mysql mysql-server mysql-devel 这里要注意的是一定要安装mysql-devel,否则在等下configure bacula的时候会报找不到mysql.h文件--这里折腾了我好久,差点想去编译

开源服务器软件

Java缓存服务器 jmemcached http://www.oschina.net/p/jmemcached jmemcached 是一个Java版的 memcached 缓存服务器,基本上跟 memcached 是兼容的.jmemcached 是使用 Apache MINA 作为无堵塞的网络IO操作,但之后使用Netty作为网络异步实现机制. Web服务器 TornadoTornado web server 是使用Python编写出來的一个极轻量级.高可伸缩性和非阻塞IO的Web服务器软件

开源GIS软件 2

Android上的导航软件 AndNav AndNav 是一款 Android 手机上的 GPS导航软件(非开源).软件支持GPS定位信息,目的地查询,道路建议管理,导航提示等功能,十分强大的一款软件. 开源WebGIS项目 UMN MapServer MapServer,它是美国明尼苏达大学 (University of Minnesota, 简称 UMN)在二十世纪90 年代利用 C语言开发的开源 WebGIS项目. [MapServer简介] 它起源于 UMN和美国国家航空航天局的合作项目

开源爬虫软件汇总

世界上已经成型的爬虫软件多达上百种,本文对较为知名及常见的开源爬虫软件进行梳理,按开发语言进行汇总,如下表所示.虽然搜索引擎也有爬虫,但本次我汇总的只是爬虫软件,而非大型.复杂的搜索引擎,因为很多兄弟只是想爬取数据,而非运营一个搜索引擎. 开源爬虫汇总表 开发语言 软件名称 软件介绍 许可证 Java Arachnid 微型爬虫框架,含有一个小型HTML解析器 GPL crawlzilla 安装简易,拥有中文分词功能 Apache2 Ex-Crawler 由守护进程执行,使用数据库存储网页信息

开源FTP软件FileZilla使用介绍

简介 FileZilla是一个优秀的开源FTP软件,分为客户端版本和服务器版本,具备所有的FTP软件功能,如果想自己搭建FTP服务器,FileZilla是一个好选择. 下载 FileZilla有一个中文站:https://www.filezilla.cn/download,打开后如图: 可以在页面上找到客户端和服务端的下载链接. 先下载客户端,点击客户端的链接进入下载地址: 在这个页面可以找到各平台下的32位和64位的客户端下载链接,我这里选择下载Windows下64位的绿色版. 然后打开服务端

Google开源SLAM软件cartographer中使用的UKF滤波器解析

在Google开源SLAM软件cartographer中,相对<SLAM for dummies>使用了更为复杂.性能更好的Scan匹配与UKF算法,这里简单介绍下cartographer中使用的UKF算法. (一)滤波器参数设定 constexpr static FloatType kAlpha = 1e-3; constexpr static FloatType kKappa = 0.; constexpr static FloatType kBeta = 2.; constexpr st