centos7下搭建sphinx全文检索引擎

  Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用 程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL 也设计了一个存储引擎插件。

我要使用Sphinx需要做以下几件事:

1)、首先得有数据

2)、建立Sphinx配置文件

3)、生成索引

4)、启动Sphinx

5)、php操作使用之(调用api或search.exe程序进行查询)

具体搭建步骤:

先下载好sphinx的压缩包。

1、更新依赖包以及安装编译环境
   mount /dev/cdrom /media/cdrom  #先挂载

  yum -y install m4 autoconf automake libtool

  yum -y install gcc gcc-c++ wget

  yum -y install mysql-devel

(以上是需要的编译环境,如果有就不用重新安了,建议重新安,否则不知道那些已经安装)

2、下载coreseek -3.2.14.tar.gz(这是一个中文分词插件压缩包)

  tar xzvf coreseek-3.2.14.tar.gz
  cd coreseek-3.2.14
  cd mmseg-3.2.14/
  ./bootstrap
  ./configure --prefix=/usr/local/mmseg3
  make
  make install

3、安装csft-3.2.14

  cd ../csft-3.2.14/
  sh buildconf.sh
  ./configure --prefix=/usr/local/coreseek --without-python --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql --host=arm

  vi src/sphinxexpr.cpp
直接修改文件的1746, 1777和1823行,然后将所有的T val = ExprEval ( this->m_pArg, tMatch ).....修改为T val = this->ExprEval ( this->m_pArg, tMatch )

  make
  make install

进入配置目录通过命令ls可以看到3个文件
example.sql  sphinx.conf.dist  sphinx-min.conf.dist
其中example.sql是示例sql脚本我们将其导入到数据库中的test数据库中作为测试数据(会创建两张表 documents和tags)

---------------

4、配置文件更改:

vi /usr/local/coreseek/etc/sphinx.conf
输入以下内容
source main_src
{
    type                    = mysql
    sql_host                = 192.168.1.70     #查询的服务器ip地址
    sql_user                = root                   #用户名
    sql_pass                =root                   # 密码
    sql_db                    =test       #使用的数据库
    sql_port                = 3306          # 数据库端口3306
    sql_sock                                = /tmp/mysql.sock
    sql_query_pre                 = SET NAMES utf8      #定义查询时的编码
    sql_query                = \
        SELECT id, group_id, UNIX_TIMESTAMP(date_added) AS date_added, title, content \
        FROM documents                                      #数据源配置核心语句,sphinx使用此语句从数据库中拉取数据
    sql_attr_uint            = group_id
    sql_attr_timestamp        = date_added
    sql_query_info            = SELECT * FROM documents WHERE id=$id       #设置命令行下返回的信息。
}
index main    #索引名称
{
    source                    = main_src      #数据源名称
    path                    = /usr/local/coreseek/var/data/test1     
    docinfo                    = extern
    charset_type            = zh_cn.utf-8
    mlock            = 0
    morphology        = none
    min_word_len        = 1
    html_strip        = 0
    charset_dictpath        = /usr/local/mmseg3/etc/     #中文分词检索路径
    ngram_len                    = 0
}
indexer
{
    mem_limit                = 32M
}
searchd
{
    port                    = 9312
    log                        = /usr/local/coreseek/var/log/searchd.log
    query_log                = /usr/local/coreseek/var/log/query.log
    read_timeout            = 5
    max_children            = 30
    pid_file                = /usr/local/coreseek/var/log/searchd.pid
    max_matches                = 1000
    seamless_rotate            = 1
    preopen_indexes            = 0
    unlink_old                = 1
}


说明:

代码段source main_src{***} 代表数据源里面主要包含了数据库的配置信息,main_src表示数据源名字,可以随便写。

代码段index main{***} 代表为哪个数据源创建索引,与source *** 是成对出现的,其中的source参数的值必须是某一个数据源的名字。
其他参数可以查看手册,这里不再赘述。
生成索引

/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf --all     #--all表示生成所有主、增索引,也可写单独的索引名称
启动命令
/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf

执行后可以在/usr/local/coreseek/var/data目录中看到多出一些文件,是以索引名为文件名的不同的扩展名的文件
在不启动sphinx的情况下即可测试命令:
  /usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/sphinx.conf 中国

以上就算sphinx搭建完成了,一般会配置增量索引,与主索引搭配。

时间: 2024-10-25 23:50:09

centos7下搭建sphinx全文检索引擎的相关文章

在Centos7下搭建Socks5代理服务器

在Centos7下搭建Socks5代理服务器 知者不言0人评论20237人阅读2017-12-21 09:50:25 采用socks协议的代理服务器就是SOCKS服务器,是一种通用的代理服务器.Socks是个电路级的底层网关,是DavidKoblas在1990年开发的,此后就一直作为Internet RFC标准的开放标准.Socks 不要求应用程序遵循特定的操作系统平台,Socks 代理与应用层代理. HTTP 层代理不同,Socks 代理只是简单地传递数据包,而不必关心是何种应用协议(比如FT

Linux系统:Centos7下搭建PostgreSQL关系型数据库

本文源码:GitHub·点这里 || GitEE·点这里 一.PostgreSQL简介 1.数据库简介 PostgreSQL是一个功能强大的开源数据库系统,具有可靠性.稳定性.数据一致性等特点,且可以运行在所有主流操作系统上,包括Linux.Unix.Windows等.PostgreSQL是完全的事务安全性数据库,完整地支持外键.联合.视图.触发器和存储过程,支持了大多数的SQL:2008标准的数据类型,包括整型.数值型.布尔型.字节型.字符型.日期型.时间间隔型和时间型,它也支持存储二进制的大

在Centos7下搭建Git服务器

简介 Git是一款免费.开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目. Git是一个开源的分布式版本控制系统,可以有效.高速的处理从很小到非常大的项目版本管理. Git 是 Linus Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件. Torvalds 开始着手开发 Git 是为了作为一种过渡方案来替代 BitKeeper,后者之前一直是 Linux 内核开发人员在全球使用的主要源代码工具. 开放源码社区中的有些人觉得BitKeeper

Centos7下搭建LAMP平台环境

centos发布7.0版本,新版本带来很多特性,除了内核更新到3.10外,支持 Linux 容器.Open VMware Tools 及 3D 图像能即装即用,转用 systemd.firewalld 及 GRUB2 ,而默认的文件系统为XFS等等,可以说是比较重大的升级.笔者尝试了使用Centos7搭建LAMP服务器平台,记录如下. 1.启用Apache2 Centos7默认已经安装httpd服务,只是没有启动.如果你需要全新安装,可以yum install -y httpd 启动服务:sys

CentOS7下搭建邮件服务器(dovecot + postfix + SSL)

CentOS 花了基本上两天的时间去配置CentOS7下的邮件服务器.其中艰辛太多了,一定得总结下. 本文的目的在于通过一系列配置,在CentOS 7下搭建dovecot + postfix + SSL 服务器,并且能够通过邮件客户端(本文中是Airmail)进行收发邮件. 前提条件 你得有个主机或者VPS 你有一个主域名比如 fancycoding.com 还有一个二级域名比如 mail.fancycoding.com 二级域名的 SSL 证书. 配置你的DNS记录 确认主域名有A记录指向服务

一、CentOS7下搭建FastDFS+Nginx实现静态图片服务器

在集群环境下,图片存放在本地存在诸多限制,一般采用单独的图片服务器进行管理.FastDFS就是这样一个图片管理服务器. 环境需求,CentOS7下 一.先下载三件套,并上传到服务器中(Nginx自行下载),地址如下 1:libfastcommon https://github.com/happyfish100/libfastcommon/archive/V1.0.7.tar.gz 2:fastdfs https://github.com/happyfish100/fastdfs/archive/

centos7下搭建JDK和Hadoop

涉及基础操作命令 这里只是将涉及到的提了下一下具体的使用还需要读者自己查阅资料 tar 解压命令 su 进入root用户模式 rm -rf 删除 cd /文件名/.../ 进入某个文件夹下 注意要逐层进入 cd .. 返回上一级文件夹 vim /文件名/.../ 编辑某个文本文件 具体步骤 1.首先先要卸载centos7下自带的openJDK 进入root用户模式输入 su 输入密码 使用yum 移除本地openJDK yum -y remove java 2.删除本地openJDK后删除ope

centos7下搭建cacti

cacti 什么是Cacti? Cacti 在英文中的意思是仙人掌的意思,Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具.它通过snmpget来获取数据,使用 RRDtool绘画图形,而且你完全可以不需要了解RRDtool复杂的参数.它提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结构.host以及任何一张图,还可以与LDAP结合进行用户验证,同时也能自己增加模板,功能非常强大完善.Cacti 的发展是基于让 RRDTool 使用

CentOS7下搭建postfix邮件服务器实现extmail的web访问

CentOS7.1最新1503版本最小化安装,基于lnmp,nginx与mysql为yum安装,当然没有安装php,其他编译所需要的全是官网上下载的最新稳定版,搭建的过程中出了很多错误,经过几天的实验,最后终于搭建成了,这次博客也是重新搭建,边写边搭建,如果再次出现错误的话,会将错误一并写出来. 一.  装备工作 1.防止不必要的麻烦关闭Selinux setenforce 0 关闭防火墙 systemctl stop firewalld 2.清空iptables iptables -P INP