sphinx-doc的中文搜索

第一,你的系统需要安装jieba类库, pip install jieba

第二,接下来修改sphinx的conf.py文件,为项目设置为中文的搜索配置。

# Language to be used for generating the HTML full-text search index.
# Sphinx supports the following languages:
#   ‘da‘, ‘de‘, ‘en‘, ‘es‘, ‘fi‘, ‘fr‘, ‘hu‘, ‘it‘, ‘ja‘
#   ‘nl‘, ‘no‘, ‘pt‘, ‘ro‘, ‘ru‘, ‘sv‘, ‘tr‘, ‘zh‘
html_search_language = ‘zh‘

第三,可选配置

# A dictionary with options for the search language support, empty by default.
# ‘ja‘ uses this config value.
# ‘zh‘ user can custom change `jieba` dictionary path.
# html_search_options = {‘dict‘: ‘/usr/lib/jieba.txt‘}   # 根据需要设置jieba的词典路径

第四,接下来重新编译生成文档。make html

-------------------------------------------------------------------------------------
原文地址:https://www.chenyudong.com/archives/sphinx-doc-support-chinese-search.html

原文地址:https://www.cnblogs.com/chunyin/p/9610857.html

时间: 2024-10-09 07:17:30

sphinx-doc的中文搜索的相关文章

Sphinx + Coreseek 实现中文分词搜索

Sphinx + Coreseek 实现中文分词搜索 Sphinx Coreseek 实现中文分词搜索 全文检索 1 全文检索 vs 数据库 2 中文检索 vs 汉化检索 3 自建全文搜索与使用Google等第三方站点提供的站内全文搜索的差别 Sphinx Coreseek介绍 Coreseek安装使用 1. 全文检索 1.1 全文检索 vs. 数据库 全文检索是数据库的有力补充,全文检索并不能替代数据库在应用系统中的作用.当应用系统的数据以大量的文本信息为主时,採用全文检索技术能够极大的提升应

solr中文搜索倒排索引和数据存储结构

作为搜索,我们传统的方式(正排索引)是从关键点出发,然后再通过关键点找到关键点代表的信息中能够满足搜索条件的特定信息,既通过KEY寻找VALUE.而Lucene的搜索则是采用了倒排索引的方式,即通过VALUE找KEY.而在中文全文搜索中VALUE就是我们要搜索的单词,存放所有单词的地方叫词典.KEY是文档标号列表(通过文档标号列表我们可以找到出现过要搜索单词VALUE的文档).正排索引从文档编号找词: 倒排索引是从词找文档编号: 当文档数据来临时,solr会首先对文档数据进行分词,创建索引库和文

helm-mode打开文件支持中文搜索

.title { text-align: center; margin-bottom: .2em } .subtitle { text-align: center; font-size: medium; font-weight: bold; margin-top: 0 } .todo { font-family: monospace; color: red } .done { font-family: monospace; color: green } .priority { font-fami

如何解决Firefox浏览器地址栏中文搜索速度很慢

一.插件安装 之前使用Chrome浏览器,习惯在地址栏中直接进行中文搜索.转到Firefox之后,突然发现在地址栏进行中文搜索,访问速度会很慢. 可以使用插件解决这个问题:Omnibar 插件地址:https://addons.mozilla.org/zh-CN/firefox/addon/omnibar/ 二.添加搜索引擎 安装之后默认使用Google搜索,如图. 由于一些原因,Google搜索可能不能使用,所以这里要更改搜索引擎. 点击Google --> Manage Search Eng

atitit.vod search doc.doc 点播系统搜索功能设计文档

atitit.vod search doc.doc 点播系统搜索功能设计文档 按键的enter事件1 Left rig事件1 Up down事件2 key_events.key_search = function(e, curr){ var value = $('.searchbox .textbox').text(); xhr.search_keyword(value, function(data){ render.movie_list_tiny(data); //ati p89 $(".se

中文搜索翻页乱码问题

使用中文作为关键字搜索,当结果条数很多的时候,肯定会用到翻页.一般的翻页做法,是采用get方式提交.这种情况下翻页,搜索关键字作为参数,会附在url后传递,到后台的时候,已经乱码.返回页面显示当然也是乱码的.解决的代码如下: keyWord = new String(keyWord.getBytes("ISO-8859-1"),"utf-8"); keyword即为传递到后台的搜索关键字. 中文搜索翻页乱码问题

coreseek中文搜索

coreseek的安装和使用 准备软件包 coreseek-3.2.14.tar.gz 其他汁源 coreseek中文索引-示例文件.zip sphinx配置文件详解.txt 1.安装组件 yum -y install make gcc g++ gcc-c++ libtool autoconf automake imake mysql-devel libxml2-devel expat-devel 2.安装mmseg $ cd /usr/local/tools/ $ tar xf coresee

coreseek 中文搜索和高亮

配置文件 # # Minimal Sphinx configuration sample (clean, simple, functional) # source post { type = mysql sql_host = 192.168.33.90 sql_user = root sql_pass = root sql_db = test sql_port = 3306 # optional, default is 3306 sql_sock = /tmp/mysql.sock sql_qu

ArcGIS API中FindTask中文搜索无效,服务器编码问题URIEncoding="utf-8"

问题来源:字符编码问题导致ArcMap中字符乱码或显示不正常,因而在F:\Program Files\ArcGIS\Server\framework\runtime\tomcat\conf中server.xml把URIEncoding="utf-8"加上 <!-- A "Connector" represents an endpoint by which requests are received and responses are returned. Doc