Sphinx性能

（1）高速建立索引：建索引速度达到单核10-15mb/s;
（2）高速查询：100万记录（约1.2GB数据）下，单核每秒支持约200次搜索;
（3）高扩展性：已知最大索引簇支持对30亿条记录建立索引，每天单个连接5千万次搜索;
（4）强大附属功能：支持分布式搜索，中文分词引擎，c/java/python/php等多语言支持，支持MySQL，也可以自建索引（xml pipe mechanism）支持KV等其他存储。

（5）高性能搜索（在2-4 GB的文本上搜索，平均0.1秒内获得结果）

（6）高扩展性（实测最高可对100GB的文本建立索引，单一索引可包含1亿条记录）

（7）支持分布式检索

（8）支持基于短语和基于统计的复合结果排序机制

（9）支持任意数量的文件字段（数值属性或全文检索属性）

（10）支持不同的搜索模式（“完全匹配”，“短语匹配”和“任一匹配”）

支持作为Mysql的存储引擎

时间： 2024-10-08 12:18:07

Sphinx性能的相关文章

2014年终工作总结及2015年工作计划--激励

习惯了总结,习惯了计划,没有总结就没法把零散的经验体系化,到头来是只见树木不见森林:没有计划就没有目标,没有目标人就容易颓废,到头来是王茂法贴春联一年又是一年.对于运维工作更是如此,运维是自我驱动的,而开发是需求驱动的,这有有很大的不同:运维涉及的知识面极为广泛.具体的工作也是异常分散.不可预知的突发事件更是让你措手不及,没有总结工作起来很痛苦,总是扮演消防员的角色:经过几年的发展,运维基础设施系统等大部分工作通过脚本.系统实现了自动化,很大程度的解放了运维的重复劳动,这个时候很容易无所事事.惶

php+中文分词scws+sphinx+mysql打造千万级数据全文搜索

Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎.意图为其他应用提供高速.低空间占用.高结果相关度的全文搜索功能.Sphinx可以非常容易的与SQL数据库和脚本语言集成.当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的XML数据.Sphinx创建索引的速度为:创建100万条记录的索引只需3-4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒.Sphinx的

性能调优攻略

关于性能优化这是一个比较大的话题,在<由12306.cn谈谈网站性能技术>中我从业务和设计上说过一些可用的技术以及那些技术的优缺点,今天,想从一些技术细节上谈谈性能优化,主要是一些代码级别的技术和方法.本文的东西是我的一些经验和知识,并不一定全对,希望大家指正和补充. 在开始这篇文章之前,大家可以移步去看一下酷壳以前发表的<代码优化概要>,这篇文章基本上告诉你--要进行优化,先得找到性能瓶颈! 但是在讲如何定位系统性能瓶劲之前,请让我讲一下系统性能的定义和测试,因为没有这两件事,后

sphinx 配置文件全解析

source:数据源,数据是从什么地方来的. index:索引,当有数据源之后,从数据源处构建索引.索引实际上就是相当于一个字典检索.有了整本字典内容以后,才会有字典检索. searchd:提供搜索查询服务.它一般是以deamon的形式运行在后台的. indexer:构建索引的服务.当要重新构建索引的时候,就是调用indexer这个命令. attr:属性,属性是存在索引中的,它不进行全文索引,但是可以用于过滤和排序. sphinx的配置文件过于冗长,我们把sphinx默认的配置文件中的注释部分去

Sphinx + Coreseek 实现中文分词搜索

Sphinx + Coreseek 实现中文分词搜索 Sphinx Coreseek 实现中文分词搜索全文检索 1 全文检索 vs 数据库 2 中文检索 vs 汉化检索 3 自建全文搜索与使用Google等第三方站点提供的站内全文搜索的差别 Sphinx Coreseek介绍 Coreseek安装使用 1. 全文检索 1.1 全文检索 vs. 数据库全文检索是数据库的有力补充,全文检索并不能替代数据库在应用系统中的作用.当应用系统的数据以大量的文本信息为主时,採用全文检索技术能够极大的提升应

sphinx SPH_MATCH_EXTENDED2 基本应用

匹配模式有如下可选的匹配模式: SPH_MATCH_ALL, 匹配所有查询词(默认模式); SPH_MATCH_ANY, 匹配查询词中的任意一个; SPH_MATCH_PHRASE, 将整个查询看作一个词组,要求按顺序完整匹配; SPH_MATCH_BOOLEAN, 将查询看作一个布尔表达式 SPH_MATCH_EXTENDED, 将查询看作一个CoreSeek/Sphinx内部查询语言的表达式 . 从版本Coreseek 3/Sphinx 0.9.9开始, 这个选项被选项SPH_MATCH_

【MySQL】性能优化之延迟关联

[背景] 某业务数据库load 报警异常,cpu usr 达到30-40 ,居高不下.使用工具查看数据库正在执行的sql ,排在前面的大部分是: SELECT id, cu_id, name, info, biz_type, gmt_create, gmt_modified,start_time, end_time, market_type, back_leaf_category,item_status,picuture_url FROM relation where biz_type ='0

Sphinx学习之sphinx的安装篇

一. Sphinx简介 Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎.意图为其他应用提供高速.低空间占用.高结果相关度的全文搜索功能.Sphinx可以非常容易的与SQL数据库和脚本语言集成.当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的XML数据. Sphinx的特性如下: a) 高速的建立索引(在当代CPU上,峰值性能可达到10 MB/秒); b) 高性能的搜索(在2 – 4GB 的文本数据上,平均每

开源搜索引擎评估:lucene sphinx elasticsearch

目录(?)[+] 开源搜索引擎评估:lucene sphinx elasticsearch 开源搜索引擎程序有3大类 lucene系,java开发,包括solr和elasticsearch sphinx,c++开发,简单高性能 Xapian,c++开发搜索引擎程序这个名称不妥当,严格说来应该叫做索引程序(indexing program),早期主要用来做中文全文搜索,但是随着互联网的深入普及,各家网站规模越来越大,索引程序在优化网站架构上发挥了更大的作用:替代mysql数据库内置的索引让m