O2O的实时搜索引擎

O2O行业通常都会基于地理位置派发用户订单给距离最近的服务提供者,因此必须解决位置高效索引和快速检索的问题。位置索引的最大挑战是位置可能持续变化,因此索引的更新量会非常庞大,传统搜索引擎难以应对。 我们为了解决高效派单问题,实现了基于位置索引的高效分布式实时搜索引擎。 我们颠覆了传统搜索引擎的做法,包括索引不做持久化、实时索引、无锁化实现等,相信会给大家带来耳目一新的体验。

原文地址:http://www.infoq.com/cn/presentations/real-time-search-engine-of-o2o

时间: 2024-10-13 22:13:43

O2O的实时搜索引擎的相关文章

基于Lucene的近实时搜索引擎优化总结

一.搜索优化: 在工程领域,越是看起来“简单.确定”的问题,越是难以解决.近实时搜索引擎需要解决的问题只有一个:性能!它包含快速索引,快速搜索,以及索引到搜索的快速生效. 以下为百万条数据级(适用于千万级)快速滚动数据近实时搜索引擎实践经验总结:  1. 针对技术优化 1.1 数值搜索优化: 将数值的范围缩小,能用 int值 的不要用 long值,能用 float值 的不用要 double值:能用string 替换的,就不要用范围查询(特别是大范围查询),这些都基于Lucene搜索引擎对数值建索

实时检索6700亿条推文,细谈Twitter搜索引擎的演进历程

Twitter的实时搜索引擎起步于一家被收购的小公司,随着流量的增长.功能的增加和服务对象的扩张,搜索引擎不断面临着新的挑战,设计经历了多次变化.本演讲将介绍该实时搜索引擎进化历程中的挑战和决策. 王天, Twitter Senior Staff Engineer, 2003年清华计算机系本科毕业并赴美留学,2005年硕士毕业后加入Google,在Mobile Search.News以及Search Quality等部门从事过近六年开发.2011年初加盟Twitter,参与了Twitter实时相

Solr vs. Elasticsearch谁是开源搜索引擎王者

当前是云计算和数据快速增长的时代,今天的应用程序正以PB级和ZB级的速度生产数据,但人们依然在不停的追求更高更快的性能需求.随着数据的堆积,如何快速有效的搜索这些数据,成为对后端服务的挑战.本文,我们将比较业界两个最流行的开源搜索引擎,Solr和ElasticSearch.两者都建立在Apache Lucene开源平台之上,它们的主要功能非常相似,但是在部署的易用性,可扩展性和其他功能方面也存在巨大差异. 关于Apache Solr Apache Solr基于业界大名鼎鼎的java开源搜索引擎L

开源搜索引擎

开源搜索引擎 当前是云计算和数据快速增长的时代,今天的应用程序正以PB级和ZB级的速度生产数据,但人们依然在不停的追求更高更快的性能需求.随着数据的堆积,如何快速有效的搜索这些数据,成为对后端服务的挑战.本文,我们将比较业界两个最流行的开源搜索引擎,Solr和ElasticSearch.两者都建立在Apache Lucene开源平台之上,它们的主要功能非常相似,但是在部署的易用性,可扩展性和其他功能方面也存在巨大差异. 关于Apache Solr Apache Solr基于业界大名鼎鼎的java

亿级数据的高并发通用搜索引擎架构设计(转-张宴)

[文章作者:张宴 本文版本:v1.0 最后修改:2008.12.09 转载请注明原文链接:http://blog.zyan.cc/post/385/] 曾经在七月,写过一篇文章──<基于Sphinx+MySQL的千万级数据全文检索(搜索引擎)架构设计>, 前公司的分类信息搜索基于此架构,效果明显,甚至将很大一部分带Where条件的MySQL SQL查询,都改用了Sphinx+MySQL搜索.但是,这套架构仍存在局限:一是MySQL本身的并发能力有限,在200-300个并发连接下,查询 和更新就

转 Solr vs. Elasticsearch谁是开源搜索引擎王者

转 https://www.cnblogs.com/xiaoqi/p/6545314.html 当前是云计算和数据快速增长的时代,今天的应用程序正以PB级和ZB级的速度生产数据,但人们依然在不停的追求更高更快的性能需求.随着数据的堆积,如何快速有效的搜索这些数据,成为对后端服务的挑战.本文,我们将比较业界两个最流行的开源搜索引擎,Solr和ElasticSearch.两者都建立在Apache Lucene开源平台之上,它们的主要功能非常相似,但是在部署的易用性,可扩展性和其他功能方面也存在巨大差

Lucene 4.X 全套教程

http://www.cnblogs.com/forfuture1978/category/300665.html Lucene 4.X 倒排索引原理与实现: (3) Term Dictionary和Index文件 (FST详细解析) 摘要: 我们来看最复杂的部分,就是Term Dictionary和Term Index文件,Term Dictionary文件的后缀名为tim,Term Index文件的后缀名是tip,格式如图所示.Term Dictionary文件首先是一个Header,接下来

elk示例-精简版2

作者:Danbo 时间:2016-03-13 1.保存进Elasticsearch Logstash可以试用不同的协议实现完成将数据写入Elasticsearch的工作,本节中介绍HTTP方式. 配置示例: output { elasticsearch { hosts => ["192.168.0.2:9200"] index => "logstash-%{type}-%{+YYYY.MM.dd}" document_type => "%

新浪微博产品管培生求职之路——微博发展史(一)

聊起微博,不得不提web2.0.告别了1.0传统的信息门户,web2.0时代新的媒体形式层出不穷,每一个新媒体形式的出现都意味着web2.0的普及和进步,微博就是在这种背景下诞生的.古人云,以史为鉴,可正衣冠.为了一步步走近微博,我们先从历史聊起.纵观新浪微博的发展历史,我将其分为三个阶段: 古代:微博元年,战火纷飞,群雄混战: 近代:杀出血路,战略靠拢,美国敲钟: 现代:后上市时代,稳中求进,何去何从. 本文就先从开山鼻祖twitter开始,讲讲新浪微博的古代史.此文撰与2010年,其中数据并