【阿里云产品公测】OpenSearch初探

作者:阿里云用户 yqzzzz

这两天在折腾站内搜索,下午照例上阿里云网站看看ECS,OSS情况,恰巧看到免费公测的活动,咦,OpenSearch,看起来这不就是我要找的东西么!
 
1分钟时间填完申请表,没想到阿里云这么快就给审核通过了,效率,赞!
 
之前考察了国外的Swiftype,还有百度的站内搜索,刚刚花了点时间看了一下OpenSearch集成的基本概念。比较不是很仔细,大致说说对这三者的基本感想。
 
Swiftype
 
硅谷出来的,功能强大,直接可以按照入口URL来索引比如:newooo.com , 会直接把所有的页面做个索引,而且可以设置各种include,exclude,这些不多说,监控搜索情况,关键字这些等都是基本功能也不展开了,这个比较牛的一点是可以调整各关键字的结果页面的显示顺序。不过最后没选择Swiftype,因为屌丝站长只能负担得起free plan,而这个有个硬伤就是做索引只能是7天一次,这个实时性太差了,然后又负担不起收费的plan,所以作罢。
 
百度站内搜索
 
很早就知道了,放弃了swiftype以后就开始看,基本能满足需求,有个特点,说是站内搜索的数据其实跟百度的收录是分开的,然后很搞笑的是sitemap.xml要提交两次,一个给百度的网站页面收录,一个给站内搜索的数据提交,而且两个xml的protocol还不一样,站内搜索的sitemap.xml加了个data的节点,用来标识文章的数据结构。跟OpenSearch的数据结构有点异曲同工。百度的好处是免费用,还能设置结果页广告来盈利。当然结果页的可定制性没OpenSearch高。
 
OpenSearch
 
由于没有正式集成,说得不对的地方请见谅。
基本功能这些不多说了,高大上,该有的都有。从小站的角度说几点感想:
1.用第三方站内搜索的绝大多数应该是微小站吧,大站很多都自己做搜索了,这里还有个数据敏感性的问题在。所以OpenSearch这个巨大数据量处理的卖点吸引力不是很大。小站希望的功能是一键生成数据源,然后简单易用。这个Swiftype做得比较好。
 
2.价格:不确定,这个是最大的问题,也是不想集成的原因,网站马上要上线了,等折腾完,公测结束,然后给个几百上千块一个月的收费方案,那我还不如用Swiftype。
 
3.数据源的问题,只能是OSS或者ODPS,有人说会考虑RDS,我目前在用OSS跟RDS,OSS主要用来放图片的,所以没存储结构化的数据,数据都在RDS,也就是说如果我要集成的话,得用程序把RDS表里的数据生成OSS的机构化数据。这个跟百度生成站内数据sitemap是一样的。至于ODPS,没用过,不多说。
 
最后,我还是再等等吧,等公测结束,看看要不要最终选用OpenSearch.

原文地址:http://bbs.aliyun.com/read/178996.html
参加活动:http://promotion.aliyun.com/act/aliyun/freebeta/

时间: 2024-08-28 17:03:32

【阿里云产品公测】OpenSearch初探的相关文章

【阿里云产品公测】大数据下精确快速搜索OpenSearch

[阿里云产品公测]大数据下精确快速搜索OpenSearch 作者:阿里云用户小柒2012 相信做过一两个项目的人都会遇到上级要求做一个类似百度或者谷歌的站内搜索功能.传统的sql查询只能使用like 或者FIND_IN_SET来实现.后者性能稍微好点但是必须要逗号分隔才可以实现匹配.甚至多条件的话还可能用到OR这是极影响系统性能的. 最近公司项目需要.主要是系统查询缓慢.并且查询精度不敢恭维.一开始想到的是Lucene 毕竟是一个开放源代码的全文检索引擎工具包 并且官方还在持续更新中.当时闲暇时

【阿里云产品公测】阿里云ACE部署通用完整教程及评测

[阿里云产品公测]阿里云ACE部署通用完整教程及评测 作者:阿里云用户bailimei ACE应该是目前在公测的服务中应用最广泛的一项服务.在公测云引擎ACE前曾使用过新浪SAE,而ACE给我的最初印象是比SAE要简单易用的多,除了上传文件需用SVN外,其它就像在用ECS+RDS,体验上没多大差别,因我现在就用着这两项产品,所以感觉比较直观.原先已有同学写了一些优秀的ACE教程,对分享自己的体验我们都应该点赞.下面以测试部署wordpress为例,重点对ACE使用过程中遇到的难点问题展开说明,并

【阿里云产品公测】利用PTS服务优化网站数据库读写性能

[阿里云产品公测]利用PTS服务优化网站数据库读写性能 作者:阿里云用户千鸟 写这个帖子主要也是因为在用PTS测试网站的时候,手动访问网站进入报错页面,主要原因是数据库连接对象存在问题,导致并发多的时候产生故障,于是简单分析了一下数据库读写的性能优化以及利用PTS的测试结果,整理出来和大家分享一下,顺便参加一下这个活动.        几乎所有的网站都需要数据库来存储网站中的相关信息,因此在网站应用与数据库的交互过程中,数据库数据读取的性能对网站整体的性能是至关重要的. ?      通常我们在

【阿里云产品公测】云引擎ACE新手实战基于Wordpress

[阿里云产品公测]云引擎ACE新手实战基于Wordpress 作者:阿里云用户imnpc ACE(Aliyun Cloud Engine) 是一款弹性.分布式的应用托管环境,支持Java.php多种语言环境.帮助开发者快速开发和部署服务端应用程序,并且简化了系统维护工作.搭载了丰富的分布式扩展服务,为应用程序提供强大助力. ACE(Aliyun Cloud Engine)目前最大的优点就是免费,预计以后也会照着SAE JAE等同类服务提供低廉的收费政策. 一般来说我们用于云平台的很多人都是简单安

【阿里云产品公测】简单日志服务SLS使用评测 + 教程

[阿里云产品公测]简单日志服务SLS使用评测 + 教程 评测介绍 被测产品: 简单日志服务SLS 评测环境: 阿里云基础ECS x2(1核, 512M, 1M) 操作系统: CentOS 6.5 x64 日志环境: Nginx(v1.6.2) HTTP服务器访问日志.服务器系统日志 评测人: mr_wid 评测时间: 2014年9月28日-2014年10月8日 准备工作 一.知彼知己, 百战不殆.对产品的了解程度, 直接决定着评测质量, 在评测前, 笔者首先整理并详细阅读了有关SLS产品以及关联

【阿里云产品公测】PTS压力测试WP站搜索

[阿里云产品公测]PTS压力测试WP站搜索 作者:阿里云用户cnsjw PTS性能测试服务是一个非常非常强大的压力测试工具.可以模拟百人同时访问网站的情况,并监测ECS和RDS的各项指标,生成非常详细的报告.可以自由设定各种测试脚本,场景以及任务,并让任务计划执行,只要在执行之后过来查看报告就可以了~~~ 首先第一步就是要先选择要测试的服务器,这里选择了在杭州的ECS和RDS服务. 打算测试的是搜索功能,随意设置了10个关键词,顺序执行测试. 首先先要新建一个测试脚本: 参数是一个CSV文件,然

【阿里云产品公测】云引擎ACE初体验

作者:阿里云用户蓝色之鹰 :RYYjmG5;  来投票支持我把=i2]qj\  序号2. [阿里云产品公测]云引擎ACE初体验:作者:蓝色之鹰 e(OKE7  序号10.[阿里云产品公测]结构化数据服务OTS之JavaSDK初体验:作者:蓝色之鹰 -- IewW  http://bbs.aliyun.com/read/178799.html 分享下我,公测体验! 来投票支持我把 序号2. [阿里云产品公测]云引擎ACE初体验:作者:蓝色之鹰  序号10.[阿里云产品公测]结构化数据服务OTS之J

【阿里云产品公测】工欲善其事,必先利其器,阿里云让我们扬帆起航

作者:阿里云用户 supechina 工欲善其事,必先利其器    工欲善其事必先利其器.谓工匠想要使他的工作做好,一定要先让工具锋利.比喻要做好一件事,准备工作非常重要.语出孔子·<论语·卫灵公>:“子贡问为仁.子曰:“工欲善其事,必先利其器.居是邦也,事其大夫之贤者,友其士之仁者.”                     2011年我们重金够得本地双拼域名jining.com,建立济宁网,开始我们的本地社区化运营,刚开始说运营有点牵强,因为我们根本不懂本地网站的发展路子.        

【阿里云产品公测】离线归档OAS,再也不用担心备份空间了

[阿里云产品公测]离线归档OAS,再也不用担心备份空间了 作者:阿里云用户莫须有3i 1 起步  1.1 初识OAS  啥是OAS,请看官方说明: 引用: 开放归档服务(Open Archive Service,简称OAS),致力于提供低成本.高可靠的数据归档服务,适合于大数据的长久归档备份. 低成本.高可靠,长久归档备份,这是它的特色.  1.2 申请开通 当前还处于公测阶段,需要申请,试用期间,免费试用,每个用户可以存储不超过10T的数据,并且文件数量不超过10万个,大伙有什么超大文件,没地

【阿里云产品公测】结构化数据服务OTS之JavaSDK初体验

[阿里云产品公测]结构化数据服务OTS之JavaSDK初体验 作者:阿里云用户蓝色之鹰 一.OTS简单介绍 OTS 是构建在阿里云飞天分布式系统之上的NoSQL数据库服务,提供海量结构化数据的存储和实时访问.NoSQL,泛指非关系型的数据库.随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展.OTS应用程序可以使用阿