本文是我在开发过程中遇到的一些问题的整理,有些摘自网上别人的方法。
1. org.apache.solr.client.solrj.SolrServerException: Timeout occured while waiting response from server at: http://localhost/solr请求超时
解决方法:设置setConnectionTimeout和setSoTimeout为1分钟
2. org.apache.solr.common.SolrException: undefined field text
解决方法: 设置solrConfig.xml <str name="df">id</str> 默认是text
3. org.apache.solr.common.SolrException: Invalid Date String时间格式化问题
主要是Solr使用的是标准的格林威治(GMT)时间 这种(yyyy-MM-dd‘T‘HH:mm:ss.SSS‘Z‘)北京在东八区 默认时间会-8小时
所以为了满足他这个减8 我的做法是在创建索引格式化日期类型的时候 判断下 把它时间+8 。
所以重新创建一个SolrEntityBinder类 此类是完全copy的DocumentObjectBinder. 只修改了一处。
修改了类中toSolrInputDocument方法
[html] view plain?
- <span style="color:#3333ff;"> //判断是否是日期-------------///
- if(field.type==Date.class){
- Date d = (Date)field.get(obj);
- Calendar cal = Calendar.getInstance();
- cal.setTimeInMillis(d.getTime());
- cal.add(Calendar.HOUR, 8);
- d = cal.getTime();
- doc.setField(field.name,d,1.0f);
- }else{
- doc.setField(field.name, field.get(obj), 1.0f);
- }</span>
4.Solr查询字符串空值
有时候需要查询某个字段为空的记录,比如当solr做facet时,某个域为空的记录被统计,故也会被查询。
一个例子是职位记录,其中某种原因公司可能为空。这时我们如果想查询公司名称为空的记录可以采用如下语法实现(似乎目前为止只有此方法可行):
-company:[* TO *] 这样你会看到结果集中的记录将含有所有公司名称为空的记录。
5.Solr竞价排名功能
假如你有3个doc想让它们有竞价排名,那就配这3个solr会把这3个放前面,然后是按照默认排序的其他doc 。
参考wiki:http://wiki.apache.org/solr/QueryElevationComponent
6.Solr DisMax 分析
要用dismax,就必须启用,在solr1.3以后,solr的dismax功能通过 DisMaxQParserPlugin 来解析了。
我测试的版本是3.3,是通过在查询url里添加defType=dismax来启用dismax功能的。通过qt=dismax的话不会起作用的。
通过 defType=dismax 时,Solr 的QueryComponent组件的prepare的方法会取到defType参数的值,去创建对应的quey解析器。
7.Solr 跨核检索
你在查询的条件里面加上shards=localhost:9095/solr/core0,localhost:9095/solr/core1 。
8.Solr 首位*检索
solr 支持 *在第一位的搜索,只是性能不好,要扫描全部的倒排链。