Django1.9开发博客(10)- 全文搜索

Django本身不提供全文检索的功能,但django-haystack为其提供了全文检索的框架。 django-haystack能为Django提供whoosh,solr,Xapian和Elasticsearc四种全文检索引擎作为后端。 其中whoosh为纯python的实现,不是非常大型的应用,是没有问题的。 本文将介绍Django1.9中通过django-haystack与whoosh集成以及whoosh的中文支持。

安装依赖:

pip install django-haystackpip install whooshpip install jieba

建立模型

我们以文章为搜索目标,现在我的app名字为blog, 模型文件是mysite/blog/models.py :

123456789101112131415161718192021222324252627282930
# coding=utf-8from django.db import models@python_2_unicode_compatibleclass Post(models.Model):    class Meta:        verbose_name = u‘文章‘        verbose_name_plural = u‘文章‘    # 作者    author = models.ForeignKey(User)    # 标题    title = models.CharField(max_length=200)    # 正文    text = models.TextField()    # 标签    tags = models.ManyToManyField(Tag)    # 分类目录    category = models.ForeignKey(Category)    # 点击量    click = models.IntegerField(default=0)    # 创建时间    created_date = models.DateTimeField(default=timezone.now)    # 发布时间    published_date = models.DateTimeField(blank=True, null=True)

    def publish(self):        self.published_date = timezone.now()        self.save()

    def __str__(self):        return self.title

search_indexes.py

在app目录下建立一个search_indexes.py(mysite/blog/search_indexes.py)代码如下:

1234567891011121314
#!/usr/bin/env python# -*- encoding: utf-8 -*-from models import Postfrom haystack import indexesclass PostIndex(indexes.SearchIndex, indexes.Indexable):    # 文章内容    text = indexes.CharField(document=True, use_template=True)    # 对title字段进行索引    title = indexes.CharField(model_attr=‘title‘)    def get_model(self):        return Post

    def index_queryset(self, using=None):        return self.get_model().objects.all()

备注:search_indexes.py文件名不能修改,否则报错:No fields were found in any search_indexes.

post_text.txt

因为在search_indexes.py使用了use_template=True,所以可以同时使用模板对索引字段进行定义。

如:mysite/blog/templates/search/indexes/blog/post_text.txt:

{{ object.title }}{{ object.text }}

settings.py

12345
# Application definitionINSTALLED_APPS = (    ...    ‘haystack‘,)

urls.py

123456789
urlpatterns = patterns(    ‘‘,    url(r‘^admin/‘, include(admin.site.urls)),    url(r‘^xadmin/‘, include(xadmin.site.urls), name=‘xadmin‘),    url(r‘^accounts/login/$‘, ‘django.contrib.auth.views.login‘),    url(r‘^accounts/logout/$‘, ‘django.contrib.auth.views.logout‘, {‘next_page‘: ‘/‘}),    url(r‘^search/‘, include(‘haystack.urls‘)),    url(r‘‘, include(‘blog.urls‘)),)

jieba中文分词

jieba其实已经提供了集成whoosh的ChineseAnalyzer, 也就是说不需要自己写ChineseAnalyzer了,直接在whoosh_backend.py中直接引用就好; 同时,不推荐将whoosh_backend.py放到Lib下面,这样移植性会有问题,自己的代码,还是放在项目下面为妙。

1. 将文件haystack.backends.whoosh_backend.py拷贝到app下面,并重命名为whoosh_cn_backend.py, 如blog/whoosh_cn_backend.py。重点的改造有:

  • 增加:

    1
    from jieba.analyse import ChineseAnalyzer
  • 修改
    1
    schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=ChineseAnalyzer(), field_boost=field_class.boost, sortable=True)

2. 修改后端引擎,setting.py配置:

1234567
# full text searchHAYSTACK_CONNECTIONS = {    ‘default‘: {        ‘ENGINE‘: ‘blog.whoosh_cn_backend.WhooshEngine‘,        ‘PATH‘: os.path.join(BASE_DIR, ‘whoosh_index‘),    },}

重建索引

1
python manage.py rebuild_index

索引更新

最简单的办法就是在settings.py中添加:

1
HAYSTACK_SIGNAL_PROCESSOR = ‘haystack.signals.RealtimeSignalProcessor‘

自定义搜索示例

(1) 先定义view:

12345678
from haystack.forms import SearchFormdef full_search(request):    """全局搜索"""    keywords = request.GET[‘q‘]    sform = SearchForm(request.GET)    posts = sform.search()    return render(request, ‘blog/post_search_list.html‘,                  {‘posts‘: posts, ‘list_header‘: ‘关键字 \‘{}\‘ 搜索结果‘.format(keywords)})

(2) 然后在template页面中:

1234567891011
<!-- searchbox START --><div id="searchbox">    <form action="{% url ‘blog.views.full_search‘ %}" method="get">        <div class="content">            <label>                <input type="text" class="textfield searchtip" name="q" size="24" value="">            </label>            <input type="submit" class="button" value="">        </div>    </form></div>
时间: 2024-10-23 02:23:19

Django1.9开发博客(10)- 全文搜索的相关文章

Django1.7开发博客

转自: http://www.pycoding.com/articles/category/django 基于最新的django1.7写的,通俗易懂,非常适合新手入门. 感谢博主! 参考教程: http://tutorial.djangogirls.org/ GitHub项目地址: https://github.com/yidao620c/simpleblog Heroku演示地址: https://yidaoblog.herokuapp.com/   教程目录: 使用Django1.7开发博客

Django1.9开发博客(14)- 集成Xadmin

xadmin是一个django的管理后台实现,使用了更加灵活的架构设计及Bootstrap UI框架, 目的是替换现有的admin,国人开发,有许多新的特性: 兼容 Django Admin 使用 Bootstrap 作为 UI 框架 编辑页面灵活布局 主页面仪表盘及小部件 过滤器强化 数据导出 强大的插件机制 与django的集成 本篇以simpleblog项目为例,介绍下怎样在django中集成xadmin python2.7环境切换 注意,前面的教程都是在python3.4环境下开放的.

Django1.9开发博客(8)- 继续完善

到现在为止我们已经完成的差不多了,并且基本的东西都已经学到了,是时候用起来了. 我们的博客还有很多功能需要完善,下面抛砖引玉新增几个功能,还有其他功能等你自己去发现和实现. 草稿箱 之前我们新建文章的时候只是是保存到数据库,也就是仅仅保存了草稿,还没有对外发布, 在博客首页上面是看不到的,因为published_date字段为空.这里我们需要添加一个草稿箱的链接.还是四部曲. 第一步,添加一个链接: 打开mysite/templates/mysite/base.html文件,在 1 <h1>&

Django1.9开发博客(12)- i18n国际化

国际化与本地化的目的为了能为各个不同的用户以他们最熟悉的语言和格式来显示网页. Django能完美支持文本翻译.日期时间和数字的格式化.时区. 另外,Django还有两点优势: 允许开发者和模板作者指定他们哪些app应该被翻译或被格式化为本地形式. 允许用户根据自己的偏好来实现本地化显示.翻译依据语言,格式化依据国家, 这些信息由浏览器中的Accept-Language头来决定.不过目前为止时区还未能实现. 参考官方文档:https://docs.djangoproject.com/en/1.9

Django1.9开发博客(11)- 富文本与代码高亮

TinyMCE是一个轻量级的基于浏览器的所见即所得编辑器,支持目前流行的各种浏览器,由JavaScript写成. 功能配置灵活简单(两行代码就可以将编辑器嵌入网页中),支持AJAX.另一特点是加载速度非常快. django里引用TinyMCE富文本编辑器,其实很简单,前提是你知道django的静态文件配置. 其实这个我已经在前面文章提到过,可以回去再看看. TinyMCE的官方网站是:http://www.tinymce.com/ 下载地址:http://download.moxiecode.c

Django1.9开发博客(13)- redis缓存

Redis 是一个高性能的key-value数据库.redis的出现, 很大程度补偿了memcached这类keyvalue存储的不足,在部分场合可以对关系数据库起到很好的补充作用. 它提供了Python,Ruby,Erlang,PHP客户端,使用很方便. 目前Redis已经发布了3.0版本,正式支持分布式,这个特性太强大,以至于你再不用就对不住自己了. 性能测试 服务器配置:Linux 2.6, Xeon X3320 2.5Ghz SET操作每秒钟110000次,GET操作每秒钟81000次

Django1.9开发博客(9)- 用户认证

你应该注意到了一点,当你去新建.修改和删除文章的时候并不需要登录,这样的话任何浏览网站的用户都能随时修改和删除我的文章.这个可不是我想要的! 编辑和删除的认证 我们需要保护post_new, post_edit和post_publish这三个视图,只有登录用户才有权去执行. django为我们提供了很好的帮助类,其实就是利用了python中的decorators技术. django中认证的装饰器位于模块django.contrib.auth.decorators中,名称叫login_requir

Django1.9开发博客(6)- 模板继承

模板继承就是网站的多个页面可以共享同一个页面布局或者是页面的某几个部分的内容.通过这种方式你就需要在每个页面复制粘贴同样的代码了. 如果你想改变页面某个公共部分,你不需要每个页面的去修改,只需要修改一个模板就行了,这样最大化复用,减少了冗余,也减少了出错的几率,而且你敲的代码也少了. 创建一个base模板 一个base模板就是你全站所有页面都会继承的最基本的网站框架模板.我们在blog/templates/blog/中创建一个base.html模板: blog └───templates └──

文顶顶iOS开发博客链接整理及部分项目源代码下载

文顶顶iOS开发博客链接整理及部分项目源代码下载 网上的iOS开发的教程很多,但是像cnblogs博主文顶顶的博客这样内容图文并茂,代码齐全,示例经典,原理也有阐述,覆盖面宽广,自成系统的系列教程却很难找.如果你是初学者,在学习了斯坦福iOS7公开课和跟着文顶顶的博客做项目之后,最快只需要2个月时间,就基本可以独立完成iOS App的开发工作.有经验的开发者也可以在该博客中寻找代码片段进行学习借鉴,必有所收获. 在此也向@文顶顶 表示严重感谢! 由于文顶顶博客博文繁多,每次找文章需要频繁的翻页,