【django】京东等大型网站的混合搜索是怎么实现的？

混合搜索在各大网站如京东、淘宝都有应用，他们的原理都是什么呢?本博文将为你介绍它们的实现过程。

混合搜索的原理，用一句话来说就是：关键字id进行拼接。

混合搜索示例：

数据库设计：

视频方向：

class Direction(models.Model):
    weight = models.IntegerField(verbose_name=‘权重（按从大到小排列）‘, default=0)
    name = models.CharField(verbose_name=‘名称‘, max_length=32)

    classification = models.ManyToManyField(‘Classification‘)

    class Meta:
        db_table = ‘Direction‘
        verbose_name_plural = u‘方向（视频方向）‘

    def __str__(self):
        return self.name

　视频分类：

class Classification(models.Model):
    weight = models.IntegerField(verbose_name=‘权重（按从大到小排列）‘, default=0)
    name = models.CharField(verbose_name=‘名称‘, max_length=32)

    class Meta:
        db_table = ‘Classification‘
        verbose_name_plural = u‘分类（视频分类）‘

    def __str__(self):
        return self.name

　　视频：

class Video(models.Model):

    status_choice = (
        (0, u‘下线‘),
        (1, u‘上线‘),
    )
    level_choice = (
        (1, u‘初级‘),
        (2, u‘中级‘),
        (3, u‘高级‘),
    )
    status = models.IntegerField(verbose_name=‘状态‘, choices=status_choice, default=1)#可用于管理员的审核
    level = models.IntegerField(verbose_name=‘级别‘, choices=level_choice, default=1)
    classification = models.ForeignKey(‘Classification‘, null=True, blank=True)

    weight = models.IntegerField(verbose_name=‘权重（按从大到小排列）‘, default=0)

    title = models.CharField(verbose_name=‘标题‘, max_length=32)
    summary = models.CharField(verbose_name=‘简介‘, max_length=32)
    img = models.ImageField(verbose_name=‘图片‘, upload_to=‘./static/images/Video/‘)
    href = models.CharField(verbose_name=‘视频地址‘, max_length=256)

    create_date = models.DateTimeField(auto_now_add=True)

    class Meta:
        db_table = ‘Video‘
        verbose_name_plural = u‘视频‘

    def __str__(self):
        return self.title

　　备注：

视频方向Direction类和视频分类Classification多对多关系，即一个视频方向对应多个视频分类，一个视频分类也可以对应多个视频方向。——classification = models.ManyToManyField(‘Classification‘)
视频分类Classification类和视频Video类是一对多关系，即一个视频分类对应多个视频
视频Video类中level_choice 与视频也是一对多关系，这里为了简化表关系，直接使用choices=level_choice来代替

混合搜索url设计：

默认url：

http://127.0.0.1:8000/video-0-0-0.html，其中第一个数字代表视频方向，默认0代表全部方向；第二个数字代表视频分类，默认0代表全部分类；第三个数字代表视频等级，默认0代表全部等级。

每一个a标签默认的url：

　　例如运维自动化：<a href="/video-1-0-0.html">运维自动化</a>，即视频方向的对应数字为1，视频分类和视频等级都为0，这样做的目的是为了将此url和用户当前url进行拼接，并跳转到新的url。

　　选择运维自动化后的url：

　　多选情况下的url：

前端html：

加载自定义simple_tag：

{% load xx %}

　　注：

xx：名为xx的py文件，里面包含自定义函数，方便html中进行调用
在app中创建templatetags文件夹，将xx.py文件放在templatetags文件夹下

关于自定义simple_tag的更多信息，详见下文。

css：

<style>
        a{
            display: inline-block;
            padding: 8px;
        }
        .active{
            background-color: coral;
            color: white;
        }
        .item{
            display: inline-block;
            width: 300px;
            height: 400px;
        }
        .item img{
            border: 0;
            width: 300px;
            height: 280px;
            overflow: hidden;
        }
    </style>

css代码

设置css目的，当用户选择视频方向、视频分类、视频等级时，加深对应a标签。

选择区域html：

    <h3>选择：</h3>
    <div>
        {% action_all current_url 1 %} :
        {% for item in direction_list %}

             {% action current_url item 1 %}
        {% endfor %}
    </div>
    <div>
        {% action_all current_url 2 %} :
        {% for item in class_list %}

            {% action current_url item 2 %}
        {% endfor %}
    </div>
    <div>
        {% action_all current_url 3 %} :
        {% for item in level_list %}
            {% action current_url item 3 %}
        {% endfor %}
    </div>
    <hr />

　　该区域全部基于自定义simple_tag实现，详见下文。

视频显示区域html：

  <h3>视频：</h3>
    <hr />

    {% for item in video_list %}
        <a class="item" href="{{ item.href }}">
            <img src="/{{ item.img }}">
            <p>{{ item.title }}</p>
            <p>{{ item.summary }}</p>
        </a>
    {% endfor %}

　　循环显示符合条件的全部视频。

自定义simple_tag：

全部标签的生成：

我们希望，当用户选择全部标签时，url对应位置为0，即当用户三个选择都是全部时，url为：/video-0-0-0.html

以视频方向为例介绍：

对应位置html：

{% action_all current_url 1 %} :

　　从上述html可看出，action_all为对应的函数，它接收两个参数：当前url（current_url）、当前位置（视频方向、视频分类、视频等级）。其中current_url是后台传入html的，详见下文后台views函数介绍。

action_all函数：

#!/usr/bin/env python
# -*- coding:utf-8 -*-
from django import template　　
from django.utils.safestring import mark_safe

@register.simple_tag　　#注册simple_tag
def action_all(current_url,index): 　　#接收当前url和对应的位置参数
    """
    获取当前url，video-1-1-2.html
    :param current_url:
    :param item:
    :return:
    """
    url_part_list = current_url.split(‘-‘) 　　#根据“-”进行分割
    if index == 3:　　#如果是视频等级
        if url_part_list[index] == "0.html":　　#如果选择的是全部
            temp = "<a href=‘%s‘ class=‘active‘>全部</a>" 　　#添加 “active”属性
        else:
            temp = "<a href=‘%s‘>全部</a>"

        url_part_list[index] = "0.html"
    else:
        if url_part_list[index] == "0":　　
            temp = "<a href=‘%s‘ class=‘active‘>全部</a>"
        else:
            temp = "<a href=‘%s‘>全部</a>"

        url_part_list[index] = "0"

    href = ‘-‘.join(url_part_list)　　#处理后的列表再拼接成url字符串

    temp = temp % (href,)　　#生成对应的a标签
    return mark_safe(temp)　　#返回原生html

　其它a标签：

　　以视频方向为例介绍：

　对应位置html：

{% action current_url item 1 %}

从上述html可看出：action函数接收三个参数当前url、当前标签对象、当前位置。

　　action函数：

@register.simple_tag
def action(current_url, item,index):
    # videos-0-0-1.html
    # item: id name
    # video-   2   -0-0.html
    url_part_list = current_url.split(‘-‘)

    if index == 3:
        if str(item[‘id‘]) == url_part_list[3].split(‘.‘)[0]:　　#如果当前标签被选中
             temp = "<a href=‘%s‘ class=‘active‘>%s</a>"
        else:
            temp = "<a href=‘%s‘>%s</a>"

        url_part_list[index] = str(item[‘id‘]) + ‘.html‘ #拼接对应位置的部分url
    else:
        if str(item[‘id‘]) == url_part_list[index]:
            temp = "<a href=‘%s‘ class=‘active‘>%s</a>"
        else:
            temp = "<a href=‘%s‘>%s</a>"

        url_part_list[index] = str(item[‘id‘])

    ur_str = ‘-‘.join(url_part_list)  #拼接整体url
    temp = temp %(ur_str, item[‘name‘]) #生成对应的a标签
    return mark_safe(temp)  #返回安全的html

　　至此，所有选择标签生成完毕，能够根据用户选择动态生成url。

视频显示区域的前后端处理：

前端html：

  {% for item in video_list %}
        <a class="item" href="{{ item.href }}">
            <img src="/{{ item.img }}">
            <p>{{ item.title }}</p>
            <p>{{ item.summary }}</p>
        </a>
    {% endfor %}

　　循环显示所有符合条件的视频。

后端views函数：

def video(request,*args,**kwargs):
    print(kwargs)
    print(request.path)
    request_path = request.path　　#当前请求的路径

    q = {}　　#从数据库获取视频时的filter条件字典
    q[‘status‘] = 1 #状态为审核通过的

    class_id = int(kwargs.get(‘classification_id‘)) #获取url中的视频分类id

    direction_list = models.Direction.objects.all().values(‘id‘,‘name‘) #从数据库中获取所有的视频方向（包括视频方向的id和name）

    if kwargs.get(‘direction_id‘) == ‘0‘:
        # 方向选择全部
        print(‘方向等于0‘)
        class_list = models.Classification.objects.all().values(‘id‘, ‘name‘) #方向id=0，即获取所有的视频分类（包括视频分类的id和name）
        if kwargs.get(‘classification_id‘) == ‘0‘: #如果视频分类id也为0，即全部分类
            pass
        else:
            # 如果视频分类不是全部，过滤条件为视频分类id in [url中的视频分类id]
            q[‘classification_id__in‘] = [class_id,] 

    else:
        print(‘方向不为0‘)
        # 方向选择某一个方向，
        # 如果分类是0
        if kwargs.get(‘classification_id‘) == ‘0‘:
            print(‘分类为0‘)
            obj = models.Direction.objects.get(id=int(kwargs.get(‘direction_id‘)))　　#获取已选择的视频方向
            class_list = obj.classification.all().values(‘id‘, ‘name‘)　　#获取该方向的所有视频分类
            id_list = list(map(lambda x: x[‘id‘], class_list)) #获取所有视频分类对应的视频分类id

            q[‘classification_id__in‘] = id_list #过滤条件为视频分类id in [该方向下的所有视频分类id]
        else:
#方向不为0，分类也不为0
            obj = models.Direction.objects.get(id=int(kwargs.get(‘direction_id‘)))
            class_list = obj.classification.all().values(‘id‘, ‘name‘)
            id_list = list(map(lambda x:x[‘id‘], class_list))
            q[‘classification_id__in‘] = [class_id,] #过滤条件为视频分类id in [已经选择的视频分类id]
            print(‘分类不为0‘)
            # 当前分类如果在获取的所有分类中，则方向下的所有相关分类显示
            # 当前分类如果不在获取的所有分类中，
            if int(kwargs.get(‘classification_id‘)) in id_list:
                pass
            else:
                print(‘不再,获取指定方向下的所有分类：选中的回到全部‘)
                url_part_list = request_path.split(‘-‘)
                url_part_list[2] = ‘0‘
                request_path = ‘-‘.join(url_part_list)

    level_id = int(kwargs.get(‘level_id‘)) #视频等级id
    if level_id == 0:
        pass
    else:
        q[‘level‘] = level_id #过滤条件增加视频等级

    # models.Video.objects.filter(status=1)
    video_list = models.Video.objects.filter(**q).values(‘title‘,‘summary‘, ‘img‘, ‘href‘)

    # level_list = models.Video.level_choice

    ret = map(lambda x:{"id": x[0], ‘name‘: x[1]}, models.Video.level_choice)#把视频等级转化为单个标签是字典格式，整体是列表格式
    level_list = list(ret)
    return render(request, ‘video.html‘, {‘direction_list‘: direction_list,
                                          ‘class_list‘: class_list,
                                          ‘level_list‘: level_list,
                                          ‘current_url‘: request_path,
                                          "video_list": video_list})

　　总结：以上就是混合搜索的前后端全过程，欢迎读者来与楼主进行交流。如果本文对您有参考价值，欢迎帮博主点下文章下方的推荐，谢谢！

时间： 2024-11-05 21:33:59

【django】京东等大型网站的混合搜索是怎么实现的？

混合搜索示例：

数据库设计：

混合搜索url设计：

前端html：

加载自定义simple_tag：

css：

选择区域html：

自定义simple_tag：

全部标签的生成：

其它a标签：

视频显示区域的前后端处理：

前端html：

后端views函数：

【django】京东等大型网站的混合搜索是怎么实现的？的相关文章

大型网站系统架构的演化(转)

大型网站系统架构的演化

Mysql在大型网站的应用架构演变

大型网站架构的演化

大型网站系统架构的演化【转自飘扬的红领巾】

【转载】大型网站架构的演进

大型网站--负载均衡架构

大型网站的演化

抛砖引玉:大型网站性能优化之Javascript异步懒加载技术