Django 聚合与查询集API

本文从Django官方文档总结而来,将聚合的主要用法和查询集的常见方法做一归纳。

聚合

1. 聚合的产生来源于django数据库查询,通常我们使用django查询来完成增删查改,但是有时候需要更复杂的方法才能完成对数据的提取、筛选、更改,所以需要一组对象聚合来完成这种操作。模型举例如下:

from django.db import models

class Author(models.Model):
    name = models.CharField(max_length=100)
    age = models.IntegerField()

class Publisher(models.Model):
    name = models.CharField(max_length=300)
    num_awards = models.IntegerField()

class Book(models.Model):
    name = models.CharField(max_length=300)
    pages = models.IntegerField()
    price = models.DecimalField(max_digits=10, decimal_places=2)
    rating = models.FloatField()
    authors = models.ManyToManyField(Author)
    publisher = models.ForeignKey(Publisher)
    pubdate = models.DateField()

class Store(models.Model):
    name = models.CharField(max_length=300)
    books = models.ManyToManyField(Book)
    registered_users = models.PositiveIntegerField()

根据给出的模型,先引入三个例子:

# Total number of books.
>>> Book.objects.count()
2452

# Total number of books with publisher=BaloneyPress
>>> Book.objects.filter(publisher__name=‘BaloneyPress‘).count()
73
>>> from django.db.models import Avg
>>> Book.objects.all().aggregate(Avg(‘price‘))
{‘price__avg‘: 34.35}

注意几个点: .all() 和 .filter()    和  .count() 和 .aggregate() 为方法,前两者是返回新的查询集的方法(括号里面有参数),后两者是不返回查询集的方法 。 publisher 显然为字段名, name为字段查找,两者之间以双下划线连接 :__       price也是字段名,Avg 为聚合函数,用来求平均值。 以上提及的方法字段查找聚合函数将在查询集API中介绍。那么,我们先介绍聚合。

2.django提供了两种生成聚合的方法

1)从整个查询集生成统计值,主要用法:aggregate(*args, **kwargs)

aggregate()QuerySet 的一个终止子句,也就是说aggregate返回一个字典,包含根据QuerySet 计算得到的聚合值(平均数、和等等)。aggregate() 的每个参数指定返回的字典中将要包含的值。eg:

Book.objects.all()  # 返回所有图书的集合
>>> from django.db.models import Avg  # 引入用来求平均值的聚合函数 Avg
>>> Book.objects.all().aggregate(Avg(‘price‘))  # 要计算所有书的平均价格,通过在查询集后面附加aggregate()子句实现
{‘price__avg‘: 34.35} # 返回的是字典

>>> Book.objects.aggregate(Avg(‘price‘))  # all()在这里多余,可以省掉
{‘price__avg‘: 34.35}                     # 返回的字典中,键为聚合值的标识符,由字段和聚合函数的名称自动生成 ,值为计算出来的聚合值

>>> Book.objects.aggregate(average_price=Avg(‘price‘)) {‘average_price‘: 34.35}                 # 为聚合值更换名称,提供参数average_price
>>> from django.db.models import Avg, Max, Min   # 生成了不止一个聚合>>> Book.objects.aggregate(Avg(‘price‘), Max(‘price‘), Min(‘price‘)) {‘price__avg‘: 34.35, ‘price__max‘: Decimal(‘81.20‘), ‘price__min‘: Decimal(‘12.99‘)}

2)为查询集的每一项成聚合,主要用法:annotate(*args, **kwargs)

这种方法为每一个对象都生成一个独立的汇总值,比如,如果你在检索一列图书,你可能想知道每一本书有多少作者参与。每本书和作者是多对多的关系。我们想要汇总QuerySet.中每本书里的这种关系。逐个对象的汇总结果可以由annotate()子句生成。当annotate()子句被指定之后,QuerySet中的每个对象都会被注上特定的值。这些注解的语法都和aggregate()子句所使用的相同。annotate()的每个参数都描述了将要被计算的聚合。

# Build an annotated queryset
>>> from django.db.models import Count
>>> q = Book.objects.annotate(Count(‘authors‘)) # 和aggregate语法相同,不同的是annotate返回的q是各个对象,可用q[0],q[1]等取出对象
# Interrogate the first object in the queryset
>>> q[0]  # 返回的是第一个Book对象
<Book: The Definitive Guide to Django>
>>> q[0].authors__count   # 编写第一本书的作者数目为2, authors为Book模型中的字段名,count为字段查询,所以用双下划线连接
2
# Interrogate the second object in the queryset
>>> q[1]  # 返回的是第二个Book对象
<Book: Practical Django Projects>
>>> q[1].authors__count
1

>>> q = Book.objects.annotate(num_authors=Count(‘authors‘))  # 提供了自定义的num_authors别名代替了authors__count
>>> q[0].num_authors
2
>>> q[1].num_authors
1

与 aggregate() 不同的是, annotate() 不是一个终止子句。annotate()子句的返回结果是一个查询集 (QuerySet);这个 QuerySet可以用任何QuerySet方法进行修改,包括 filter()order_by()。发现aggregate 和 annotate用法的区别了吗,再次举例如下(在聚合函数中指定聚合字段时,Django 允许你使用同样的 双下划线 表示关联关系,):

>>> from django.db.models import Max, Min
>>> Store.objects.annotate(min_price=Min(‘books__price‘), max_price=Max(‘books__price‘))
# 查找每个商店提供的图书的价格范围
>>> Store.objects.aggregate(min_price=Min(‘books__price‘), max_price=Max(‘books__price‘))
# 查找所有书店中最便宜的书和最贵的书的价格
>>> Store.objects.aggregate(youngest_age=Min(‘books__authors__age‘))# 利用双下划线延伸关系链,查找所有书店中的所有作者的最小年龄

3. 聚合和其他查询子句

filter() 和 exclude()

>>> from django.db.models import Count, Avg
>>> Book.objects.filter(name__startswith="Django").annotate(num_authors=Count(‘authors‘))
# 使用annotate() 子句时,过滤器有限制注解对象的作用。例如,得到每本以 "Django" 为书名开头的图书作者的总数
>>> Book.objects.filter(name__startswith="Django").aggregate(Avg(‘price‘))
# 使用aggregate()子句时,过滤器有限制聚合对象的作用。例如,算出所有以 "Django" 为书名开头的图书平均价格
>>> Book.objects.annotate(num_authors=Count(‘authors‘)).filter(num_authors__gt=1)
# 得到不止一个作者的图书

注意以上annotate() 和 filter()子句的顺序,顺序不同查询结果也会不同(后者筛选的出版商为前者的子集。):

>>> Publisher.objects.annotate(num_books=Count(‘book‘)).filter(book__rating__gt=3.0)# 返回了至少出版了一本好书(评分大于 3 分)的出版商, 在这些出版商中包含出版商所发行的所有图书!(这些出版商中每个出版商只要发行过一本>3的书就算)
>>> Publisher.objects.filter(book__rating__gt=3.0).annotate(num_books=Count(‘book‘))
# 返回了至少出版了一本好书(评分大于 3 分)的出版商, 在这些出版商中只含有发行过好书的出版商!(这些出版商中每个出版商发行的所有书评分都必须>3)

order_by()

>>> Book.objects.annotate(num_authors=Count(‘authors‘)).order_by(‘num_authors‘) # 根据每本书的作者数量多少进行排序

values()

>>> Author.objects.annotate(average_rating=Avg(‘book__rating‘))
# 返回所有作者及他所著图书的平均评分
>>> Author.objects.values(‘name‘).annotate(average_rating=Avg(‘book__rating‘))# 作者先按名称分组,意味着若两位作者同名则查询结果被合并!,两者均分被算为一个
>>> Author.objects.annotate(average_rating=Avg(‘book__rating‘)).values(‘name‘, ‘average_rating‘)

# 这段代码交换了value和average顺序,将给每个作者添加一个唯一的字段,但只有作者名称和average_rating 注解会返回在输出结果中

4.查询集(QuerySet)API 查询

本质上,可以创建、过滤、切片和传递查询集而不用真实操作数据库。在你对查询集做求值之前,不会发生任何实际的数据库操作。可以通过迭代、切片、序列化/缓存、repr()、len()、list()、bool()

1)返回新的查询集方法

filter(): 返回一个新的QuerySet,包含与给定的查询参数匹配的对象。

exclude():返回一个新的QuerySet,它包含不满足给定的查找参数的对象。

annotate(*args, **kwargs): 使用提供的查询表达式Annotate查询集中的每个对象。
order_by(*fields):  默认情况下,QuerySet 根据模型Meta 类的ordering 选项排序。你可以使用order_by 方法给每个QuerySet 指定特定的排序。
...

QuerySet API参考

时间: 2024-09-27 18:29:54

Django 聚合与查询集API的相关文章

查询集API -- Django从入门到精通系列教程

该系列教程系个人原创,并完整发布在个人官网刘江的博客和教程 所有转载本文者,需在顶部显著位置注明原作者及www.liujiangblog.com官网地址. Python及Django学习QQ群:453131687 本节将详细介绍查询集的API,它建立在下面的模型基础上,与上一节的模型相同: from django.db import models class Blog(models.Model): name = models.CharField(max_length=100) tagline =

django查询集API

本节将详细介绍查询集的API,它建立在下面的模型基础上,与上一节的模型相同: from django.db import models class Blog(models.Model): name = models.CharField(max_length=100) tagline = models.TextField() def __str__(self): # __unicode__ on Python 2 return self.name class Author(models.Model

django下常用查询的API

django.db.models.query.QuerySet QuerySet的特点:1.是可迭代2.可切片 查询相关的API:1.get(**kwargs):返回与所给的筛选条件相匹配的对象,返回结果有且只有一个.如果符合筛选条件的对象超过一个,就会抛出MultipleObjectsReturned异常,如果没有找到符合筛选条件的对象,就会抛出DoesNotExist异常.2.all():查询所有结果3.filter(**kwargs):包含了与所给的筛选条件相匹配的对象4.exclude(

Django查询集QuerySet及两大特性

1 概念 Django的ORM中存在查询集的概念. 查询集,也称查询结果集.QuerySet,表示从数据库中获取的对象集合. 当调用如下过滤器方法时,Django会返回查询集(而不是简单的列表): all():返回所有数据. filter():返回满足条件的数据. exclude():返回满足条件之外的数据. order_by():对结果进行排序. 也就意味着查询集可以含有零个.一个或多个过滤器.过滤器基于所给的参数限制查询的结果. 从SQL的角度讲,查询集与select语句等价,过滤器像whe

查询集 QuerySet

1 概念 Django的ORM中存在查询集的概念. 查询集,也称查询结果集.QuerySet,表示从数据库中获取的对象集合. 当调用如下过滤器方法时,Django会返回查询集(而不是简单的列表): all():返回所有数据. filter():返回满足条件的数据. exclude():返回满足条件之外的数据. order_by():对结果进行排序. 对查询集可以再次调用过滤器进行过滤,如 BookInfo.objects.filter(bread__gt=30).order_by('bpub_d

Django框架(六):模型(二) 字段查询、查询集

1. 字段查询 通过模型类.objects属性可以调用如下函数,实现对模型类对应的数据表的查询. 函数名 功能 返回值 说明 get 返回表中满足条件的一条且只能有一条数据. 返回值是一个模型类对象. 参数中写查询条件. 1)如果查到多条数据,则抛异常MultipleObjectsReturned. 2)查询不到数据,则抛异常:DoesNotExist. all 返回模型类对应表格中的所有数据. 返回值是QuerySet类型 查询集 filter 返回满足条件的数据. 返回值是QuerySet类

django查询集-17

当查询结果是多个的时候,django-ORM会返回一个 查询集(QuerySet) ,表示从数据库中获取对象的 集合 . 查询集可以使用过滤器进行再次处理. 例如查询阅读量大于20且评论数大于30的书 >>> book = Book.objects.filter(b_read__gt=20) >>> book.filter(b_comment__gt=30) <QuerySet [<Book: 天龙八部>]> 因为查询集类似一个集合,所以可以对查

django查询集

查询集 all, filter, exclude, order_by调用这些函数会产生一个查询集,QuerySet类对象可以继续调用上面的所有函数. 查询集特性 1) 惰性查询:只有在实际使用查询集中的数据的时候才会发生对数据库的真正查询. 2) 缓存:当使用的是同一个查询集时,第一次使用的时候会发生实际数据库的查询,然后把结果缓存起来,之后再使用这个查询集时,使用的是缓存中的结果. 限制查询集 可以对一个查询集进行取下标或者切片操作来限制查询集的结果. 对一个查询集进行切片操作会产生一个新的查

Django - - 基础 - - Django ORM常用查询语法及进阶

目录 一般操作 必知必会13条 单表查询之神奇的双下划线 ForeignKey操作 正向查找 反向操作 ManyToManyField class RelatedManager 聚合查询和分组查询 聚合 分组 F查询和Q查询 F查询 Q查询 锁和事务 锁 事务 其他鲜为人知的操作(有个印象即可) Django ORM执行原生SQL QuerySet方法大全 Django终端打印SQL语句 在Python脚本中调用Django环境 1, 一般操作 官网文档:https://docs.djangop