Django Aggregation聚合

Django有两种方法来生成聚合。第一种方法是为整个QuerySet生成聚合值,例如为全部的books生成price的平均值:

>>> from django.db.models import Avg>>> Book.objects.all().aggregate(Avg(‘price‘)){‘price__avg‘: 34.35}

可以简略为:

>>> Book.objects.aggregate(Avg(‘price‘)){‘price__avg‘: 34.35}

函数aggregate()的参数是一系列聚合函数aggregate functions:

Avg

返回平均值

Count
  class Count(field, distinct=False)

返回计数。当参数distinct=True时,返回unique的对象数目。

Max

返回最大值

Min

返回最小值.

StdDev
  class StdDev(field, sample=False)
返回标准偏差

有一个参数sample

默认情况下sample=False,返回总体标准偏差,如果sample=True,返回样本标准偏差。

Sum

返回总值

Variance
  class Variance(field, sample=False)
返回方差

有一个参数sample,默认返回总体方差,sample设为True时返回样本方差。

aggregate()方法被调用时,返回一个键值对字典,可以指定key的名字:

>>> Book.objects.aggregate(average_price=Avg(‘price‘)){‘average_price‘: 34.35}

如果你想生成多个聚合,你只需要添加另一个参数。所以,如果我们还想知道所有书的最高和最低的价格:

>>> from django.db.models import Avg, Max, Min>>> Book.objects.aggregate(Avg(‘price‘), Max(‘price‘), Min(‘price‘)){‘price__avg‘: 34.35, ‘price__max‘: Decimal(‘81.20‘), ‘price__min‘: Decimal(‘12.99‘)}

为查询集的每个对象生成聚合值Generating aggregates for each item in a QuerySet

这是生成聚合值的第二种方法。比如你要检索每本书有多少个作者。book和author是manytomany的关系,我们可以为每本书总结出这种关系。

每个对象的总结可以用方法annotate()生成:

# 建立一个annotate QuerySet>>> from django.db.models import Count>>> q = Book.objects.annotate(Count(‘authors‘))# 第一个对象>>> q[0]<Book: The Definitive Guide to Django>>>> q[0].authors__count2# 第二个对象>>> q[1]<Book: Practical Django Projects>>>> q[1].authors__count1

 也可以指定生成属性的名字:

>>> q = Book.objects.annotate(num_authors=Count(‘authors‘))>>> q[0].num_authors2>>> q[1].num_authors1

和aggregate()不同,annotate()的输出是一个QuerySet。

联合聚合Joins and aggregates

目前为止,我们聚合查询的field都属于我们要查询的Model,我们也可以用其它Model的field来进行聚合查询,例如:

>>> from django.db.models import Max, Min>>> Store.objects.annotate(min_price=Min(‘books__price‘), max_price=Max(‘books__price‘))

这样就可以查询每个Store里面books的价格范围

联合链的深度可以随心所欲:

>>> Store.objects.aggregate(youngest_age=Min(‘books__authors__age‘))

反向关系Following relationships backwards

通过book反向查询publisher:

>>> from django.db.models import Count, Min, Sum, Avg>>> Publisher.objects.annotate(Count(‘book‘))

返回的QuerySet的每个publisher都会带一个属性book_count。

查询出版最久的书的出版日期:

>>> Publisher.objects.aggregate(oldest_pubdate=Min(‘book__pubdate‘))

查询每个作者写的书的总页数:

>>> Author.objects.annotate(total_pages=Sum(‘book__pages‘))

查询所有作者写的书的平均rating:

>>> Author.objects.aggregate(average_rating=Avg(‘book__rating‘))

聚合和其它查询集操作Aggregations and other QuerySet clauses

filter() and exclude()

聚合可以和filter和exclude一起使用:

>>> from django.db.models import Count, Avg>>> Book.objects.filter(name__startswith="Django").annotate(num_authors=Count(‘authors‘))>>> Book.objects.filter(name__startswith="Django").aggregate(Avg(‘price‘))

可以根据聚合值进行筛选:

>>> Book.objects.annotate(num_authors=Count(‘authors‘)).filter(num_authors__gt=1)

编写一个包含annotate()和filter()从句的复杂查询时,要特别注意作用于QuerySet的从句的顺序顺序的不同,产生的意义也不同:

>>> Publisher.objects.annotate(num_books=Count(‘book‘)).filter(book__rating__gt=3.0)>>> Publisher.objects.filter(book__rating__gt=3.0).annotate(num_books=Count(‘book‘))

两个查询都返回了至少出版了一本好书(评分大于3分)的出版商的列表。但是第一个查询的注解包含其该出版商发行的所有图书的总数;而第二个查询的注解只包含出版过好书的出版商的所发行的好书(评分大于3分)总数。在第一个查询中,注解在过滤器之前,所以过滤器对注解没有影响。在第二个查询中,过滤器在注解之前,所以,在计算注解值时,过滤器就限制了参与运算的对象的范围

order_by()

可以根据聚合值进行排序:

>>> Book.objects.annotate(num_authors=Count(‘authors‘)).order_by(‘num_authors‘)

values()

通常,注解annotate是添加到每一个对象上的,一个执行了注解操作的查询集 QuerySet 所返回的结果中,每个对象都添加了一个注解值。但是,如果使用了values()从句,它就会限制结果中列的范围,对注解赋值的方法就会完全不同。就不是在原始的 QuerySet 返回结果中对每个对象中添加注解,而是根据定义在 values() 从句中的字段组合对先结果进行唯一的分组,再根据每个分组算出注解值,这个注解值是根据分组中所有的成员计算而得的:

>>> Author.objects.values(‘name‘).annotate(average_rating=Avg(‘book__rating‘))

这样的写法下,QuerySet会根据name进行组合,返回的是每个unique name的聚合值。如果有两个作者有相同的名字,这两个作者会被当做一个计算,他们的books会合在一起。

>>> Author.objects.annotate(average_rating=Avg(‘book__rating‘)).values(‘name‘, ‘average_rating‘)

位置互换后,会为每个author都生成一个average_rating,而且只会输出每个author的name和average_rating。

默认排序下使用聚合:

from django.db import modelsclass Item(models.Model):    name = models.CharField(max_length=10)    data = models.IntegerField()    class Meta:        ordering = ["name"]

如果你想知道每个非重复的data值出现的次数,你可能这样写:

# Warning: 不正确的写法Item.objects.values("data").annotate(Count("id"))

这部分代码想通过使用它们公共的data值来分组Item对象,然后在每个分组中得到id值的总数。但是上面那样做是行不通的。这是因为默认排序项中的name也是一个分组项,所以这个查询会根据非重复的(data,name)进行分组,而这并不是你本来想要的结果。所以,你需要这样写来去除默认排序的影响:

Item.objects.values("data").annotate(Count("id")).order_by()

Aggregating annotations

也可以根据annotation结果生成聚合值,例如计算每本书平均有几个作者:

>>> from django.db.models import Count, Avg>>> Book.objects.annotate(num_authors=Count(‘authors‘)).aggregate(Avg(‘num_authors‘)){‘num_authors__avg‘: 1.66}

  

参考地址:http://sns.hwcrazy.com/django/ref/models/querysets/index.html

时间: 2025-01-07 08:26:16

Django Aggregation聚合的相关文章

Django Aggregation数据库聚合查询

在当今根据需求而不断调整而成的应用程序中,通常不仅需要能依常规的字段,如字母顺序或创建日期,来对项目进行排序,还需要按其他某种动态数据对项目进行排序.Djngo聚合就能满足这些要求. 以下面的Model为例 from django.db import models class Author(models.Model): name = models.CharField(max_length=100) age = models.IntegerField() class Publisher(model

django的聚合函数和aggregate、annotate方法使用

支持聚合函数的方法: 提到聚合函数,首先我们要知道的就是这些聚合函数是不能在django中单独使用的,要想在django中使用django聚合函数,就必须把这些聚合函数放到支持他们的方法内,这样才能执行.支持聚合函数的方法有两种,分别是aggregate和annotate,这两种方法执行的原生SQL以及结果都有很大的区别,下面我们以实例操作的方式一一介绍: # 示例模型: class Author(models.Model): """作者模型"""

django ORM聚合函数

在Django中,聚合函数是通过aggregate方法实现的,aggregate方法返回的结果是一个字典 在使用时需要先导入模块from django.db.models import Count,Avg,Max,Min,Sum 假设有一个模型 class Book(models.Model): name = models.CharField(max_length=100) pages = models.IntegerField() price = models.FloatField() aut

aggregation 详解4(pipeline aggregations)

概述 管道聚合处理的对象是其它聚合的输出(桶或者桶的某些权值),而不是直接针对文档. 管道聚合的作用是为输出增加一些有用信息. 管道聚合大致分为两类: parent 此类聚合的"输入"是其[父聚合]的输出,并对其进行进一步处理.一般不生成新的桶,而是对父聚合桶信息的增强. sibling 此类聚合的输入是其[兄弟聚合]的输出.并能在同级上计算新的聚合. 管道聚合通过 buckets_path 参数指定他们要进行聚合计算的权值对象,buckets_path 参数有其自己的使用语法. 管道

Django ORM模型的一点体会

作者:Vamei 出处:http://www.cnblogs.com/vamei 严禁转载. 使用Python的Django模型的话,一般都会用它自带的ORM(Object-relational mapping)模型.这个ORM模型的设计比较简单,学起来不会特别花时间.不过,Django的ORM模型有自己的一套语法,有时候会觉得别扭.这里聊一下我自己的体会. 模型设计 这一部分算处理得比较好的部分.Django的数据模型的建立过程很简单,就是继承django.db.models中的Model类,

DSO转换规则的Aggregation默认为覆盖MOV

声明:原创作品,转载时请注明文章来自SAP师太技术博客:www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将追究法律责任!原文链接:http://www.cnblogs.com/jiangzhengjun/p/4296066.html 在为DSO创建好Transformation后,Key Figure转换规则的Aggregation聚合方式默认为覆盖MOV

学习UML实现、泛化、依赖、关联、聚合、组合

类之间的关系种类:Realization(实现), Generalization(泛化),Dependency(依赖).Association(关联).Aggregation(聚合).Composition(合成或组合). 其中,Aggregation(聚合).Composition(合成)属于Association(关联),是特殊的Association关联关系. 实现(Realization): 指的是一个类实现接口(可以是多个)的功能:实现是类与接口之间最常见的关系:C 中没有直接的接口而

Django admin操作

  无名小妖     昵称:无名小妖园龄:1年6个月粉丝:22关注:1 +加关注 搜索 常用链接 我的随笔 我的评论 我的参与 最新评论 我的标签 我的标签 Python(1) python3(1) 随笔分类 python3(171) zabbix(10) 前端(5) 算法(9) 随笔档案 2018年2月 (9) 2018年1月 (20) 2017年12月 (2) 2017年11月 (1) 2017年9月 (14) 2017年8月 (6) 2017年7月 (7) 2017年6月 (58) 201

StarUML类图相关——关联、聚合、组合、泛化、依赖、实现

在阅读设计模式相关的书籍,或者其他一些项目.相关博客等等,经常会遇到类图,它对于一个类的信息,如变量.方法及其可见性,类与类(接口)之间的继承关系.依赖关系.聚合关系.组合关系等,都可以比较形象得当地描述出来.这样有用的工具,还是需要稍微掌握了解下,也方便自己的应用和描述.因此就有了这篇搬运工文档 一.StarUML下载和入手 1.先捧出StarUML官网StarUML--The Open Source UML/MDA Platform. 2.入手简单的UML开发可以参考:使用StarUML创建