文档章节

day 49 数据分析, 数据聚合 F 查询 Q 查询

o
 osc_n6euf5h6
发布于 2019/03/19 22:20
字数 1563
阅读 9
收藏 0

精选30+云产品,助力企业轻松上云!>>>

 6、聚合查询和分组查询

    1、聚合查询aggregate

    我们先通过一个例子来感受一下吧。

1
2
3
# 计算所有图书的平均价格
books  =  models.Book.objects.aggregate(Avg( "price" ))
books  =  models.Book.objects.aggregate(avg_price = Avg( "price" ))   # 指定字典的key为avg_price

    aggregate()是QuerySet 的一个终止子句,意思是说,它返回一个包含一些键值对的字典。键的名称是聚合值的标识符,值是计算出来的聚合值。键的名称是按照字段和聚合函数的名称自动生成出来的。如果你想要为聚合值指定一个名称,可以向聚合子句指定它(如上例)。

    如果你希望生成不止一个聚合,你可以向aggregate() 子句中添加另一个参数。所以,如果你也想知道所有图书价格的最大值和最小值,可以这样查询:

1
2
3
4
from  django.db.models  import  Avg,  Max Min
 
# 计算所有图书的平均价格、最贵价格和最便宜价格
books  =  models.Book.objects.aggregate(Avg( "price" ),  Max ( "price" ),  Min ( "price" ))
    2、分组查询annotate

    在讲之前,我们先回忆一下,我们之前学过的SQL语句,该如何查询。咱们对比一下ORM代码,来加深理解。

    先来单表的练练手:

    表结构为:

复制代码
class Emp(models.Model):
    name = models.CharField(max_length=32)
    age = models.IntegerField()
    salary = models.DecimalField(max_digits=8, decimal_places=2)
    dep = models.CharField(max_length=32)
    province = models.CharField(max_length=32)
复制代码

    准备数据:

按 Ctrl+C 复制代码
按 Ctrl+C 复制代码

    查询操作:

复制代码
# 查询每一个部门名称以及对应的员工数
SQL:
select dep, count(1) from emp group by dep;
ORM:
models.Emp.objects.values('dep').annotate(c=Count('id'))

# 查询每一个部门名称以及对应的员工的平均工资
SQL:
select dep, avg(salary) from app01_emp GROUP BY dep;
ORM:
models.Emp.objects.values('dep').annotate(a=Avg('salary'))
复制代码

    好了,接下来。我们在玩一下多表的分组查询。

    表结构为:

按 Ctrl+C 复制代码
按 Ctrl+C 复制代码

    准备数据:

      1、Dep表:

INSERT INTO `bkm`.`app01_dep` (`id`, `title`) VALUES ('1', '销售部');
INSERT INTO `bkm`.`app01_dep` (`id`, `title`) VALUES ('2', '关公部');

      2、Emps表:

按 Ctrl+C 复制代码
按 Ctrl+C 复制代码

    查询操作:

复制代码
# 查询每一个部门名称以及对应的员工数

SQL:
SELECT app01_dep.title,count(app01_emps.id) FROM app01_emps LEFT JOIN app01_dep ON app01_emps.dep_id = app01_dep.id GROUP BY app01_emps.dep_id;

ORM:
models.Emps.objects.values("dep__title").annotate(c=Count("id"))

# 查询每一个部门名称以及对应的员工的平均工资

SQL:
SELECT app01_dep.title,avg(app01_emps.salary) FROM app01_emps LEFT JOIN app01_dep ON app01_emps.dep_id = app01_dep.id GROUP BY app01_emps.dep_id;

ORM:
models.Emps.objects.values("dep__title").annotate(a=Avg("salary"))
复制代码

    总结 :跨表分组查询本质就是将关联表join成一张表,再按单表的思路进行分组查询。

  3、查询练习

    1、练习:统计每一个出版社的最便宜的书的价格

复制代码
# 练习:统计每一个出版社的最便宜的书的价格
    SQL:
    select name, min(app01_book.price)
    from app01_publish LEFT
    JOIN
    app01_book
    on
    app01_book.publish_id = app01_publish.id
    GROUP
    BY
    app01_publish.name;

    ORM:
models.Publish.objects.values("name").annotate(min_price=Min("book__price"))
复制代码

    2、练习:统计每一本书的作者个数

复制代码
练习:统计每一本书的作者个数
SQL:
SELECT
    title,
    count(NAME)
FROM
    app01_book
LEFT JOIN app01_book_authors ON app01_book.id = app01_book_authors.book_id
LEFT JOIN app01_author ON app01_book_authors.author_id = app01_author.id
GROUP BY
    app01_book.id;

ORM:
models.Book.objects.annotate(num=Count('authors__name')).values("title", "num")
复制代码

    3、练习:统计每一本以“九”开头的书籍的作者个数

复制代码
# 练习:统计每一本以“九”开头的书籍的作者个数
SQL:
SELECT
    title,
    count(NAME)
FROM
    app01_book
LEFT JOIN app01_book_authors ON app01_book.id = app01_book_authors.book_id
LEFT JOIN app01_author ON app01_book_authors.author_id = app01_author.id
WHERE
    app01_book.title LIKE '九%'
GROUP BY
    app01_book.id;

ORM:
models.Book.objects.filter(title__startswith="九").annotate(num=Count('authors__name')).values("title", "num")
复制代码

    4、练习:统计不止一个作者的图书名称

复制代码
# 练习:统计不止一个作者的图书名称

SQL:
SELECT
    title,
    count(NAME) AS num
FROM
    app01_book
LEFT JOIN app01_book_authors ON app01_book.id = app01_book_authors.book_id
LEFT JOIN app01_author ON app01_author.id = app01_book_authors.author_id
GROUP BY
    app01_book.id
HAVING
    num > 1;

ORM:
models.Book.objects.annotate(num_author=Count("authors__name")).filter(num_author__gt=1).values("title")
复制代码

    5、练习:根据一本图书作者数量的多少对查询集QuerySet进行排序

复制代码
# 练习:根据一本图书作者数量的多少对查询集QuerySet进行排序

SQL:
SELECT
    title,
    count(author_id) AS num
FROM
    app01_book
LEFT JOIN app01_book_authors ON app01_book.id = app01_book_authors.book_id
LEFT JOIN app01_author ON app01_author.id = app01_book_authors.author_id
GROUP BY
    app01_book.id
ORDER BY
    num;

ORM:
models.Book.objects.annotate(num_author=Count("authors__name")).order_by("num_author").values("title", "num_author")
复制代码

    6、练习:查询各个作者出的书的总价格

复制代码
# 练习:查询各个作者出的书的总价格

SQL:
SELECT
    NAME,
    sum(price)
FROM
    app01_author
LEFT JOIN app01_book_authors ON app01_author.id = app01_book_authors.author_id
LEFT JOIN app01_book ON app01_book.id = app01_book_authors.book_id
GROUP BY
    app01_author.id;

ORM:
models.Author.objects.annotate(total=Sum("book__price")).values('name', 'total')
复制代码

  7、F查询与Q查询

    1、F查询

    在上面所有的例子中,我们构造的过滤器都只是将字段值与某个常量做比较。如果我们要对两个字段的值做比较,那该怎么做呢?

    Django 提供 F() 来做这样的比较。F() 的实例可以在查询中引用字段,来比较同一个 model 实例中两个不同字段的值。

1
2
3
4
# 查询工资大于年龄的人
from  django.db.models  import  F, Q
 
models.Emp.objects. filter (salary__gt = F( 'age' ))

    Django 支持 F() 对象之间以及 F() 对象和常数之间的加减乘除和取模的操作。

1
2
3
# 查询工资小于两倍年龄值的人
 
models.Emp.objects. filter (salary__lt = F( "age" *  2 )

    修改操作也可以使用F函数,比如将每一本书的价格提高100元

1
models.Book.objects.update(price = F( 'price' +  100 )
    2、Q查询

    filter() 等方法中的关键字参数查询都是一起进行“AND” 的。 如果你需要执行更复杂的查询(例如OR 语句),你可以使用Q 对象。

1
2
3
from  django.db.models  import  Q
 
Q(title__startswith = "九" )

    Q 对象可以使用 & 、 | 和 ~(与 或 非)操作符组合起来。当一个操作符在两个Q 对象上使用时,它产生一个新的Q 对象。

1
2
3
# 查询价格大于300或者名称以九开头的书籍
     
models.Book.objects. filter (Q(price__gt = 300 )|Q(title__startswith = "九" ))

    等同于下面的SQL where子句:

1
WHERE  (`app01_book`.`price` > 300  OR  `app01_book`.`title`  LIKE  BINARY  '九%' )

    综合使用,请看示例:

1
2
3
# 查询价格大于300或者不是2019年三月份的书籍
 
models.Book.objects.filter(Q(price__gt=300)|~Q(Q(pub_date__year=2019)&Q(pub_date__month=3)))
o
粉丝 0
博文 500
码字总数 0
作品 0
私信 提问
加载中
请先登录后再评论。

暂无文章

pyhon

cython 相关的帖子. http://blog.behnel.de/categories/cython.html

MtrS
2分钟前
0
0
多处理与线程Python - Multiprocessing vs Threading Python

问题: I am trying to understand the advantages of multiprocessing over threading . 我试图了解多处理优于线程的优势。 I know that multiprocessing gets around the Global Interpret......

法国红酒甜
7分钟前
5
0
格式编号始终显示2个小数位 - Format number to always show 2 decimal places

问题: I would like to format my numbers to always display 2 decimal places, rounding where applicable. 我想将数字格式化为始终显示2个小数位,并在适用的情况下四舍五入。 Examples...

富含淀粉
今天
22
0
Docker可视化工具Portainer

1 前言 从没想到Docker也有可视化的工具,因为它的命令还是非常清晰简单的。无聊搜了一下,原来已经有很多Docker可视化工具了。如DockerUI、Shipyard、Rancher、Portainer等。查看对比了一番...

南瓜慢说
今天
20
0
日志系统新贵 Loki,真香!!

最近,在对公司容器云的日志方案进行设计的时候,发现主流的ELK或者EFK比较重,再加上现阶段对于ES复杂的搜索功能很多都用不上最终选择了Grafana开源的Loki日志系统,下面介绍下Loki的背景。...

庞陆阳
今天
14
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部