Djangoの注釈メソッドと集約メソッドの違いは何ですか?


113

DjangoにQuerySetは2つのメソッドがannotateありaggregateます。ドキュメントは言う:

aggregate()とは異なり、annotate()は終了句ではありません。annotate()句の出力はQuerySetです。

それらの間に他の違いはありますか?そうでない場合、なぜaggregate存在するのですか?

回答:


186

ドキュメントからの引用よりも、クエリ例に焦点を当てます。クエリセット全体のAggregate値を計算します。クエリセットの各アイテムの集計値を計算します。Annotate

集計

>>> Book.objects.aggregate(average_price=Avg('price'))
{'average_price': 34.35}

クエリセット内のすべての本の平均価格を含む辞書を返します。

注釈

>>> q = Book.objects.annotate(num_authors=Count('authors'))
>>> q[0].num_authors
2
>>> q[1].num_authors
1

q は書籍のクエリセットですが、各書籍には作者の数で注釈が付けられています。


.annotate()はqsだけでdbをヒットしないことを修正q[0].num_authorsしますが、呼び出しはヒットしますか?aggregateターミナル句なので、常にdbをヒットする必要があると思いますか?
alias51

@ alias51は元の質問に本当に関連しているので、8年前の質問に対するコメントは、尋ねるのに最適な場所ではないと思います。あなたは、クエリの実行時にチェックしたい場合は、することができます確認してくださいconnection.queries。ヒント:book = q[0]クエリの原因はか `book.num_authors` かどうかを確認してください。
Alasdair

21

これが主な違いですが、集計はアノテーションよりも大規模に機能します。アノテーションは本質的にクエリセットの個々のアイテムに関連しています。Count多対多フィールドのようなものに対して注釈を実行すると、クエリセットのメンバーごとに個別のカウントが(追加された属性として)取得されます。ただし、集計で同じことを行うと、クエリセットのすべてのメンバーのすべての関係をカウントしようとし、重複する場合でも、それを1つの値として返します。


.annotate()はqsだけでdbにヒットしないことを訂正してq[0].num_authorsいますか?aggregateターミナル句なので、常にdbをヒットする必要があると思いますか?
alias51

21

Aggregate Aggregateは、QuerySet全体の結果(概要)値を生成します。Aggregateは行セットを操作して、行セットから単一の値を取得します(たとえば、行セット内のすべての価格の合計)。集計はQuerySet全体に適用され、QuerySet全体の結果(概要)値を生成します。

モデル内:

class Books(models.Model):
    name = models.CharField(max_length=100)
    pages = models.IntegerField()
    price = models.DecimalField(max_digits=5, decimal_places=3)

シェル:

>>> Books.objects.all().aggregate(Avg('price'))
# Above code will give the Average of the price Column 
>>> {'price__avg': 34.35}

Annotate Annotateは、QuerySet内のオブジェクトごとに独立した概要を生成します(QuerySet内の各オブジェクトを反復処理し、操作を適用すると言えます)。

モデル内:

class Video(models.Model):
    name = models.CharField(max_length=52, verbose_name='Name')
    video = models.FileField(upload_to=document_path, verbose_name='Upload 
               video')
    created_by = models.ForeignKey(User, verbose_name='Created by', 
                       related_name="create_%(class)s")
    user_likes = models.ManyToManyField(UserProfile, null=True, 
                  blank=True, help_text='User can like once', 
                         verbose_name='Like by')

ビューで:

videos = Video.objects.values('id', 'name','video').annotate(Count('user_likes',distinct=True)

ビューでは、各動画の高評価をカウントします


distinct=True最後の例でなぜ必要なのですか?
Yuriy Leonov

@ YuriyLeonovdistinct =操作が個別の値に対して実行するために使用されるtrue。現在の質問とは関係ありません。申し訳ありませんが、実際にはコードで使用しています。
Vinay Kumar
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.