何人のユーザーがいくつの質問を投稿したかに関するデータがあります。例えば、
[UserCount, QuestionCount]
[2, 100]
[9, 10]
[3, 80]
... ...
これは、2人のユーザーがそれぞれ100の質問を投稿し、9人のユーザーがそれぞれ10の質問を投稿したことを意味します。だから、どうすればUserCount, QuestionCount
分布がべき法則に従っているますか?
poweRlawパッケージを見つけました。ただし、評価を行うために1つのグループの数値のみを渡すことができます。(このパッケージで提供されている例は単語の頻度です。)では、このパッケージをどのように使用しますか?それとも何かおかしいのでしょうか?また、各ユーザーの質問数のデータもあり[100, 100, 10, 10, 10 ... ]
ます。このデータをパッケージに渡すと、何が得られますか?
1
この記事では、べき乗則分布とRコードのテスト方法を数学的に説明します。Clauset et al。「経験データにおけるべき法則分布。」
—
Sycoraxを回復モニカ言う
ありがとう。しかし、私は論文のすべての内容を追いつくことはできません。検証を行うためのいくつかのアプローチが必要です。「パッケージに渡されるデータの単一グループの意味」についての考えはありますか?この例では、データセットは単語の頻度です。再度、感謝します。
—
t14年
申し訳ありませんが、私はそのパッケージに慣れていません。
—
Sycoraxは回復モニカ言う