べき乗則に対するトレンドラインの適合度を測定/議論する方法は?


21

トレンドラインに合わせようとしているデータがあります。データはべき乗則に従うと信じているので、直線を探して対数軸にデータをプロットしました。これにより、(ほぼ)直線になったため、Excelでべき乗則のトレンドラインを追加しました。統計の初心者なので、私の質問は、「線かなりよく似ているように見える」から「数値特性はこのグラフがべき法則によって適切に適合していること証明する」に進む最良の方法は何ですか? バツ

Excelではrの2乗値を取得できますが、統計に関する知識が限られているため、これが特定の状況で実際に適切かどうかさえわかりません。Excelで作業しているデータのプロットを示す以下の画像を含めました。私はRに少し経験があるので、分析がツールによって制限されている場合、Rを使用してRを改善する方法についての提案を受け入れています。

代替テキスト


あなたはここにいくつかのアイデアを見つけるかもしれないfreakonometrics.blog.free.fr/index.php?post/2010/09/29/...

回答:


24

Aaron Clausetのページを参照してください。

べき乗則(Matlab、R、Python、C ++)を適合させるためのコードへのリンクと、最初に読む必要のあるClausetとShaliziの論文があります。

ClausetとShaliziのブログ記事を最初に読んでください。

最後のリンクの概要は次のとおりです。

  • 多数の分布は、log-logプロット上に直線的な直線を提供します。

  • 線形回帰を乱用すると、赤ちゃんガウスが泣きます。
    log-logプロットに最小二乗法で線を当てはめるのは悪い考えです。

  • 最尤法を使用して、スケーリング指数を推定します。
  • 適合度を使用して、スケーリング領域の開始位置を推定します。
  • 適合度テストを使用して、適合度を確認します。
  • Vuongのテストを使用して代替案を確認し、失望に備えてください。

1
2番目にこれ。べき法則のように見えるものの例はたくさんありますが、もう少し厳密に調べてみると、そうではないことが判明しました。そして、いや、チャート上の高いR ^ 2では十分ではありません。
PeterR

「だからあなたは…」は素晴らしいリファレンスです。ポイント1〜6(7つのうち)は、ここで提起された質問に直接対応しています。
whuber

ただし、べき法則の分布は、2つの別々の変数間のべき法則の関係を適合させることとは異なります。私は確かではないが、質問は後者に関するものだと思っていた。
ワンストップ

χ2

2
@JM:そうではありませんが、カイ2乗はビニングとテールの変動に敏感です。KSでさえ、極値の統計値を再検討し、他のテストの議論がいくつかあると思います。@onestop:私は別の方法を想定しました、そして、再読上で、あなたは正しいかもしれません。私は本当にわからないんだけど...
ARS

3

(単変量のべき乗分布ではなく)2変量のべき乗関数に興味がある場合は、

ウォートン等。「アロメトリーのための二変量ラインフィッティング法。」バイオ 改訂81、259-201(2006)

優れたリファレンスです。この場合、回帰は正しいことですが、回帰の結果の意味に応じて、いくつかの修正(OLSとRMAなど)を行うことができます。


アーロン-そのリンクは死んでいる、あなたは新しいものを投稿できますか?
ケフラビッチ

これをありがとう。ほとんどの情報は、二変量の関係についての情報を埋め込む傾向が一変量の分布のためである...ここでリストアップライリーへのリンクですonlinelibrary.wiley.com/doi/abs/10.1017/S1464793106007007
songololo
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.