データからワイブルパラメータを決定するにはどうすればよいですか?


10

風速データのヒストグラムがあり、ワイブル分布を使用して表されることがよくあります。ヒストグラムに最適なワイブル形状とスケール係数を計算したいと思います。

目標はプログラムでワイブル形式を決定することなので、(グラフィックソリューションではなく)数値ソリューションが必要です。

編集: サンプルは10分ごとに収集され、風速は10分間の平均です。サンプルには、現在無視されている各インターバル中に記録された最大および最小の風速も含まれていますが、後で取り入れたいと思います。ビンの幅は0.5 m / s

1か月のデータのヒストグラム


1
あなたがヒストグラムを持っていると言ったとき-あなたは観測に関する情報も持っているということですか、それともあなたはビンの幅と高さしか知りませんか?
suncoolsu 2011年

@suncoolsuすべてのデータポイントがあります。5,000から50,000レコードの範囲のデータセット。
klonq 2011年

データのランダムなサンプルを取り、パラメーターのMLEを実行できませんか?
スケネクタディ2011年

2
推定の目的は何ですか?過去の状況を遡及的に特徴付けるには?ある場所での将来の発電を予測するには?タービンのグリッド内で発電を予測するには?気象モデルを較正するには?この質問の場合、適切なソリューションの決定は、それがどのように使用されるかに大きく依存します。
whuber

現在の@whuberのアイデアは、風のデータセットを期間ごと、またはサイトごとに比較できる形式で要約することです。後で目標は傾向を比較し、あなたが言うように将来の生産に関する判断を下すことです。私は統計の初心者ですが、大量のデータ(共有できません)があり、次のように抽出したいと思います。それから可能な限り多くの情報。あなたがこの主題に関するどんな読書にも私を指すことができるならば、それは大いに感謝されるでしょう。
klonq 2011年

回答:


11

ワイブルパラメータの最尤推定は、あなたの場合には良い考えです。ワイブル分布の形式は次のようになります。

(γ/θ)(x)γ1exp(xγ/θ)

θ,γ>0X1,,Xn

L(θ,γ)=i=1nlogf(Xi|θ,γ)

「プログラミングベース」のソリューションの1つは、制約付き最適化を使用してこの関数を最適化することです。最適なソリューションの解決:

logLγ=nγ+1nlogxi1θ1nxiγlogxi=0
logLθ=nθ+1θ21nxiγ=0

θ

[1nxiγlogxi1nxiγ1γ]=1n1nlogxi

γ^

θγ^

θ^=1nxiγ^n

ここで注意しなければならないことの1つは、ここに時系列データがあるように聞こえることです。データが短い時間枠でサンプリングされる場合、独立性が危険であると想定します。つまり、(+ 1)です。
枢機卿

@cardinal説明してください。データの範囲は1か月から1年までですが、定期的にサンプリングされます(10分)。これは何を意味するのでしょうか?
klonq 2011年

@cardinal指摘してくれてありがとう。独立性の仮定が適切かどうかもわかりませんでした。
suncoolsu 2011年

1
@klonq、サンプルはどのように取られますか?録音間の10分間の平均速度ですか?録音の1分以上前?記録時の瞬間速度は?ほとんどの場合、有効なサンプルサイズを大幅に削減できるシリアル相関を探します。独立したサンプルの仮定に基づくML推定値を使用すると、そのコンテキストで適切な推定値が得られる場合と得られない場合があり、推定値に基づく推論については特別な注意が必要です。しかし、Suncoolsuのアプローチは間違いなく最初の攻撃線となります。
枢機卿

@klonq-可能であれば、サンプルがどのように収集されたかを説明できますか?データはどのように見えますか?
suncoolsu

12

fitdistrplusを使用します。

ヒストグラムで分布を特定するのに助けが必要

ワイブル分布がどのように適合するかの例を以下に示します。

library(fitdistrplus)

#Generate fake data
shape <- 1.9
x <- rweibull(n=1000, shape=shape, scale=1)

#Fit x data with fitdist
fit.w <- fitdist(x, "weibull")
summary(fit.w)
plot(fit.w)


Fitting of the distribution ' weibull ' by maximum likelihood 
Parameters : 
       estimate Std. Error
shape 1.8720133 0.04596699
scale 0.9976703 0.01776794
Loglikelihood:  -636.1181   AIC:  1276.236   BIC:  1286.052 
Correlation matrix:
          shape     scale
shape 1.0000000 0.3166085
scale 0.3166085 1.0000000

ここに画像の説明を入力してください


おかげで、私はJavaで解決策を見つけようとしています。
klonq 2011年

形状とスケール係数を取得するためのRコーディングのポインタはありますか?ありがとう。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.