それ以上かもしれませんが、私にとっては、特定のデータセット(a、f(a))に適合した関数f(a)の適合度(GoF)を決定したいようです。したがって、以下は3番目のサブ質問にのみ回答します(1番目と2番目は3番目のものに直接関連するとは思わない)。
通常、GoFはパラメトリックに(分布の関数パラメーターがわかっている場合)、またはノンパラメトリックに(わからない場合)決定できます。関数のパラメーターは、指数関数またはガンマ/ワイブル(データが連続していると仮定)のように見えるので、把握できる場合があります。それでも、パラメータを知らなかったかのように、先に進みます。この場合、それは2段階のプロセスです。最初に、データセットの分布パラメーターを決定する必要があります。次に、定義された分布に対してGoFテストを実行します。繰り返しにならないように、この時点で、以前の答えを紹介しますいくつかの役立つ詳細を含む関連する質問に。明らかに、この回答は、その中で言及されているもの以外のディストリビューションにも簡単に適用できます。
そこで言及されているGoFテストに加えて、別のテスト- カイ二乗GoFテストを検討することができます。連続分布のみに適用されるKSおよびADテストとは異なり、カイ2乗GoFテストは離散および連続テストの両方に 適用できます。カイ二乗GoFテストは、組み込みパッケージ(関数)およびパッケージ(関数-離散データのみ)のいくつかのパッケージのいずれかを使用して、Rで実行できます。詳細については、このドキュメントをご覧ください。stats
chisq.test()
vcd
goodfit()