宿題では、投げ縄回帰を使用する予測子を作成/トレーニングするためのデータが与えられました。予測子を作成し、scikit learnのlasso pythonライブラリを使用して予測子をトレーニングします。
だから今私は与えられた入力が出力を予測できるというこの予測因子を持っています。
2番目の質問は、「ブートストラップメソッドを使用して予測の信頼区間を報告するように予測子を拡張する」ことでした。
私は周りを見回して、平均や他のことのためにこれをしている人々の例を見つけました。
しかし、私は予測のためにそれを行うにはどうすればよいのか全くわからない。scikit-bootstrapライブラリを使用しようとしています。
コースのスタッフは非常に無反応なので、どんな助けでもありがたいです。ありがとうございました。
Scikitの使い方はわかりませんが、Scikitだけに興味がある場合は、この質問をStackOverflowに移動してください。とはいえ、予測はそれ自体が平均的な応答であることを覚えておく必要があります。ブートストラップ手順で得られるのは、その平均応答の分布を推定する方法です。
—
usεr11852
@usεr11852現時点では、scikitの使用に限定されています。しかし、予測の信頼区間のブートストラップの背後にある理論を理解できれば、Pythonのヘルプは必要ないかもしれません。たとえば、何からサンプリングするのか、1つまたは複数の予測子をトレーニングするために使用するデータがわかりません。1つの予測は1つのサンプル、つまり特定の機能セットにのみ関連しているため、サンプリングの方法について本当に混乱しています。
—
itsSLO 2015年
予測はパラメータではないため、「予測の信頼区間」について話すのは間違っていることに注意してください。
—
マイケルM