ネストされた相互検証後に最適なハイパーパラメーターを取得するにはどうすればよいですか?


8

一般的に、大きなデータセットがある場合は、(1)トレーニング、(2)検証、(3)テストに分割できます。検証を使用して相互検証(SVMのCなど)で最適なハイパーパラメーターを特定し、トレーニングセットで最適なハイパーパラメーターを使用してモデルをトレーニングし、トレーニングされたモデルをテストに適用してパフォーマンスを取得します。

データセットが小さい場合、トレーニングとテストセットを作成できません(サンプルが不十分)。したがって、モデルのパフォーマンスを評価するために、交差検証(k-fold、leave-one-outなど)を行います。

ネストされた交差検証(繰り返しまたは層別)が小さなデータセットの設定で使用されていることを確認しました。つまり、パラメーター選択を最適化しながら一般化モデルのパフォーマンスを生成します。私の質問は、ネストされた交差検証で最高のハイパーパラメーターを取得するにどうすればよいですか(繰り返される/繰り返されない)? 可能であれば、scikit-learnでこれを行うことに興味があります。私はそれを行う方法について少し混乱しています。

私はいくつかのリソースを読みましたが、この質問に対する明確な答えはありませんでした。

モデル選択のためのネストされた相互検証

入れ子の交差検証と機能選択:機能選択を実行するタイミング?


これはscikit-learnについて言及していますが、実行可能な機械学習の質問があります。これは私にはトピックから外れているようには見えません。
ガン-モニカの回復

@gungはい、ありがとう。scikit-learnは質問の追加部分です(私にとってプラスです)
RockTheStar

回答:


6

概観

以下のよう@RockTheStarが正しく論評で締結し、ネストされたクロスバリデーションは、モデルのパフォーマンス推定値にアクセスするためにのみ使用されます。それとは切り離されており、最適なハイパーパラメーターを見つけるために、データ全体を相互検証して簡単な調整を行う必要があります。


詳細に:

調整と検証(内部および外部の再サンプリングループ)

ハイパーパラメーター調整を実行する内部ループでは、モデルはトレーニングデータでトレーニングされ、検証データで検証されます。最適なパラメーター見つけ、内部ループデータ全体でモデルをトレーニングします。検証データのパフォーマンスを最適化するようにトレーニングされていますが、評価は偏っています。

したがって、このモデルはテストデータを使用してテストされるので、できればバイアスがなく、パフォーマンスの見積もりが得られます。

最終モデル

モデルの予想されるパフォーマンスがわかったので、すべてのデータでモデルをトレーニングする必要があります。ただし、モデルは単なるアルゴリズムではなく、モデル構築プロセス全体です。

したがって、すべてのデータと内部ループの同じ仕様でハイパーパラメーター調整実行します。最適なハイパーパラメータを使用して、データ全体で最終モデルをトレーニングします。この最終モデルの期待されるパフォーマンスは、ネストされた交差検証で以前に評価したものです。

繰り返しになりますが、最終モデルのハイパーパラメーターは、チューニングと検証のステップで見つけたパフォーマンスを期待できるものです。


ご回答有難うございます。私はそれを理解しようとしますが、理解できるかどうかわかりません。では、正確なハイパーパラメータセットはどこで取得できますか?
RockTheStar 2017年

@RockTheStar答えを更新しました。基本的には再調整します(つまり、再度調整を実行してから、調整されたモデルをすべてのデータに合わせます)。これが、最適なハイパーパラメーターの最善策です。
Firebug 2017年

1
つまり、基本的に、ネストされたCVはモデルのパフォーマンスを検証することです。そして、最適なパラメーターを取得するために、完全なデータに対して単純なCVを再度実行する必要があります。私は正しいですか?
RockTheStar 2017年

@RockTheStarはい、あなたはそれをすべて正しく要約しました。
Firebug 2017年

1
@nafizhお問い合わせに回答するのに時間がかかってごめんなさい、通知を見ていませんでしたか(?)。すべてのパフォーマンス推定は、モデル構築戦略をテストするために構築したネストされたCVに基づいています。最終的なハイパーパラメータ調整を実行するには、データ全体に対して内部ループを実行し、ネストされたCVで使用したのと同じ基準に従って最適なものを選択します。次に、それをデータ全体に当てはめます。これが最終的なモデルですが、それに起因する予測パフォーマンスは、Nested CVで取得したものです
Firebug 2017年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.