これがコメントまたは回答として適格であるかどうかはわかりません。答えのように感じるので、ここに入れています。
k分割交差検証では、データをk個のグループに分割します。「基本」までカバーしている場合は、k個のビンごとにメンバーを一様にランダムに選択しています。
データについて話すとき、各行をサンプル、各列をディメンションと考えます。私はさまざまな方法を使用して、変数の重要度、列の重要度を判断することに慣れています。
思考演習として、「教科書」の一様なランダムから出発し、どの行が重要であるかを判断した場合はどうなりますか?一度に1つの変数を通知する場合もありますが、詳細を通知する場合もあります。他の行ほど重要ではない行がありますか?ポイントの多くは有益なものかもしれませんが、おそらくいくつかは有益です。
変数の重要性を知っていれば、おそらく重要度によってそれらをビンに入れることができます。おそらく、最も重要なサンプルを含む単一のビンを作成できます。これにより、「k」のサイズを定義できます。このようにして、「最も情報量の多い」k番目のバケットを決定し、他のバケットと情報量の少ないバケットと比較します。
これにより、モデルパラメーターの最大変動を把握できます。これは1つの形式にすぎません。
k番目のバケットを分割する2番目の方法は、影響の大きさと方向です。そのため、1つまたは複数のパラメーターを1つの方向に揺らすサンプルを1つのバケットに入れ、同じパラメーターを1つまたは複数の反対方向に揺れるサンプルを別のバケットに入れることができます。
この形式のパラメーターの変動は、情報密度ではなく情報の種類に基づいて、変数をより広範囲にスイープする可能性があります。
幸運を祈ります。