回答:
私はあなたの質問について直接的な洞察はありませんが、あなたの興味かもしれないいくつかの研究論文に出くわしました。つまり、スパースPCA、主成分回帰、および関連トピックについて話していることを正しく理解していれば、もちろんです。その場合、ここに論文があります:
相互検証の結果は、LSIスペースの最適な次元数を決定するためにも使用されました。ディメンションが少なすぎると、データの予測力を活用できませんでした。一方、寸法が多すぎると、過剰適合になります。図4は、LSIの次元数が異なるモデルの平均誤差の分布を示しています。4次元のLSIスペースを持つモデルでは、平均エラー数が最も少なく、エラーの中央値も最も少ないため、最終的なモデルは4次元のLSIスペースを使用して構築されました。
ieeeメンバーでない場合は、コピーを投稿できます。
これは私が学部生で書いた論文からです。ロジスティック回帰モデルで使用する次元数(潜在セマンティックインデックスはPCAに類似)を決定する必要があるという問題がありました。私がしたことは、メトリック(つまり、フラグ付け確率.5を使用した場合のエラー率)を選択し、さまざまな次元でトレーニングされたさまざまなモデルのこのエラー率の分布を調べたことです。次に、エラー率が最も低いモデルを選択しました。ROC曲線の下の面積など、他のメトリックを使用できます。
ステップワイズ回帰などを使用して、次元数を選択することもできます。具体的にどのタイプの回帰を実行していますか?
スパースbtwとはどういう意味ですか?