機能エンジニアリングは、多くの場合、機械学習の重要なコンポーネントです(2010年にKDDカップで優勝するために頻繁に使用されました)。しかし、ほとんどの機能エンジニアリング技術は
- 基礎となる機能の直感的な意味を破壊する
- 特定のドメインまたは特定の種類の機能に非常に固有です。
前者の典型的な例は、主成分分析です。主題の専門家が機能について持っている知識は、それらの機能を主成分に変換することによって破壊されるように思えます。
対照的に、日付を「月の日」と「曜日」の機能に変換する簡単な手法と比較してください。基本的な意味はまだ新しい機能に保持されていますが、明らかにこの特定の手法は日付にのみ適用され、任意の機能には適用されません。
基盤となる機能の意味を損なうことなく、任意のドメイン(または少なくともさまざまなドメイン)にも適用できる機能エンジニアリング技術の標準的な本体はありますか?
2
PCAを使用して、特徴の直感的な意味を見つけることができます(例:固有顔)。
—
tdc
念頭に置いているデータの(もっと)例を挙げてもらえますか?アプリケーションについてより具体的に説明できる場合(任意の例も含めて)、正確な回答を(より)簡単に提供できます。
—
ドブ
@Dovさて、全体のポイントは、(理想的には)構造化された表形式のデータセット(データポイントと機能を備えたもの)で機能するものが欲しいということです。これは、売上データ、財務データ、創薬データ、野球データ、などかもしれないので
—
マイケル・マッゴーワン