予測モデルのパフォーマンスは、メソッドの選択よりも、選択したメソッドを使用するデータアナリストの専門知識に依存しているという調査結果があるという噂があります。
言い換えれば、データ分析者が選択された方法に精通していることが、より理論的な観点から問題に対してどのように「適切」に見えるかよりも重要であるという主張です。
これはケモメトリックスのコンテキストで言及されており、通常、多くの変量(100から1000 s)、多重共線性、そしてもちろんサンプルが少なすぎるという問題を伴います。予測は分類または回帰である可能性があります。
私の個人的な経験は、これはもっともらしいことを示唆しているが、研究が言及された(私はそれを電子メールでそれを言及した人に素早くしかし失敗した検索の後に尋ねたが、何の答えも受け取らなかった)。しかし、より精巧な検索でも、論文を追跡することはできませんでした。
誰もそのような発見を知っていますか?そうでない場合、ここのBig Guysの個人的な経験は何を言いますか?
1
私はこの辺りのリトルガイですが、ニューラルネットワークで私が見たものはこの仮説を支持しています。「機械が何かを学ぶ」「すぐに使える」ツールではなく、分類や予測の成功は多くの最も重要な前処理データの面ではなく、などのネットワークアーキテクチャの観点から-人はそれがデータから学ぶためにどのようにネットワークに指示がどのようにスマートに
—
ステファンKolassa
@StasK:リマインダーをありがとう(覚えていないのは恥だ)。また、実際のPCR、PLSおよびリッジ回帰は非常に類似しており、LDAおよびロジスティック回帰も同様であると報告しています。ただし、後者の方法も理論的な観点から非常に似ています。
—
cbeleitesはモニカをサポートします