統計とビッグデータ machine-learning

4

ROC曲線の利点は何ですか？たとえば、バイナリ分類の問題であるいくつかの画像を分類しています。約500個のフィーチャを抽出し、フィーチャ選択アルゴリズムを適用してフィーチャセットを選択し、SVMを分類に適用しました。この場合、どのようにしてROC曲線を取得できますか？特徴選択アルゴリズムのしきい値を変更し、出力の感度と特異度を取得してROC曲線を描画する必要がありますか？私の場合、ROC曲線を作成する目的は何ですか？

15 machine-learning roc

7

株式市場の予測に使用できる機械学習アルゴリズムは何ですか？

または、外国為替市場を予測するため。これはかなり複雑になる可能性があることを知っているので、序論として、ある程度の精度を持つ単純な予測アルゴリズムを探しています。（4か月続く修士課程のプロジェクト用です）多層ニューラルネットワークが役立つ可能性があることを読みました。それについて何か考えはありますか？さらに、ソーシャルメディアのセマンティック分析は、株式市場に影響を与える市場行動の洞察を提供する場合があります。ただし、セマンティック分析は、現時点ではプロジェクトの範囲外です。

15 machine-learning finance

1

単一のReLUがReLUを学習できないのはなぜですか？

私のニューラルネットワークのフォローアップとして、ユークリッド距離を学習することすらできないため、さらに単純化して、単一のReLU（ランダムな重み）を単一のReLUにトレーニングしようとしました。これは最も単純なネットワークですが、収束に失敗する時間の半分です。最初の推測がターゲットと同じ方向にある場合、すぐに学習し、正しい重み1に収束します。最初の推測が「後方」である場合、ゼロの重みでスタックし、低損失の領域に到達することはありません。理由がわかりません。勾配降下は、グローバルミニマムへの損失曲線に簡単に従うべきではありませんか？サンプルコード： from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, ReLU from tensorflow import keras import numpy as np import matplotlib.pyplot as plt batch = 1000 def tests(): while True: test = np.random.randn(batch) # Generate ReLU test case X = test Y = test.copy() Y[Y < 0] …

15 machine-learning neural-networks optimization keras

3

機械学習で欠落データの問題を回避する方法

機械学習アルゴリズムを使用して予測したい事実上のデータベースは、いくつかの特性の欠損値を見つけます。この問題に対処するには、欠損値を持つ行を特性の平均値で埋めるまで除外するいくつかのアプローチがあります。私はやや堅牢なアプローチに使用したいと思います。これは基本的に回帰（または別の方法）を実行し、従属変数（Y）は欠損値を持つ各列ですが、テーブルの行のみであるすべてのデータを含み、このメソッドで欠損値を予測し、テーブルごとにテーブルを完成させ、欠損値のある次の「列」に移動し、すべてが満たされるまでメソッドを繰り返します。しかし、それは私にいくつかの疑問を与えます。なぜ列が始まるのですか？欠損値が最小のものは、最大値を持つものまで完了しようとする価値のない欠損値のしきい値はありますか？（たとえば、この特性が満たされている値の10％しか持っていない場合、それを除外することはもっと面白くないでしょう）従来のパッケージや、欠落に強い他の方法での実装の種類はありますか？

15 machine-learning scikit-learn data-imputation

2

機械学習のベイズエラーとは何ですか？

http://www.deeplearningbook.org/contents/ml.htmlページ116では、以下のようにベイズエラーについて説明しています。理想的なモデルは、データを生成する真の確率分布を単に知っているオラクルです。そのようなモデルであっても、分布にノイズが残っている可能性があるため、多くの問題でエラーが発生します。教師あり学習の場合、xからyへのマッピングは本質的に確率論的である場合があります。または、yはxに含まれる変数以外の他の変数を含む決定論的関数である場合があります。真の分布p（x、y）から予測を行うオラクルが被るエラーは、ベイズエラーと呼ばれます。ご質問ベイズエラーを直感的に説明してください？既約エラーとどう違うのですか？合計エラー=バイアス+分散+ベイズエラーと言えますか？「yは本質的に確率論的」の意味は何ですか？

15 machine-learning deep-learning terminology

2

精密リコール曲線の「ベースライン」とは

正確なリコール曲線を理解しようとしていますが、精度とリコールが何であるかは理解していますが、理解できないのは「ベースライン」値です。私はこのリンクを読んでいました https://classeval.wordpress.com/introduction/introduction-to-the-precision-recall-plot/ 「完全な分類子の精度-リコール曲線」に示されているように、ベースライン部分が理解できません。そして、どのように計算するのですか？選択したランダムなベースラインですか？たとえば、retweet,status_countetcなどの属性を持つtwitterデータがあり、Favoritedお気に入りの場合はクラスラベルは1、お気に入りでない場合は0で、単純なベイズを適用し、今度は正確なリコールカーブを描画したいのですが、この場合のベースラインの設定方法を教えてください？

15 r machine-learning classification precision-recall

1

lmerモデルに使用する多重比較方法：lsmeansまたはglht？

1つの固定効果（条件）と2つのランダム効果（被験者内のデザインとペアによる参加者）を含む混合効果モデルを使用して、データセットを分析しています。モデルはlme4パッケージで生成されました：exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。次に、固定効果（条件）のないモデルに対してこのモデルの尤度比検定を実行しましたが、有意差があります。データセットには3つの条件があるため、多重比較を行いたいのですが、どの方法を使用すればよいかわかりません。CrossValidatedや他のフォーラムで同様の質問をいくつか見つけましたが、それでもかなり混乱しています。私が見たものから、人々は使用することを提案しました 1.lsmeansパッケージ- lsmeans(exp.model,pairwise~condition)私に次のような出力が得られます。 condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

15 r repeated-measures multiple-comparisons post-hoc lsmeans bayesian posterior marginal integral anova time-series regularization machine-learning pca computational-statistics references inference regression cross-validation python random-forest chi-squared spearman-rho r machine-learning confidence-interval bagging clustering feature-selection model-selection bic hypothesis-testing kurtosis r regression residuals terminology

1

ランダムフォレストに相互作用用語を含める

応答Yと予測子X1、....、Xnがあるとします。X1、...、Xnの線形モデルを介してYを近似しようとした場合、YとX1、...、Xnの間の真の関係が線形ではなかったため、 Xを何らかの方法で変換してからモデルを近似することによりモデルを修正します。さらに、X1、...、XNが他の機能とは無関係にyに影響を与えなかった場合、相互作用項x1 * x3またはx1 * x4 * x7を含めることでモデルを改善できる可能性がありますまたは同種のもの。したがって、線形の場合、相互作用項は、応答と特徴間の非線形性または独立性違反を修正することにより価値をもたらす可能性があります。ただし、ランダムフォレストはこれらの仮定を実際に行いません。ランダムフォレストを近似するときに相互作用用語を含めることは重要ですか？または、個々の用語を含めて適切なパラメーターを選択するだけで、ランダムフォレストがこれらの関係をキャプチャできるようになりますか？

15 machine-learning random-forest

2

スケーリングが線形SVM分類にとって重要なのはなぜですか？

線形SVM分類を実行する場合、たとえば平均を減算して標準偏差で除算するなどして、トレーニングデータを正規化し、その後、トレーニングデータの平均と標準偏差でテストデータをスケーリングすることが役立ちます。このプロセスが分類パフォーマンスを劇的に変える理由は何ですか？

15 machine-learning svm standardization

1

コネクショニスト時間分類（CTC）とは何ですか？

私は、光学式文字認識（OCR）プロジェクトを実行したいと考えています。いくつかの調査を行った後、興味深いと思われるアーキテクチャに出会いました：CNN + RNN + CTC。私は畳み込みニューラルネットワーク（CNN）とリカレントニューラルネットワーク（RNN）に精通していますが、コネクショニスト時間分類（CTC）とは何ですか？素人の言葉で説明をお願いします。

15 machine-learning deep-learning conv-neural-network rnn

5

私はパターン認識と機械学習から学んでいます、クリス・ビショップには良いリソースがありますか？

Chris Bishopによるパターン認識と機械学習に続く、誰かが出会ったビデオや他の本/メモはありますか？私は機械学習を学ぶためにこの本を購入しましたが、それを乗り越えるのに苦労しています。

15 machine-learning references pattern-recognition

1

深層学習について、VCディメンションは何を教えてくれますか？

基本的な機械学習では、次の「経験則」を学びます。 a）データのサイズは、仮説セットのVCディメンションのサイズの少なくとも10倍にする必要があります。 b）N個の接続を持つニューラルネットワークのVC次元は約Nです。ディープラーニングニューラルネットワークが数百万のユニットを言うとき、これは、たとえば数十億のデータポイントが必要であることを意味しますか？これに光を当ててください。

15 machine-learning neural-networks deep-learning vc-dimension

1

機械学習モデルの「容量」とは何ですか？

Carl DoerschによるVariational Autoencodersに関するこのチュートリアルを勉強しています。2ページ目には、次のように記載されています。このようなフレームワークの中で最も人気のあるものの1つは、このチュートリアルの主題であるVariational Autoencoder [1、3]です。このモデルの前提条件は弱く、逆伝播によるトレーニングは高速です。VAEは概算を行いますが、この概算によって導入されるエラーは、大容量モデルを考えると間違いなく小さいものです。これらの特徴は人気の急速な上昇に貢献しています。私は過去に、大容量モデルに関するこの種の主張を読みましたが、それについて明確な定義を見つけられないようです。私はこの関連するスタックオーバーフローの質問も見つけましたが、私にとっては答えは非常に満足できません。モデルの容量の定義はありますか？測定できますか？

15 machine-learning deep-learning autoencoders variational-bayes

5

何回もシリーズを同時に処理する方法は？

25期間のいくつかの製品（1200製品）の需要を含むデータセットがあり、次の期間の各製品の需要を予測する必要があります。最初は、ARIMAを使用して各製品のモデルをトレーニングしたかったのですが、製品の数と（p、d、q）パラメーターの調整のため、非常に時間がかかり、実用的ではありません。以前の要求が独立変数である回帰（自己回帰）を使用することをお勧めしますか？ 1200のすべての製品の需要予測のために単一のモデルをトレーニングする方法があるかどうかを知ることができますか？Pythonを使用しているので、Pythonのライブラリを提案していただければ幸いです。

14 machine-learning time-series arima

1

ニューラルネットワーク以外のものに対して、適切な勾配に非一定の学習率を使用しないのはなぜですか？

ディープラーニングの文献には、勾配降下で非一定の学習率を使用する巧妙なトリックがたくさんあります。指数関数的減衰、RMSprop、Adagradなどのようなものは実装が簡単で、すべてのディープラーニングパッケージで利用できますが、ニューラルネットワークの外部には存在しないようです。これには理由がありますか？人々が単に気にしないということであれば、ニューラルネットワークの外で気にしなければならない理由はありますか？

14 machine-learning deep-learning optimization gradient-descent

タグ付けされた質問 「machine-learning」

タグ付けされた質問「machine-learning」