タグ付けされた質問 「machine-learning」

3

3
Matlab Neural Network ToolboxのPython OSSの代替。相互比較はありますか?
私は科学研究のために商用ソフトウェアから独立したいと思います。将来的にMatlabにアクセスできるかどうかわからないし、言語が気に入らないので、Matlabやそのツールボックスなどの商用パッケージへの依存が不十分であることがわかりました。したがって、私は代替手段を探しています。 幸いなことに、私はPythonに非常に堪能であり(そしてこの言語が大好きです)、NumPy、SciPy、Matplotlib、Basemap、およびNetCDFの読み取りおよび書き込みルーチンで、ほとんどのニーズを満たします。ほとんど—フィードフォワード多層パーセプトロンを使用して衛星検索をトレーニングする必要がある場合、Matlabに戻ります。たとえば、人工ニューラルネットワークを使用します。 オープンソースソフトウェアでは珍しくありませんが、ニューラルネットワークを実行するパッケージは複数あります。かなり複数: しばらく前に、「ニューラルネットワーキング用のスイスアーミーナイフ」であるPyBrainを試しましたが、短期間(開発時と実行時の両方)で満足のいく結果を得ることができませんでした。おそらく、私は十分に一生懸命に努力しなかったか、おそらくそれは私の正確な必要性に本当に向いていません。 たった今、私は有望に見えるニューロラボと呼ばれるパッケージがあることを発見しました。これは、MATLABのNeural Network Toolbox(NNT)のようなAPIを備えたPython用のシンプルで強力なニューラルネットワークライブラリです。 ありFFnet、迅速かつpythonのための使いやすいフィードフォワードニューラルネットワークトレーニングソリューションは、 simplennがあります 計算インテリジェンスと機械学習のためのライブラリであるPeachがあります このStackOverflow投稿で事実上の標準として記述されているFANN(高速人工ニューラルネットワークライブラリ)へのPythonバインディングがあります。 おそらく他にもあります。 使いやすさ、速度などの基準に基づいて、さまざまなオプションを相互比較する努力をした人はいますか?私自身の使用例は、衛星検索です。たとえば、多くの変数の強く非線形な関数を適合させます。私はニューラルネットのユーザーです。私は彼らの内部の仕組みを研究することに興味はありません。 Stats.SEに関するこの質問は関連していますが、焦点が異なります。

5
非常に大きなスパース行列にPCAを適用します
Rを使用してテキスト分類タスクを実行しており、サイズが22490 x 120,000のドキュメント用語マトリックスを取得しています(400万の非ゼロエントリのみ、1%未満のエントリ)。ここで、PCA(主成分分析)を利用して次元を減らしたいと思います。残念ながら、Rはこの巨大な行列を処理できないため、この行列を「行列市場形式」のファイルに保存し、PCAを行うために他の手法を使用したいと考えています。 だから誰も私に便利なライブラリ(プログラミング言語が何であれ)のヒントを教えてくれますか?この大規模なマトリックスでPCAを簡単に実行したり、自分で長文のPCAを実行したり、つまり最初に共分散行列を計算したり、次に、共分散行列の固有値と固有ベクトルを計算します。 私が望むのは、すべてのPC(120,000)を計算し、90%の差異を占める上位N個のPCのみを選択することです。明らかに、この場合、いくつかの非常に小さな分散値を0(共分散行列内)に設定するために、事前にしきい値を指定する必要があります。 1台のマシンでは処理できません。また、負荷(固有ベクトル)は非常に大きくなるため、スパース形式で保存する必要があります。 助けてくれてありがとう! 注:24GB RAMと8 CPUコアのマシンを使用しています。

2
PythonでのSVMのラグランジュ係数の計算
Pythonで完全なSVM実装を記述しようとしていますが、ラグランジュ係数の計算にいくつか問題があります。 最初に、アルゴリズムから理解したことを言い換えて、正しいパスにいることを確認します。 もしバツ1、x2、。。。、xんバツ1、バツ2、。。。、バツんx_1, x_2, ..., x_n、データセットでありy私∈ { - 1 、1 }y私∈{−1、1}y_i \in \{-1, 1\}のクラスラベルであるバツ私バツ私x_i次いで、∀ 私は、Y私(wTバツ私+ B )≥ 1∀私、y私(wTバツ私+b)≥1\forall i, y_i(w^Tx_i + b) \geq 1 したがって、最適化問題を解決して ∥ ワット∥2‖w‖2\|w\|^2 対象y私(wTバツ私+ B )≥ 1y私(wTバツ私+b)≥1y_i(w^Tx_i + b) \geq 1 ラグランジュ係数に関して、これは、およびおよび最小化することをます:B α = (α 1、α 2、。。。α N)≠ 0 ≥ 0 L (α 、W 、B )= …

2
RBFカーネルマトリックスは悪条件になる傾向がありますか?
RBFカーネル関数を使用して、1つのカーネルベースの機械学習アルゴリズム(KLPP)を実装します。結果のカーネル行列はKKK K(i,j)=exp(−(xi−xj)2σ2m)K(私、j)=exp⁡(−(バツ私−バツj)2σメートル2)K(i,j)= \exp\left({\frac{-(x_{i}-x_{j})^2}{ \sigma_{m}^2}}\right) 極めてL2ノルムの悪いconditioned.The条件数が来ることが示されている1017−10641017−106410^{17}-10^{64} 条件を整える方法はありますか?パラメータを調整する必要があると思いますが、正確にはわかりません。σσ \sigma ありがとう!

2
計算流体力学における機械学習の使用
背景: コースでは、2d Navier-Stokesの実用的な数値解を1つだけ作成しました。これは、蓋​​駆動のキャビティフローのソリューションでした。ただし、このコースでは、空間的離散化と時間的離散化のスキーマについて説明しました。また、NSに適用されるシンボル操作のコースワークも取り入れました。 PDEから有限差分への分析/記号方程式の変換を処理する数値アプローチには、次のようなものがあります。 オイラーFTFS、FTCS、BTCS 緩い ミッドポイントリープフロッグ Lax-Wendroff マコーマック オフセットグリッド(空間拡散により情報が広がる) TVD 当時、私には、これらは「挿入名がスキームを見つけて、たまたま機能する」ように見えました。これらの多くは「豊富なシリコン」の時代以前のものでした。これらはすべて近似値です。限界で彼ら。理論的には、PDEにつながります。 直接数値シミュレーション(DNS)は楽しいものであり、レイノルズ平均ナビエストークス(RANS)も楽しいものですが、これらは計算上扱いやすく、現象を完全に表現する連続体の2つの「エンドポイント」です。これらの内部に住むアプローチには、複数のファミリーがあります。 講義で、CFDの教授に、ほとんどのCFDソルバーはきれいな絵を描くと言われましたが、ほとんどの場合、これらの絵は現実を表していないため、現実を表しています。 (私が理解しているように、網羅的ではない)開発のシーケンスは次のとおりです。 支配方程式から始める-> PDE 空間的および時間的離散化を決定->グリッドおよびFDルール 初期条件と境界条件を含むドメインに適用する 解く(行列の反転に関する多くのバリエーション) 全体的なリアリティチェックを実行し、既知のソリューションに適合させるなど。 分析結果から派生したいくつかのより単純な物理モデルを構築する それらをテストし、分析し、評価する 繰り返す(ステップ6、3、または2にジャンプして戻る) 考え: 私は最近、CARTモデル、斜めツリー、ランダムフォレスト、および勾配ブーストツリーで作業しています。それらはより数学的に導き出されたルールに従い、数学は木の形を動かします。彼らは、離散化された形をうまく作るように働きます。 これらの人間が作成した数値アプローチはいくらか機能しますが、その結果をモデル化することを意図している物理現象に関連付けるために必要な広範な「ブードゥー教」があります。多くの場合、シミュレーションは実際のテストと検証に実質的に取って代わりません。間違ったパラメーターを使用したり、実際の世界で経験したジオメトリやアプリケーションパラメーターの変動を考慮に入れたりするのは簡単です。 質問: 問題の性質に 適切な離散化、空間的および時間的差分スキーム、初期条件、またはソリューションを定義させるためのアプローチはありましたか? 機械学習の手法と組み合わせた高精細ソリューションを使用して、ステップサイズがはるかに大きいが収束、精度などを維持する差分スキームを作成できますか? これらのスキームはすべて、アクセスしやすい「人為的に導き出すのが容易」です-それらにはいくつかの要素があります。より良い仕事をする何千もの要素を持つ差分スキームはありますか?それはどのように導出されますか? 注:別の質問で、(分析的にではなく)経験的に初期化され、経験的に導出されたものをフォローアップします。 更新: 深層学習を使用して、格子ボルツマンフローを加速します。特定のケースで最大9倍のスピードアップ Hennigh、O.(プレスリリース中)Lat-Net:ディープニューラルネットワークを使用した圧縮格子ボルツマンフローシミュレーション。取得元:https : //arxiv.org/pdf/1705.09036.pdf コード付きのレポ(私は思う):https : //github.com/loliverhennigh/Phy-Net 同じハードウェアで、GPUよりも約2桁高速、CPUよりも4桁高速、つまり〜O(10,000x)高速です。 Guo、X.、Li、W.&Ioiro、F. Convolutional Neural Networks for Steady Flow Approximation。取得元:https …

2
密な線形代数の実行時間を予測する
特定のライブラリを使用する特定のアーキテクチャでの密な線形代数演算の実行時間を予測したいと思います。関数を近似するモデルを学びたい Fo p::Fop::F_{op} \;::\; 入力サイズランタイム→→ \rightarrow 行列乗算、要素ごとの加算、三角解法などの操作の場合... これらのランタイムは、キャッシュに快適に収まる問題サイズを超えた場合の操作の規則性により、ほとんどが予測可能であると思います。 質問: この仮定は現実的ですか?実行時関数はほぼ確定的でしょうか? この関数は入力のサイズが多項式であると想定できますか?(つまり、密行列の乗算は、といくつかのスカラー係数のようになると期待します)A N K × BのK M αα N × K × Mαn×k×m\alpha n\times k\times mAnk×BkmAnk×BkmA_{nk}\times B_{km}αα\alpha これに関する既存の作業はどこかにありますか? 私の現在の計画は最小二乗回帰を行うことです。他に何か提案はありますか?L1L1L_1 編集:明確にするために、FLOPSやその他の一般的なパフォーマンスメトリックではなく、ランタイムを探しています。私は、特定の1つのアーキテクチャーに制限するつもりです。

6
無料のシンボリック回帰ソフトウェアを求めて
Formulize / Eureqaがそれを使用するために年間$ 2500を請求し始め、試用版が機能しなくなったので、データポイントを指定して方程式を見つけるなど、同様のことができる代替品を知っている人はいますか? それは無料でしたが、会社や学校以外の誰の価格帯からも外れています。 (それはシンボリック回帰ソフトウェアです) ありがとう

3
Pythonでのfmincgの実装
私はPythonでニューラルネットワークを再実装しようとしています。コスト関数と逆伝播アルゴリズムを正しく実装しました。Octaveに相当するコードを実行して、それらをチェックしました。 しかし、scipy.optimize.fmin_cg関数を使用しようとすると、反復の実行に非常に長い時間がかかります。警告が表示されて終了し、「目的のエラー率が達成されなかった」というエラーが表示されます。 Octaveの同じプログラムは問題なく実行されます。ただし、独自のfmincg機能が定義されています。 何が悪いのですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.