タグ付けされた質問 「machine-learning」

「経験とともに自動的に改善するコンピューターシステム」を構築する方法と原則。

1
複数の機能を備えたRNN
私は、機械学習アルゴリズム(基本的なランダムフォレストおよび線形回帰タイプのもの)で動作する知識を少し自習しています。私は分岐して、KerasでRNNの学習を開始することにしました。通常在庫予測を含むほとんどの例を見ると、1列が機能日付でもう1列が出力である以外に、実装されている複数の機能の基本的な例を見つけることができませんでした。私が行方不明になっている重要な基本的なものまたは何かがありますか 誰かが例を持っているなら、私はそれを大いに感謝します。 ありがとう!

7
機械学習モデルをトレーニングする無料のクラウドサービスはありますか?
大量のトレーニングデータを使用してディープモデルをトレーニングしたいのですが、デスクトップには、これらの豊富なデータを使用してこのようなディープモデルをトレーニングする能力がありません。 機械学習とディープラーニングモデルのトレーニングに使用できる無料のクラウドサービスがあるかどうかを知りたいのですが? また、クラウドサービスがあるかどうかも知りたいと思います。クラウドサービスでは、トレーニング結果を追跡でき、クラウドに接続していなくてもトレーニングは継続されます。


7
機械学習はリストから最大値を見つけるなどの機能を学習できますか?
リストである入力があり、出力はinput-listの要素の最大値です。 機械学習は、入力に存在する入力要素の最大値を常に選択するような関数を学習できますか? これは非常に基本的な質問のように思えるかもしれませんが、機械学習が一般的に何ができるかを理解できるかもしれません。ありがとう!

5
ニューラルネットワークでニューロンと層の数を設定する方法
私はニューラルネットワークの初心者であり、2つの概念を理解するのに苦労しています。 特定のニューラルネットワークが持つ中間層の数をどのように決定しますか?1対10または何でも。 各中間層のニューロン数をどのように決定しますか?各中間層に同数のニューロンを配置することを推奨しますか、それともアプリケーションによって異なりますか?

2
batch_size、steps_perエポック、および検証ステップを設定する方法
Kerasを使用してCNNを学び始めています。私はtheanoバックエンドを使用しています。 値を次のように設定する方法がわかりません。 バッチサイズ、 エポックごとのステップ、 validation_steps。 batch_sizeトレーニングセットに240,000個のサンプルがあり、テストセットに80,000個のサンプルがある場合、エポックごとのステップ、検証ステップに設定する値は何ですか?

6
好きなFacebookサイトに基づいてユーザーの年齢を推定するための機械学習手法
Facebookアプリケーションのデータベースがあり、機械学習を使用して、ユーザーが好きなFacebookサイトに基づいてユーザーの年齢を推定しようとしています。 私のデータベースには3つの重要な特徴があります。 私のトレーニングセットの年齢分布(合計で1万2,000ユーザー)は若いユーザーに偏っています(つまり、27歳の1157ユーザーと65歳の23ユーザー)。 多くのサイトには、5人以下のLikerがあります(5人未満のLikerでFBサイトを除外しました)。 サンプルよりも多くの機能があります。 したがって、私の質問は次のとおりです。さらなる分析のためにデータを準備するためにどのような戦略を提案しますか?何らかの次元削減を実行する必要がありますか?この場合、どのMLメソッドを使用するのが最も適切でしょうか? 私は主にPythonを使用しているため、Python固有のヒントをいただければ幸いです。

2
Kerasで2つの異なるモデルをマージする
2つのKerasモデルを1つのモデルにマージしようとしていますが、これを達成できません。 たとえば、添付の図では、次元8の中間層を取得し、これをモデル(再び次元8の)層への入力として使用し、モデルとモデル両方を単一のモデル。A2A2A2B1B1B1BBBAAABBB 機能モジュールを使用して、モデルとモデル個別に作成しています。どうすればこのタスクを達成できますか?AAABBB 注:はモデル入力層であり、はモデル入力層です。A1A1A1AAAB1B1B1BBB

5
AlphaGoのポリシーネットワークとバリューネットワークの違い
GoogleのAlphaGoの概要(http://googleresearch.blogspot.co.uk/2016/01/alphago-mastering-ancient-game-of-go.html)を読んでいて、「ポリシーネットワーク」と「値ネットワーク」。高いレベルでは、ポリシーネットワークは移動を提案するために使用され、バリューネットワークは次の目的で使用されることを理解しています。「検索ツリーの深さを減らして[ゲームの終わり。」 これらの2つのネットワークは私にとって冗長なようです。価値ネットワークを使用してポリシーを整理していない場合、ポリシーネットワークは何をしますか?バリューネットワークがディープラーニングニューラルネットワークであることは明らかです。ポリシーネットワークは単なる理論上の抽象化であり、実際のニューラルネットワークではありませんか?値ネットワークのターゲット変数は勝ち負けのようです。ポリシーネットワークのターゲット変数はありますか?もしそうなら、それは何ですか?最適化しようとしているポリシーネットワークとは何ですか? Natureで公開されたGoogleの論文の完全なPDFは、https: //vk.com/doc-44016343_437229031?dl = 56ce06e325d42fbc72にあります。

4
名前付きエンティティの認識のためのWord2Vec
Googleのword2vec実装を使用して、名前付きエンティティ認識システムを構築したいと考えています。構造を逆伝播する再帰的ニューラルネットは、名前付きエンティティ認識タスクに適していると聞きましたが、そのタイプのモデルに適した実装または適切なチュートリアルを見つけることができませんでした。非定型コーパスを使用しているため、NLTKなどの標準NERツールのパフォーマンスは非常に低く、独自のシステムをトレーニングする必要があるようです。 要するに、この種の問題に利用できるリソースは何ですか?利用可能な標準的な再帰ニューラルネットの実装はありますか?

3
なぜXGBoostとランダムフォレストが必要なのですか?
いくつかの概念については明確ではありませんでした。 XGBoostは、弱い学習者を強い学習者に変換します。これを行う利点は何ですか?多くの弱学習器を組み合わせるだけではなく単一のツリーを使用していますか? ランダムフォレストはツリーを作成するために、木から様々なサンプルを使用しています。だけではなく、単数形の木を使用して、この方法の利点は何ですか?

3
NLPと機械学習のコミュニティがディープラーニングに関心を持っているのはなぜですか?
このトピックに関する質問がいくつかありますので、お役に立てば幸いです。私はディープラーニングの分野で初めての経験がありますが、いくつかのチュートリアルを行いましたが、概念を互いに関連付けたり区別したりすることはできません。

4
ランダムフォレストはオーバーフィットしますか?
私はランダムフォレストについて読んでいますが、過剰適合の問題に関する明確な答えを見つけることができません。ブライマンの元の論文によると、森の中の木の数を増やしても過剰適合すべきではありませんが、これについてはコンセンサスがないようです。これにより、この問題に関するかなりの混乱が生じています。 私よりも専門家が具体的な答えをくれたり、問題をよりよく理解するために正しい方向を教えてくれるかもしれません。

4
潜在的な特徴の意味?
推奨システムの行列因子分解について学習しており、この用語latent featuresが頻繁に出現するのを見ていますが、それが何を意味するのか理解できません。機能が何であるかは知っていますが、潜在的な機能の概念がわかりません。説明してください。または、少なくともそれについて読むことができる紙/場所を指し示しますか?

4
データセット全体を使用して最終モデルをトレーニングする方が常に良いですか?
好みの機械学習モデルをトレーニング、検証、テストした後の一般的な手法は、テストサブセットを含む完全なデータセットを使用して、製品などに展開する最終モデルをトレーニングすることです。 私の質問は、そうすることは常に最善のことですか?実際にパフォーマンスが低下した場合はどうなりますか? たとえば、テストサブセットの分類でモデルのスコアが約65%である場合を想定します。これは、モデルのトレーニングが不十分であるか、テストサブセットが外れ値で構成されていることを意味します。後者の場合、それらを使用して最終モデルをトレーニングするとパフォーマンスが低下し、展開後に初めて確認できます。 最初の質問の言い換え: 高価なロケット実験に搭載された組み込み電子機器にモデルを展開するなど、モデルの1回限りのデモンストレーションがあった場合、最終ステップでテストサブセットを使用して再トレーニングされたモデルを信頼できますか?新しいパフォーマンスでテストしましたか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.