タグ付けされた質問 「machine-learning」

データのパターンを自動的に発見し、それらに基づいて適切な決定を行うコンピューターアルゴリズムに関する質問。

1
「機械学習」という用語を生み出したのは誰ですか?
「機械学習」という用語を生み出したのは誰かを把握しようとしています。補助的な質問は、アーサー・サミュエルが1959年の「機械学習」の分野を次のように定義しているとして引用されている場所からです。 コンピューターが明示的にプログラムされなくても学習できるようにする研究分野 ? この定義への多くの参照はインターネットで見つけることができますが、ソースを追跡することができませんでした。チェッカーに関する1959年の論文としてそれを挙げている人もいますが、そのような定義はありません。

3
線は2セットのポイントを分離します
2セットのポイントを線で区切ることができるかどうかを識別する方法がある場合 我々は2つの点の集合有するおよび分離する線が存在する場合と、その結果、すべての点のみ線の一方の側に、そしてすべての点とのみ他方の側に。B A B A A B BAAABBBAAABBBAAAAAABBBBBB 私が思いついた最も素朴なアルゴリズムは、と凸多角形を構築し、それらの交差をテストすることです。凸多角形の構築に関しては、時間の複雑さは必要があると思われ。実際、時間の複雑さの改善は期待していませんが、改善できるかどうかはわかりません。しかし、少なくとも、そのような線があるかどうかを判断するためのより美しい方法があるはずです。B O (n log h )AAABBBO(nlogh)O(nlog⁡h)O(n\log h)

1
ニューラルネットワークのVC次元の効率的な計算または近似
私の目標は、入力と出力で説明した次の問題を解決することです。 入力: 非循環有向グラフとM個のノード、N源、及び1つのシンク(M > N ≥ 1)。GGGmmmnnn111m>n≥1m>n≥1m > n \geq 1 出力: トポロジGのニューラルネットワークのVC次元(またはその近似)。GGG より詳細: 各ノードはシグモイドニューロンです。トポロジは固定されていますが、エッジの重みは学習アルゴリズムによって異なる場合があります。GGG 学習アルゴリズムは固定されています(後方伝播など)。 ソースノードは、入力ニューロンでのみから文字列を取ることができ、{ - 1 、1 } nは入力として。nnn{−1,1}n{−1,1}n\{-1,1\}^n シンクノードは出力ユニットです。それから、実際の値を出力し我々は切り上げることを1またはダウン- 1それは、より特定の固定のしきい値を超える場合δ離れてから0。[−1,1][−1,1][-1,1]111−1−1-1δδ\delta000 素朴なアプローチは、単にそれらを使ってネットワークを訓練しようとすることで、ますます多くのポイントを壊そうとすることです。ただし、この種のシミュレーション手法は効率的ではありません。 質問 この関数を計算するための効率的な方法はありますか(つまり、決定問題に変更されたときの:VC次元は入力パラメーターkよりも小さい?)?そうでない場合、硬度の結果はありますか?PP\mathsf{P}kkk この関数を計算または近似するための実用的な方法はありますか?近似値である場合、その精度について保証はありますか? ノート stats.SE についても同様の質問をしましたが、興味はありませんでした。

1
パーセプトロンは忘れることができますか?
ユーザーが分類されたサンプルを継続的に追加し、モデルをオンラインで更新できるオンラインWebベースの機械学習システムを構築したいと思います。パーセプトロンまたは同様のオンライン学習アルゴリズムを使用したいと思います。 しかし、ユーザーは間違いを犯し、無関係な例を挿入する場合があります。その場合、例のセット全体でパーセプトロンを再トレーニングすることなく、特定の例を削除するオプションが必要です(非常に大きい場合があります)。 これは可能ですか?

2
ニューラルネットワークは常に収束する必要がありますか?
前書き 第一歩 標準的な逆伝播ニューラルネットワークを作成し、それをテストするために、XORをマップすることにしました。 2-2-1ネットワークです(tanhアクティベーション機能付き) X1 M1 O1 X2 M2 B1 B2 テストのために、手動で上部中間ニューロン(M1)をANDゲートに設定し、下部ニューロン(M2)をORゲートに設定します(真の場合は出力1、偽の場合は-1)。 また、接続M1-O1を手動で-.5、M2-O1を1、B2を-.75に設定しました。 したがって、M1 = 1およびM2 = 1の場合、合計は(-0.5 +1 -0.75 = -.25)tanh(0.25)= -0.24 M1 = -1およびM2 = 1の場合、合計は((-0.5)*(-1)+1 -0.75 = .75)tanh(0.75)= 0.63 M1 = -1およびM2 = -1の場合、合計は((-0.5)*(-1)-1 -0.75 = -1.25)tanh(1.25)= -0.8 これは、「最初の反復」では比較的良い結果です。 ステップ2 次に、これらの重みを少し変更し、エラー伝播アルゴリズム(勾配降下法に基づいて)を使用してそれらをトレーニングしました。この段階では、入力ニューロンと中間ニューロンの間の重みをそのままにして、中間(およびバイアス)と出力の間の重みを変更します。 テストでは、重みを.5 .4 .3に設定します(それぞれM1、M2、バイアス) ただし、ここで問題が発生し始めます。 私の質問 学習率を.2に設定し、10000回以上の反復のためにプログラムにトレーニングデータ(ABA …

1
書かれたルールのシステムを評価する方法
私は、組織の基本的な論理を決定するために組織の細則を評価するシステムを考え出そうとしていました。 一次述語システムは、ルールを表すために機能すると思います。ルールは、品詞タグ付けやその他のNLPテクニックを使用してテキストから翻訳できます。 全体として一次論理規則を解釈する体系的な方法、または要素間の類似性を見つけるための第2層として機能する何らかのタイプのMLアーキテクチャがありますか。 例えば、 楽しいアクティビティのリスト: ゴルフ コーヒーブレイク ピザ 細則: 金曜日、ゴルフをします 金曜日または土曜日に、私たちは短いコーヒー休憩を取り、それが土曜日の場合、ピザを受け取ります 結論:私たちのグループは週末は楽しい それははるかにフェッチされたように聞こえますが、可能かどうか私は興味があります。また、2次層の結論を導き出すには、おそらく1次論理のほうが適していると思います。

4
実行可能な調理レシピを提案するアルゴリズムを考案する方法は?
私はかつて、料理のレシピを提案するアルゴリズムを作成したベテランを私のコースにいました。最初は、あらゆる種類のクレイジーなレシピが出てきました。その後、彼女は実際のレシピで調理アルゴリズムを訓練し、最終的には非常に良いレシピを提案します。 彼女はベイズの定理やクラスタリングに関連するものを使用したと思いますが、彼女はずっといなくなっており、アルゴリズムもそうです。私はインターネットを検索しましたが、料理のレシピを探すとどんな種類の結果も得られますが、私が探しているものではありません。だから、私の質問は: どのアルゴリズムを使用して、実行可能なレシピを(ランダムに)提案するアルゴリズムを考案できますか(固定レシピのデータベースを使用せずに)。 なぜ調理アルゴリズムを探しているのですか?まあ、それは基礎となる概念の現実世界のアプリケーションの非常に良い例であり、そのようなアルゴリズムは現実世界により近いさまざまな設定で役立つ可能性があります。

6
間隔内の2つの数値の最大XORを見つける:二次式よりも良いことはできますか?
lllrrr L ≤ I 、最大(I ⊕ J )最大(私⊕j)\max{(i\oplus j)}L ≤ I 、J ≤ Rl≤私、j≤rl\le i,\,j\le r ナイーブアルゴリズムは、考えられるすべてのペアを単純にチェックします。たとえば、ルビーでは次のようになります。 def max_xor(l, r) max = 0 (l..r).each do |i| (i..r).each do |j| if (i ^ j > max) max = i ^ j end end end max end 私感私たちはより良い次より行うことができます。この問題のためのより良いアルゴリズムはありますか?

2
Connect Fourをプレイする機械学習アルゴリズム
現在、機械学習について読んでおり、Connect Fourのプレイにそれをどのように適用するのか疑問に思っています。 私の現在の試みは、シグモイド関数モデルとone-vs-allメソッドを使用した単純なマルチクラス分類器です。 私の意見では、入力フィーチャは7x6 = 42グリッドフィールドの状態(プレーヤー1のディスク、プレーヤー2のディスク)でなければなりません。 出力は、ディスクを挿入する行の番号になります。これは1〜7の離散的な数値であるため、これはマルチクラス分類問題として扱うことができると思います。 しかし、教師あり学習で使用可能なトレーニング例を生成するにはどうすればよいですか? 主な目標はゲームに勝つことですが、最終ターン以外のすべての結果は明らかにわかりません。何千回もお互いに何をプレイするかをランダムに決定する2人のプレーヤーにさせた場合、トレーニングの例として、各ゲームラウンドの勝者によって行われたすべてのターンを取るだけで十分ですか?または、これを完全に異なる方法で行う必要がありますか? 編集:コメントで示唆されているように、強化学習について少し読みました。 私が知っていることから、Qラーニングはトリックを実行する必要があります。つまり、現在の状態の関数Qとその状態で始まる最大累積報酬になるために実行するアクションを近似する必要があります。次に、各ステップでQの最大値が得られるアクションを選択します。ただし、このゲームでは、たとえばルックアップテーブルとしてこれを行うには状態が多すぎます。それでは、このQ関数をモデル化する効果的な方法は何ですか?

4
機械学習における相関と因果関係はどうですか?
「相関関係は因果関係に等しくない」ことはよく知られていますが、機械学習はほぼ完全に相関関係に基づいているようです。私は、過去のパフォーマンスに基づいて質問に対する学生のパフォーマンスを推定するシステムに取り組んでいます。Google検索などの他のタスクとは異なり、これは簡単にゲームをプレイできる種類のシステムではないようです。そのため、因果関係は実際には関係ありません。 明らかに、システムを最適化するための実験を行いたい場合、相関/原因の区別に注意する必要があります。しかし、適切な難易度になる可能性が高い質問を選択するシステムを構築するだけの観点から、この区別は重要ですか?

1
Naive Bayesモデルでの平滑化
Naive Bayes予測子は、次の式を使用して予測を行います。 P(Y= y| バツ= X )= α P(Y= y)∏私P(X私= x私| Y= y)P(Y=y|バツ=バツ)=αP(Y=y)∏私P(バツ私=バツ私|Y=y)P(Y=y|X=x) = \alpha P(Y=y)\prod_i P(X_i=x_i|Y=y) ここで、は正規化係数です。これには、データからパラメーターを推定する必要があります。 -smoothingでこれを行うと、推定値が得られますP (X I = X I | Y = Y )Kαα\alphaP(X私= x私| Y= y)P(バツ私=バツ私|Y=y)P(X_i=x_i|Y=y)kkk P^(X私= x私| Y= y)= #{ X私= x私、Y= y} + k#{ Y= y} + n私kP^(バツ私=バツ私|Y=y)=#{バツ私=バツ私、Y=y}+k#{Y=y}+n私k\hat{P}(X_i=x_i|Y=y) = \frac{\#\{X_i=x_i,Y=y\} + k}{\#\{Y=y\}+n_ik} …

2
ニューラルネットワークの入力として日付をエンコードする方法は?
私はニューラルネットワークを使用して時系列を予測しています。私が今直面している問題は、日付/時刻/シリアル番号をどのようにエンコードするかです。ニューラルネットワークへの入力として設定された各入力の? ここで説明するように、Cエンコーディング(カテゴリのエンコーディングに使用)の1つを使用する必要がありますか? または、時間(1-1-1970からのミリ秒単位)を与える必要がありますか? または、残りのデータを時系列でフィードする限り、時間を不要にしていますか?

4
機械学習とシステム識別
機械学習とシステム識別の違いと類似点について説明してもらえますか?これらは同じものの2つの名前ですか?で、このページ、彼らは言います: 機械学習およびシステム識別コミュニティは、限られたまたはノイズの多い観測からモデルを構築する必要がある同様の問題に直面しています。 クリストファー・M・ビショップ著の有名な本「パターン認識と機械学習」の初期の章も読んだことがあります。これまでのところ、私の結論は、システム同定が解決しようとしている問題は、機械学習が解決しようとしているもののサブセットであるということです。

1
Google DeepDreamの詳細
このサイトでDeep Dreamに関するいくつかの質問を見てきましたが、DeepDreamが具体的に何をしているのかについて実際に話しているようには見えません。私が集めた限りでは、それらは目的関数を変更し、重み付けを更新する代わりに入力画像を更新するように逆伝播も変更したようです。 誰かがグーグルがしたことを正確に知っているのだろうかと思います。彼らは、最適化を実行するときにベイズの事前分布を課す彼らの記事の1つで言及しています。これにより、ニューラルネットが各ラベルの画像を吐き出すのはそれほど難しくないことを想像できます。ラベルを設定して、それに応じて入力ベクトルを最適化します。 ただし、ディープドリームの興味深い部分は、これをレイヤーごとに実行することです。この点で、レイヤーごとの方法で詳細を強調する方法がよくわかりません。 確かに、画像を入力すると各ニューロンの値が得られますが、その情報を使用して元の画像の詳細を誇張するにはどうすればよいでしょうか。これに関する詳細な報告を見つけるのに苦労しました。 参考資料:ここでvznが同様の質問に回答しました:https ://cs.stackexchange.com/a/44857/49671 そのリンクから、ここにDeepdreamの実装があります:http ://auduno.com/post/125362849838/visualizing-googlenet-classes ここで説明されているように、機能の誇張はありませんが、http://googleresearch.blogspot.com/2015/06/inceptionism-going-deeper-into-neural.html どちらも特定のクラスと特定のレイヤーの視覚化を示し、次のように言います。 ネットワークで増幅する機能を正確に規定する代わりに、ネットワークにその決定を任せることもできます。この場合、ネットワークに任意の画像または写真を送り、ネットワークに画像を分析させるだけです。次に、レイヤーを選択し、検出されたものを強化するようネットワークに要求します。

1
機械学習で「前」という用語が意味するもの
機械学習は初めてです。私は、さまざまなアプリケーションにディープラーニングを採用し、ほとんどのモデル設計ケースで「前」という用語を使用したいくつかの論文を読みました。それが実際に何を意味するのか誰かが説明できますか?チュートリアルでは、事前と事後の数学的な定式化のみを見つけることができました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.