コンピュータサイエンス machine-learning

1

以下のオブジェクト検出タスクを扱った論文は文献にありますか？タスクは次のように説明できます。画像のセットが与えられた場合、ラベルは、検出したいオブジェクトの場所を表す単なる座標（x、y）です。座標はオブジェクトの中心にある必要はなく、オブジェクトのサイズは任意です。タスクは、人、ボート、車のいずれかであるオブジェクトを検出することです。ただし、ラベルはオブジェクトのカテゴリを示しておらず、ラベルは対象のオブジェクトに近い座標にすぎません。画像は1時間ごとに取得され、同じシーンのスナップショットです。したがって、バックグラウンド減算技術が役立つ場合があります。同じシーンの約2000枚の画像があり、各画像には通常2つの対象オブジェクトがあります。以前にそのような仕事に取り組んだことがあるのだろうか？ Hog機能とSVMは、画像内の人間の検出に大きな成功を収めています。ただし、関連する文献では、関心のあるオブジェクトが単一の座標ではなく境界ボックスを使用してラベル付けされているトレーニングデータを使用しています。主な3つの課題は次のとおりです。オブジェクトのサイズは任意であるため、分類子の境界ボックスを選択することは困難です。シーンのスナップショットは1時間ごとに取得されます（カメラもわずかに動く可能性があります）。そのため、バックグラウンド減算の使用は簡単ではありません。ラベル付けされたデータはあまりありません。人々がこれらの課題にどのように対処したかを見るのは興味深いでしょう。ありがとう！

7 machine-learning image-processing computer-vision data-mining

1

共進化の「無料ランチ」は本当に無料のランチですか？

彼らの論文「Coevolutionary Free Lunches」で、David WolpertとWilliam Macreadyは、以前の論文で証明したNo Free Lunchの定理に対する一連の例外について説明しています。例外は、対戦相手による最適なプレー、または少なくとも優れたプレーを前提として、プレーヤーが予想される検索コストを最小化しようとする2プレーヤーゲームに関係します。この場合、無料のランチは「許可」されます。これは、以前のラウンドのラウンドでどのフィットネス（つまり、目的）関数が「除外」されているかに応じて、変更を最小限に抑えるコスト関数を正確に選択したためです。つまり、対戦相手がすでにゲームについて何かを知っていて、プレーヤーの期待リターンを最小にする応答を選択すると、プレーヤーは特定のフィットネス関数を評価せずに排除できます。これがどのように機能するかを説明するために、W＆Mは次のグラフを提供します。ここに、 ⟨ グラム⟩⟨g⟩\langle g \rangle 対戦相手の動きに注意を払わない検索アルゴリズムを表します。 ⟨ グラム⟩1⟨g⟩1\langle g \rangle_{1}各移動に対する可能なすべての対戦相手の応答を考慮する検索アルゴリズムを表します。そして⟨ グラム⟩2⟨g⟩2\langle g \rangle_{2} は、各移動に対して1つの可能な対戦相手の応答のみをサンプリングする検索アルゴリズムを表します。これは、提供される無料ランチの特徴を示しています。対戦相手から提供された情報を考慮に入れるアルゴリズムは、そうしないアルゴリズムよりも優れており、対戦相手からできるだけ多くの情報を収集するアルゴリズムは、一部のみを収集するアルゴリズムよりも優れています。W＆Mは、後の対戦相手の諜報についての議論でこの点を拡大しています。彼らは、対戦相手が全知ではないが部分的な知識を持っている場合でも、プレイヤーはその部分的な知識を活用できることを示しています。完全な無知の場合、これはうまくいきません。なぜなら、敵は常にランダムな動きで応答するからです。その場合、利益はないようです：薬剤の予想される性能は、拮抗薬の可能な応答の平均です。これは次のようだと思います ⟨ グラム⟩⟨g⟩\langle g \rangle上記。しかし、対戦相手にある程度の知識がある場合、アルゴリズムのパフォーマンスは対戦相手のインテリジェンスによって単調に増加するように見えます。これらすべてについて私を混乱させるのは、議論が次の些細な見方の主張に要約されるように見えることです：すべての問題ドメインにわたって、知識のある敵から学ぶのに煩わしいアルゴリズムは、そうでないアルゴリズムよりも優れています。つまり、無料のランチを断らない限り、それを手にすることができます。対戦相手が買っているので、事実上、昼食は無料です。それが本当なら、たとえば、プレイヤーがオラクルと協力ゲームをし、協力を拒否するゲームはすべての問題でより悪いパフォーマンスをするゲームの全範囲を想像できませんか？同じ意味で無料のランチですね。しかし、オラクルの知識がどこから来たのかについては説明していません。これは、他のプレイヤーの知識のソースをモデル化する必要がある場合、無料ランチゾーンに戻ることを意味しますか？あるいは、「無料の昼食」という言葉が暗示するように、両方のプレーヤーが完全に無知で始めた場合でも、この種の競争的なプレーがより良い結果をもたらすという主張は本当にありますか？

7 optimization machine-learning

1

コンピュータービジョン：ランダムフィルターがエッジ検出器と同様に機能するのはなぜですか？

「ランダムに初期化されたフィルターは、エッジ検出器のように機能する」とここで読みました。この現象を説明している論文があるかどうか知りたい。

7 machine-learning computer-vision

1

コンピュータビジョン/機械学習における「機能」と「記述子」の違いは何ですか？

私はに類似した複数の時間の文章を読んだことがあります最後に、標準的な画像分類では、SIFT記述子に基づく単語の特徴が、高性能にとって重要であることが判明しています。最初に、画像全体の標準グリッドポイントで標準SIFTディスクリプターを計算します。出典：「条件付きランダムフィールドとグローバル分類を使用したマルチクラス画像セグメンテーション」、Nils Plath、Marc Toussaint、中島真一記述子とは何ですか？SIFTは、画像を操作して機能を提供するアルゴリズムだと思いました（ベクトル。ここで、は、固定サイズの画像とSIFTアルゴリズムのパラメーターに対して固定されています）？RんRn\mathbb{R}^nんnn

7 machine-learning computer-vision features

3

機械学習を使用して関数を探索および補間しますか？

滑らかな多変量関数を「学習」または補間しようとする一般的な機械学習方法には、学習プロセス（探索）中に関数が評価されるポイントを実際に選択する方法がありますか。各関数の評価は多かれ少なかれコストがかかり、アルゴリズムは知識の利得が最大である空間の領域を探索することを学習するという考え方になります（関数の評価のコストに対して）。最も興味深いケースでは、関数は分析的でない場合があります（例：ねじれ）。私の経歴は物理学であり、そのような方法が存在することは確かですが、検索しても正しい用語がわからないためか、直接関連するものを見つけることができませんでした。より広く言えば、「強化学習」が探索と報酬を処理するAIの領域であることを知っているだけなので、私が求めている方法は、そのいくつかの特別なケースを表しているのかもしれません。明確にするために、ここに例を示します。物質の相図、つまり密度を圧力pと温度Tの関数として取得したい場合があります。したがって、ここでは2つの変数（p、 T）。任意のポイント（p、T）での評価には、高価なモンテカルロシミュレーションが必要です（CPU時間の数。どれだけが、p、T空間のどこにいるかによっても異なります）。理想的なアルゴリズムは、密度を評価するポイント（p、T）を慎重に選択し、関数が最も顕著な特徴（たとえば、相転移線、つまり非分析性）をもつ領域に移動しようとします。その後、アルゴリズムに他の任意のポイント（p、T）で密度を要求すると、探索フェーズ中に取得したすべての情報を考慮して、アルゴリズムが考えられる最良の内挿/外挿が提供されます。

7 machine-learning artificial-intelligence

2

PAC学習軸平行長方形

軸平行長方形が実現可能な場合にPAC学習可能であるという証明を理解しようとしています。これは、十分なデータがあるが与えられると、ような関数見つけることができることを示します。ここでのエラーは、選択した関数エラーが発生する確率。ϵ 、δϵ,δ\epsilon, \deltahhhP [ エラー> ε ] ≤δP[エラー>ε]≤δ\mathbb{P}\left[\text{error} > \epsilon\right] \leq \deltahhh さて、軸平行長方形（バイナリ分類）の場合、通常の引数は次のようになります真の長方形とし、を正の例を含む最小の長方形とします。明らかにとします。4つの長方形ストリップを考慮します。と間。明らかに、それらすべてに確率場合、エラーが発生する確率はより小さいため、少なくとも1つがエラー発生する確率があると想定できます。RRRR』R』R'R』⊆ RR』⊆RR' \subseteq RR』R』R'RRR≤ ε / 4≤ε/4\leq \epsilon/4εε\epsilon≥ ε / 4≥ε/4\geq \epsilon/4 そのようなストリップの場合、すべてのトレーニング例を正しく分類する確率はせいぜい。したがって、すべてのストリップに結合された和集合をとると、すべてを正しく分類する確率は、そして少しの代数を使用すると、サンプルの複雑度は。メートルメートルm（1 − ϵ / 4）メートル（1−ε/4）メートル(1 - \epsilon/4)^m4 （1 − ϵ / 4）メートル≤ 4e− m / 44（1−ε/4）メートル≤4e−メートル/44(1-\epsilon/4)^m \leq 4e^{-m/4}M ≥ （4 / ε ）LN（4 / δ）メートル≥（4/ε）ln⁡（4/δ）m …

7 machine-learning learning-theory

1

3つのクラスに分類するためのロジスティック回帰の理解（および実装）に問題があります

（参考までに、私はケビンPマーフィーの本「機械学習：確率論的展望」を使用しており、MATLANを使用して実装しています-ツールボックスなし）私は392サンプル（行）のデータセットを持っています。各サンプルには8つの特徴（列）があり、そのうちの1つがクラスを定義します（つまり、特徴の列1は3つのクラスを定義する3つの等しいビンに分割されます-低、中、高）。サンプルをこれら3つのクラスのいずれかに分類するためのロジスティック回帰モデルを作成する方法を理解するのに本当に苦労しています。重みベクトルの通常の最小二乗（閉じた形）ソリューションと勾配降下（開いた形）ソリューションの両方について学習した線形回帰モデルの学習と作成を終えたところです。しかし、私のデータは重みベクトルのOLSソリューションで完全にうまくフィットしたため、勾配降下法を実装したことはありません。ロジスティック回帰の重みベクトルの作成方法が非常に混乱しています。閉じた形のソリューションがないため、勾配降下法を使用する必要があることを理解しています。重みを計算するためのニュートン法についても読みましたが、まったく理解できません。そして、これらのメソッドを使用して重みを計算した後、サンプルデータに重みをどのように適用しますか？線形回帰では、単純に重みに機能（および高次線形回帰の高次機能）を掛けただけでしたが、ロジスティック回帰でも同じですか？さらに、これまでの私の理解は、このモデルはバイナリ分類でのみ機能するということです。したがって、3つのクラスでどのようにそれを行うのですか？基本的に私の質問はこれに要約されます：（勾配降下法またはニュートン法のいずれか簡単な方を使用して）ロジスティック回帰の重みベクトルをどのように正確に見つけ、サンプルに重みベクトルを適用して、3つのクラス（2つだけではない）から分類を取得する方法。

7 machine-learning

2

自動（人間によるテストなし）で測定する方法はありますか

そのため、数独パズルを提供するほとんどのリソースは、各パズルに難易度カテゴリを割り当てています。15以上の難易度カテゴリで私が見たものも含まれています。しかし、これらの難易度カテゴリを割り当てる良い方法は何ですか？人間のパズルソルバーが十分に使用された場合、人間がパズルを完了するまでの平均時間と、パズルを正常に解決した人のパーセンテージを、人間のサンプルについて計算し、それに応じて難易度カテゴリを割り当てることができます。しかし、平均的な人間の難易度に影響を与えるさまざまなパズルが解決されているときに出現し続ける予測可能なシナリオがあるはずです。コンピューターがパズルを解くと自動的に検出され、これらのパターンが人間の予測平均難易度にまとめられます。。これを行うには良い方法はありますか？多分、サンプルパズルでの人間のパフォーマンスの十分なトレーニングデータを使用した機械学習でしょうか？

7 algorithms machine-learning board-games sudoku

2

スパイキングニューラルネットワークとディープラーニングの主な違いは何ですか

人工ニューラルネットワークで最も人気のある分野の1つであるディープラーニングは、データセットの精度の点で大きな期待を示しています。スパイキングニューラルネットワークと比較してどうですか。最近クアルコムがSNNでその0番目のプロセッサを発表したので、代わりにディープラーニングを使用する場合に違いがあるかどうか考えていました。

7 machine-learning neural-networks

1

人間の行動とボットの行動をどのように区別できますか？

コメントに基づいて更新：オンラインで特定のアクティビティを実行している人間と、同様のアクティビティを実行するようにプログラムされたボットをどのように区別できますか？たとえば、メールのチェック、音楽ファイルのダウンロード、ebayでのショッピング、Googleでの検索など、またはWebサイトの改ざん/ハッキング、ブルートフォースログインパスワードなど。質問の範囲を制限し、より明確にするために、観察をネットワーク指向の動作のみに制限します。いくつかの例は、XYZをオンラインで実行するのに費やした時間、ダウンロードされた（たとえば）データの量/タイプです。ファイル共有Webサイト、ソーシャルメディアWebサイトの友達/フォロワーの数など。人間の行動とプログラムされた行動を区別するいくつかの「パターン」を取得することは可能だと思います。チューリングテストは私が探しているものではありません。ここではどのようなテクニックが役に立ちますか？機械学習？ゲーム理論？関連する学術/研究記事への参照も良いでしょう。

7 machine-learning artificial-intelligence game-theory computer-vs-human

1

テンソルとしての条件付き確率？

次のような条件付き確率を表示することは適切ですか。 P（a | c） P（a | c、d） P（a、b | c、d） ...など、テンソルとして？もしそうなら、誰かがコンピュータ科学者/機械学習の実践者のためにその意味でテンソルを開発するまともな導入テキスト（オンラインチュートリアル、ワークショップペーパー、本など）を知っていますか？私は多くの論文を見つけましたが、入門レベルで書かれたものは物理学者向けに書かれ、コンピュータ科学者向けに書かれたものはかなり進んでいます。

7 machine-learning probability-theory statistics

1

ポイント数を均等に分割する線を見つけるアルゴリズム

私は最近、インタビューで、ポイントの半分がラインの片側にあり、残りのポイントが反対側になるように、座標系でポイントのセットを分割するアルゴリズムを考案するように依頼されました。ポイントは不均等に配置され、ラインはどのポイントも通過してはなりません。誰もが問題を解決するために何らかのアプローチをすることができますか？アルゴリズムの分析は高く評価されています。ヒント：ポイントを数え、中央値を使用します。ポイントの数は偶数と見なされます。

7 algorithms machine-learning computational-geometry classification

2

観測から確率分布関数を構築する

N個のプレーヤーとM個のオブジェクトがあり、各オブジェクトには値があります。各プレイヤーはオブジェクトを選択する際の戦略を持っています。プレイヤーは各ラウンドでオブジェクトを選択し、多くのプレイヤーは同じオブジェクトを選択できます。ただし、各オブジェクトの値は、それを選択したすべてのプレーヤー間で均等に分割されます。ゲームごとに9000ラウンド（選択肢）があります。私たちの目標は、ゲームの最後に蓄積する価値を最大化することです。質問：決定が確率変数であると仮定して、各プレイの確率分布関数を作成するにはどうすればよいですか？現在のアプローチ：私の現在のアプローチは、プレーヤーが特定のオブジェクトを選択する頻度をカウントし、ラウンドの総数で割ることです。これにより、プレーヤーがその特定のオブジェクトを選択する可能性が高くなります。問題：各プレーヤーが積極的にプレイし、可能な限り予測不可能（ノイズ）にしようとすると、私の現在のアプローチでは、確率分布関数が正確ではありません（9000ラウンドでは十分なデータではないようです）。これらの分布関数を構築するより良い方法はありますか？注：私は（ベイズモデルおよびHMM）が頻度カウントよりも優れていることをどこかで読んだことがありますが、それをこの状況にどのように適応させるかはわかりません。

7 machine-learning probability-theory modelling

2

パターン認識のための分類子の比較に関する問題

私はジェスチャーを認識し、常に任意のカテゴリに分類する分類子Mを設計しました。ジェスチャーは、サンプル時系列yとトレーニング時系列xの間のハミング距離に基づいて分類されます。分類子の結果は確率値です。A、B、Cの3つのクラス/カテゴリがあり、ハンドジェスチャを分類します。分類するクラスごとに100個のサンプルがあります（単一の機能とデータの長さ= 100）。データは異なる時系列です（x座標vs時間）。トレーニングセットは、どのジェスチャが何回発生したかを示す確率を割り当てるために使用されます。したがって、10個のトレーニングサンプルのうち、ジェスチャAが6回出現した場合、ジェスチャがカテゴリAに該当する確率は P（A）= 0.6同様にP（B）= 0.3 そして P（C）= 0.1 現在、この分類器の性能をベイズ分類器、K-NN、主成分分析（PCA）およびニューラルネットワークと比較しようとしています。分類子の特徴はROCプロットの確率値であるため、ROCまたは交差検証を検討する場合、パラメーターと方法をどのように実行すればよいですか？したがって、k-nn、ベイ分類およびPCAの特徴は何ですか？便利なコードがありますか？ 3つのクラスのジェスチャがある場合、kの値はどうあるべきですか？助けてください。私は修正中です。

7 machine-learning pattern-recognition

タグ付けされた質問 「machine-learning」

タグ付けされた質問「machine-learning」