タグ付けされた質問 「machine-learning」

データのパターンを自動的に検出し、カバーされていないパターンを使用して将来のデータを予測したり、不確実性の下で他の種類の意思決定(方法の計画など)を実行したりできる一連の方法である機械学習(ML)に関連する質問より多くのデータを収集するため)。MLは通常、教師あり、教師なし、強化学習に分けられます。深層学習は、深層人工ニューラルネットワークを使用するMLのサブフィールドです。

2
バックプロパゲーションを使用してニューラルネットワークをトレーニングするための時間の複雑さは何ですか?
NNには、nnn隠れ層、訓練例、特徴、および各層のノードが含まれているとします。バックプロパゲーションを使用してこのNNをトレーニングする時間の複雑さは何ですか?mmmxxxninin_i 私はアルゴリズムの時間の複雑さをどのように見つけるかについての基本的なアイデアを持っていますが、ここでは4つの異なる要因、すなわち反復、レイヤー、各レイヤーのノード、トレーニング例、そしてさらに多くの要因があります。ここで答えを見つけましたが、十分に明確ではありませんでした。 上記で述べたものとは別に、NNのトレーニングアルゴリズムの時間の複雑さに影響する他の要因はありますか?

2
なぜクロスエントロピーがカルベック・ライブラーの発散ではなく分類の標準損失関数になったのですか?
クロスエントロピーは、KL発散にターゲット分布のエントロピーを加えたものと同じです。2つの分布が同じ場合、KLはゼロに等しく、ターゲット分布のエントロピーよりも直感的に思えます。クロスエントロピーは一致しています。 私は人間の見解が肯定的なものよりも直感的なゼロを見つけるかもしれないことを除いて、他の1つにもっと多くの情報があると言っているのではありません。もちろん、通常は評価方法を使用して、分類がどの程度うまく行われているかを実際に確認します。しかし、KLに対するクロスエントロピーの選択は歴史的ですか?



3
順列不変ニューラルネットワーク
入力としてn個のデータポイントを受け取るニューラルネットワークfff:x 1、… 、x nを考えます。次の場合、fは順列不変であると言います。nnnx1,…,xnx1,…,xnx_1, \dots, x_nfff f(x1...xn)=f(pi(x1...xn))f(x1...xn)=f(pi(x1...xn))f(x_1 ... x_n) = f(pi(x_1 ... x_n)) 任意の順列pipipi。 誰かが順列不変ニューラルネットワークの出発点(記事、例、または他の論文)を推奨できますか?

2
ディープラーニングの過剰はいつですか?
たとえば、メールをスパムとして分類する場合、時間/精度の観点から、別の機械学習アルゴリズムの代わりにディープラーニング(可能であれば)を適用することは価値がありますか?ディープラーニングは、単純ベイズのような他の機械学習アルゴリズムを不要にしますか?

1
ゲシュタルト心理学の情報処理ルールは現在もコンピュータービジョンで使用されていますか?
数十年前はマシンビジョンの本であり、ゲシュタルト心理学からのさまざまな情報処理ルールを実装することにより、画像識別と視覚処理にほとんどコードまたは特別なハードウェアを使用せずに印象的な結果を得ました。 そのような方法は現在使用されているか、または現在行われていますか?これで何か進歩はありましたか?または、この研究プログラムは中止されましたか?今日までに、1995または2005ではなく2016を意味します。

4
人間の脳はどのような活性化機能を使用していますか?
人間の脳は特定の活性化機能を使用していますか?私はいくつかの研究を試みましたが、信号がニューロンを介して送信されるかどうかの閾値であるため、ReLUによく似ています。ただし、これを確認する記事は1つも見つかりません。または、それはステップ関数のようなものですか(入力値ではなく、しきい値を超える場合は1を送信します)。

2
アクティベーション機能の選び方は?
必要な出力と知っているアクティベーション関数のプロパティに応じて、出力レイヤーのアクティベーション関数を選択します。たとえば、確率を処理する場合はシグモイド関数を選択し、正の値を処理する場合はReLUを選択し、一般的な値を処理する場合は線形関数を選択します。 非表示のレイヤーでは、ReLUではなくリークしたReLUを使用し、シグモイドではなくtanhを回避します。もちろん、私は隠れた単位で線形関数を使用しません。 ただし、非表示層でのそれらの選択は、主に試行錯誤によるものです。 状況によっては、どのアクティベーション機能が適切に機能するかについての経験則はありますか?可能な限り一般的な状況を考えてみましょう。これは、レイヤーの深さ、NNの深さ、そのレイヤーのニューロンの数、選択したオプティマイザー、入力フィーチャの数を指す場合があります。そのレイヤー、このNNのアプリケーションなど で、彼/彼女の答えは、cantordustはELUとSELUのように、私は言及しなかったことを、他の活性化関数を指します。この情報は大歓迎です。ただし、アクティブ化関数が多いほど、非表示のレイヤーで使用する関数の選択に混乱が生じます。そして、コインを投げることがアクティベーション機能を選ぶ良い方法だとは思いません。

1
強化学習の例にドロップアウトレイヤーが表示されないのはなぜですか?
私は強化学習を検討しており、特にOpenAI Gym AIで使用するための独自の環境の作成をいじっています。stable_baselinesプロジェクトのエージェントを使用してテストしています。 ほぼすべてのRLの例で気付いたことの1つは、どのネットワークにもドロップアウトレイヤーが存在しないように見えることです。どうしてこれなの? 通貨価格をシミュレートする環境と、DQNを使用して、売買のタイミングを学習しようとする単純なエージェントを作成しました。1か月分の5分間の価格データからなる特定のデータセットから取得した、ほぼ100万時間を超えるトレーニングは、非常に適しているようです。次に、別の月のデータに対してエージェントとモデルを評価すると、わずかなパフォーマンスしか得られません。古典的なオーバーフィッティングのように聞こえます。 しかし、RLネットワークでドロップアウトレイヤーが表示されない理由はありますか?過剰適合を試みて対処する他のメカニズムはありますか?または多くのRLの例では問題ではありませんか?たとえば、「ブレイクアウト」ゲームで究極のハイスコアを達成するための真の方法は1つしかない可能性があるため、正確に学習し、一般化する必要はありません。 それとも、環境自体の無秩序な性質が、ドロップアウトレイヤーを用意する必要がない、結果のさまざまな組み合わせを提供するはずだと考えられていますか?

4
人工的に作られたメディアを認識するためのいくつかの戦術は何ですか?
偽の写真、偽のサウンドバイト、偽のビデオを安価に作成する能力が高まるにつれて、何が現実で何がそうでないかを認識することで問題が大きくなります。今でも、低コストで偽のメディアを作成するアプリケーションの例が多数あります(Deepfake、FaceAppなどを参照)。 明らかに、これらのアプリケーションが間違った方法で使用されると、他の人のイメージを傷つけるために使用される可能性があります。Deepfakeを使用すると、相手を不誠実に見せることができます。別のアプリケーションを使用して、政治家が物議をかもす何かを言ったように見せることができます。 人工的に作成されたメディアを認識して保護するために使用できるテクニックにはどのようなものがありますか?

2
生成的敵対ネットワークはどのように機能しますか?
私は生成的敵対的ネットワーク(GAN)について読んでいますが、それに関していくつかの疑問があります。これまでのところ、GANには2つの異なるタイプのニューラルネットワークがあることを理解しています。1つは生成的(GGG)で、もう1つは判別的(DDD)です。生成ニューラルネットワークは、判別ニューラルネットワークが正確性を判断するデータを生成します。GANは、損失関数を両方のネットワークに渡すことで学習します。 判別(DDD)ニューラルネットは、GGGによって生成されたデータが正しいかどうかを最初にどのように知るのですか?最初にDDDを訓練してからGANに追加する必要がありますかGGGますか? 90%の精度で写真を分類できる、訓練されたDDDネットを考えてみましょう。このDDDネットをGANに追加すると、10%の確率で画像が間違っていると分類されます。このDDDネットでGANをトレーニングすると、画像の分類で同じ10%エラーが発生しますか?はいの場合、GANが有望な結果を示すのはなぜですか?

1
ログファイル分析のためのAIの設計
既知の機器のエラーを見つけて、新しい障害パターンを見つけるAIツールを開発しています。このログファイルは時間ベースであり、既知のメッセージ(情報とエラー)があります。JavaScriptライブラリを使用しています。イベントドロップを使用してデータをソフトに表示していますが、実際の仕事と疑問は、既知のAIを見つけるためにAIをトレーニングする方法です。パターンと新しい可能なパターンを見つけます。私はいくつかの要件があります: 1-ツールは次のいずれかになります。追加の環境のインストールに依存していない、またはb。少ないほど良いです(完璧なシナリオは、スタンドアロンモードのブラウザーでツールを完全に実行することです)。 2-パターンアナライザを断片化する可能性、一種のモジュール性、エラーごとに1つのモジュール。 これを行うために推奨されるアルゴリズムの種類は何ですか(ニューラルネットワーク、遺伝的アルゴリズムなど)?JavaScriptを使用して動作する何かが存在しますか?そうでない場合、このAIを作成するのに最適な言語は何ですか?

2
深い残余ネットワークはネットワークのアンサンブルとして見られるべきですか?
問題は、Deep Residual Networks(ResNets)のアーキテクチャについてです。5つのメイントラックすべてで「大規模視覚認識チャレンジ2015」(ILSVRC2015)で1位を獲得したモデル: ImageNet分類:「超深層」(引用Yann)152層ネット ImageNet検出:2番目より16%優れています ImageNetローカリゼーション:2番目より27%優れています COCO検出:2回目より11%良好 COCOセグメンテーション:2番目より12%優れている 出典: MSRA @ ILSVRC&COCO 2015コンテスト(プレゼンテーション、2番目のスライド) この作業については、次の記事で説明しています。 画像認識のためのディープ残差学習(2015、PDF) マイクロソフトリサーチチーム(ResNetの開発者:Kaiming He、Xiangyu Zhang、Shaoqing Ren、Jian Sun)の記事: 「深い残余ネットワークにおけるアイデンティティマッピング(2016)」 深度が重要な役割を果たすことを述べる: 「私たちはこれらの結果を、シンプルですが本質的なコンセプトによって取得します—より深くします。これらの結果は、奥行きの限界を押し広げる可能性を示しています。」 それは彼らのプレゼンテーションでも強調されています(より深い-より良い): -「モデルが深いほど、トレーニングエラーが大きくなることはありません。」 -「より深いResNetの方がトレーニングエラーが少なく、テストエラーも少ない。」 -「より深いResNetの方がエラーが少ない。」 -「すべてがより深い機能からより多くの利益を得る–累積的な利益!」 -「より深い方が良い」 以下は、34層残差の構造です(参照用)。 しかし、最近私は、それらが指数アンサンブルであることを示す残差ネットワークの新しい解釈を導入する1つの理論を発見しました。 残余ネットワークは、比較的浅いネットワークの指数関数的集合です(2016) ディープレスネットは、さまざまな深度で出力がプールされる多くの浅いネットワークとして説明されています。記事に画像があります。説明付きで添付します: 残余ネットワークは従来、式(1)の自然な表現である(a)として示されます。この定式化を方程式(6)に展開すると、3ブロックの残差ネットワーク(b)の解明されたビューが得られます。このビューから、残差ネットワークには入力と出力を接続するO(2 ^ n)暗黙パスがあり、ブロックを追加するとパスの数が2倍になることは明らかです。 記事の終わりにそれは述べられています: それは深さではなく、残差ネットワークを強くするアンサンブルです。残りのネットワークは、ネットワークの深さではなく、ネットワークの多重度の限界を押し上げます。我々の提案された解明された見解と病変研究は、残余ネットワークが指数関数的に多くのネットワークの潜在的なアンサンブルであることを示しています。勾配に寄与するパスのほとんどがネットワークの全体的な深さに比べて非常に短い場合、深さの増加 だけでは、残余ネットワークの主要な特徴にはなりません。パスの数に関するネットワークの表現可能性である多重度が重要な役割を果たすと私たちは今考えています。 しかし、それは確認または反駁できる最近の理論にすぎません。一部の理論が反駁され、記事が取り下げられることが時々起こります。 結局、深いResNetをアンサンブルと考える必要がありますか?アンサンブルまたは深度により、残存ネットワークが非常に強くなりますか?開発者自身でさえ、自分のモデルが何を表しているのか、そしてその中の主要な概念は何であるかをまったく認識していない可能性はありますか?

1
どのような種類のニューラルネットワークが使用されていますか?
次のニューラルネットワークのチートシート(AI、ニューラルネットワーク、機械学習、ディープラーニング、ビッグデータのチートシート)を見つけました。 これらのさまざまな種類のニューラルネットワークは何に使用されますか?たとえば、回帰や分類に使用できるニューラルネットワーク、シーケンスの生成などに使用できるニューラルネットワークはどれですか。アプリケーションの概要(1〜2行)が必要です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.