タグ付けされた質問 「pattern-recognition」

4
人工的に作られたメディアを認識するためのいくつかの戦術は何ですか?
偽の写真、偽のサウンドバイト、偽のビデオを安価に作成する能力が高まるにつれて、何が現実で何がそうでないかを認識することで問題が大きくなります。今でも、低コストで偽のメディアを作成するアプリケーションの例が多数あります(Deepfake、FaceAppなどを参照)。 明らかに、これらのアプリケーションが間違った方法で使用されると、他の人のイメージを傷つけるために使用される可能性があります。Deepfakeを使用すると、相手を不誠実に見せることができます。別のアプリケーションを使用して、政治家が物議をかもす何かを言ったように見せることができます。 人工的に作成されたメディアを認識して保護するために使用できるテクニックにはどのようなものがありますか?

2
深い残余ネットワークはネットワークのアンサンブルとして見られるべきですか?
問題は、Deep Residual Networks(ResNets)のアーキテクチャについてです。5つのメイントラックすべてで「大規模視覚認識チャレンジ2015」(ILSVRC2015)で1位を獲得したモデル: ImageNet分類:「超深層」(引用Yann)152層ネット ImageNet検出:2番目より16%優れています ImageNetローカリゼーション:2番目より27%優れています COCO検出:2回目より11%良好 COCOセグメンテーション:2番目より12%優れている 出典: MSRA @ ILSVRC&COCO 2015コンテスト(プレゼンテーション、2番目のスライド) この作業については、次の記事で説明しています。 画像認識のためのディープ残差学習(2015、PDF) マイクロソフトリサーチチーム(ResNetの開発者:Kaiming He、Xiangyu Zhang、Shaoqing Ren、Jian Sun)の記事: 「深い残余ネットワークにおけるアイデンティティマッピング(2016)」 深度が重要な役割を果たすことを述べる: 「私たちはこれらの結果を、シンプルですが本質的なコンセプトによって取得します—より深くします。これらの結果は、奥行きの限界を押し広げる可能性を示しています。」 それは彼らのプレゼンテーションでも強調されています(より深い-より良い): -「モデルが深いほど、トレーニングエラーが大きくなることはありません。」 -「より深いResNetの方がトレーニングエラーが少なく、テストエラーも少ない。」 -「より深いResNetの方がエラーが少ない。」 -「すべてがより深い機能からより多くの利益を得る–累積的な利益!」 -「より深い方が良い」 以下は、34層残差の構造です(参照用)。 しかし、最近私は、それらが指数アンサンブルであることを示す残差ネットワークの新しい解釈を導入する1つの理論を発見しました。 残余ネットワークは、比較的浅いネットワークの指数関数的集合です(2016) ディープレスネットは、さまざまな深度で出力がプールされる多くの浅いネットワークとして説明されています。記事に画像があります。説明付きで添付します: 残余ネットワークは従来、式(1)の自然な表現である(a)として示されます。この定式化を方程式(6)に展開すると、3ブロックの残差ネットワーク(b)の解明されたビューが得られます。このビューから、残差ネットワークには入力と出力を接続するO(2 ^ n)暗黙パスがあり、ブロックを追加するとパスの数が2倍になることは明らかです。 記事の終わりにそれは述べられています: それは深さではなく、残差ネットワークを強くするアンサンブルです。残りのネットワークは、ネットワークの深さではなく、ネットワークの多重度の限界を押し上げます。我々の提案された解明された見解と病変研究は、残余ネットワークが指数関数的に多くのネットワークの潜在的なアンサンブルであることを示しています。勾配に寄与するパスのほとんどがネットワークの全体的な深さに比べて非常に短い場合、深さの増加 だけでは、残余ネットワークの主要な特徴にはなりません。パスの数に関するネットワークの表現可能性である多重度が重要な役割を果たすと私たちは今考えています。 しかし、それは確認または反駁できる最近の理論にすぎません。一部の理論が反駁され、記事が取り下げられることが時々起こります。 結局、深いResNetをアンサンブルと考える必要がありますか?アンサンブルまたは深度により、残存ネットワークが非常に強くなりますか?開発者自身でさえ、自分のモデルが何を表しているのか、そしてその中の主要な概念は何であるかをまったく認識していない可能性はありますか?

3
ニューラルネットワークを使用して行列のパターンを認識する
CADモデルの設計機能(スロット、ボス、穴、ポケット、ステップ)を識別できるニューラルネットワークを開発しようとしています。 ネットワークに使用する入力データは、axnマトリックスです(nはCADモデルの面の数です)。マトリックスの右上の三角形の「1」は、2つの面の間の凸関係を表し、左下の三角形の「1」は、凹関係を表します。両方の位置のゼロは、面が隣接していないことを意味します。以下の画像は、そのようなマトリックスの例を示しています。 ネットワークへの入力を一定のサイズにするために、最大モデルサイズを20面に設定し、それよりも小さいものにパディングを適用するとします。 5つの異なる設計機能を認識できるようにしたいので、5つの出力ニューロンを持ちます-[スロット、ポケット、穴、ボス、ステップ] これが一種の「パターン認識」問題になると言ってもいいでしょうか?たとえば、ネットワークに、モデルに存在する設計機能を説明するラベルとともにいくつかのトレーニングモデルを提供すると、ネットワークは、特定の設計機能に関連するマトリックスで表される特定の隣接パターンを認識することを学習しますか? 私は機械学習の完全な初心者であり、このアプローチが機能するかどうかを把握しようとしています。問題を理解するためにさらに情報が必要な場合は、コメントを残してください。どんな入力やヘルプもありがとうございます。

2
ロゴ検出にAIまたはニューラルネットワークを使用する
私はビデオファイル内のTVチャネルのロゴを検出しようとしています。そのため、単純に入力.mp4ビデオを与え、そのロゴが特定のフレーム、たとえば最初のフレームにあるかどうかを検出します。 事前にそのロゴがあり(%100と同じサイズではない場合があります)、場所は常に固定されています。 私はすでにパターンマッチングベースのアプローチを採用しています。ただし、そのためには、パターンを同じサイズの100%にする必要があります。それを実現するために、ディープラーニングとニューラルネットワークを使用したいと思います。どうやってやるの?CNNの方が効率が高いと思いますか?

3
画像の視覚的注意領域を検出する
特定の画像の視覚的な注意領域を検出し、その領域に画像をトリミングしようとしています。たとえば、任意のサイズの画像と、たとえばLxW寸法の長方形を入力として、最も重要な視覚的注意領域に画像をトリミングします。そのための最先端のアプローチを探しています。 それを実装するためのツールやSDKはありますか?コードまたはアルゴリズムのどの部分も本当に役立ちます。

5
CPUのキャッシュパフォーマンスのデータセット内のパターンを識別するために使用できる機械学習アルゴリズムはどれですか。
CPUのキャッシュパフォーマンスの詳細を含むデータセット(CSVファイルに保存されている)のパターンを識別するための機械学習アルゴリズムが必要です。具体的には、データセットのような列が含まれReadhits、ReadmissまたはWritehits。 アルゴリズムが識別するパターンは、次の点で役立ちます。 次回、ユーザーがワークロードのパフォーマンスを向上できるようにします。 機能に基づいて問題を特定するのに役立つ、または ユーザーがパターンに基づいて発生する可能性のある将来のデータ値または将来のイベントを予測するのに役立ちます。 どのMLアルゴリズムを使用できますか?

1
要約に役立つ人工知能戦略は何ですか?
要約したい段落がある場合、たとえば: ポンツォとフィラは日中にモールに行きました。彼らは長い間歩き、お店に立ち寄った。彼らは多くの店に行きました。最初は何も買わなかった。多くの店に行った後、最終的にシャツとズボンを購入しました。 次のように要約すると: 彼らは今日ショッピングモールで買い物をし、いくつかの服を買いました。 もしあれば、このプロセスを自動化するための最良のAI戦略は何ですか?ない場合、それはアルゴリズムを通知する外部情報リソースを最初に持っていることに依存しているためでしょうか?それとも、問題は本質的に文脈に依存しているからでしょうか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.