タグ付けされた質問 「artificial-intelligence」


5
ポリシー外学習とポリシー上学習の違いは何ですか?
人工知能の Webサイトでは、ポリシー外学習とポリシー上学習を次のように定義しています。 「ポリシー外の学習者は、エージェントのアクションとは無関係に最適なポリシーの値を学習します。Qラーニングは、ポリシー外の学習者です。ポリシー上の学習者は、探索ステップを含め、エージェントによって実行されるポリシーの値を学習します」 これらは私には何の違いももたらさないようですので、これについてあなたの説明をお願いしたいと思います。どちらの定義も同じように見えます。私が実際に理解したことは、モデルなしの学習とモデルベースの学習であり、それらが問題の学習と関係があるかどうかはわかりません。 エージェントのアクションとは無関係に最適なポリシーを学習することはどのように可能ですか?エージェントがアクションを実行するときにポリシーは学習されませんか?

4
人工ニューラルネットワークから人間の脳について何を学ぶことができますか?
私の質問/タイトルはあまり具体的ではないことを知っているので、それを明確にしようとします: 人工ニューラルネットワークの設計は比較的厳密です。もちろん、一般的に、それらは生物学の影響を受け、実際のニューラルネットワークの数学的モデルを構築しようとしますが、実際のニューラルネットワークの理解は正確なモデルの構築には不十分です。したがって、正確なモデルや、実際のニューラルネットワークに「近い」ものは考えられません。 私の知る限り、すべての人工ニューラルネットワークは実際のニューラルネットワークからはかけ離れています。生物学には、標準の古典的な完全に接続されたMLPは存在しません。リカレントニューラルネットワークには実際の神経可塑性がないため、RNNの各ニューロンには同じ「フィードバックアーキテクチャ」がありますが、実際のニューロンは情報を個別に保存および共有します。畳み込みニューラルネットワークは効果的で人気がありますが、(たとえば)人間の脳の画像処理はごく少数の畳み込み層で構成されていますが、最新のソリューション(GoogLeNetなど)はすでに数十層を使用しています... 、彼らは人間のパフォーマンスにも近くありません。特に、実際のニューラルネットワークと比較して、かなりの量のレイヤーとデータ削減が必要なため、「レイヤーごとのパフォーマンス」を考える場合。 さらに、私の知る限り、モジュール式の自己拡張/自己再構築人工ニューラルネットワークでさえ、実際のニューラルネットワークの巨大な適応性と比較してかなり「固定的かつ静的」です。生物学的ニューロンには通常、ニューロンを非常に多様な異なる領域や他のニューロンに接続する数千の樹状突起があります。人工ニューラルネットワークは、はるかに「単純」です。 それでは、人間の脳/実際のニューラルネットワークについて、人工ニューラルネットワークから学べることはありますか?それとも、古典的な静的アルゴリズムよりも優れたパフォーマンスを発揮するソフトウェアを作成しようとするだけなのでしょうか(あるいは、そのようなアルゴリズムが失敗するようなことをするのでしょうか)。 誰かがこのトピックに関する(できれば科学的な)情報源を提供できますか? 編集:より多くの回答が高く評価されています(:

4
専門家は有害ですか?
「人工知能研究におけるチェスの役割」(pdf)を読んでいて、興味深いことに、 経験[...]は、チェスの専門家からの入力は、一般的には有用ですが、完全には信頼できないことを示唆しています。 これの良い例は、Deep Thoughtの評価関数です。有能な人間のチェスの専門家によるいくつかの変更は、大幅な改善に失敗し、マシンのパフォーマンスに悪影響を与えることさえありました。 ここでは、人間の専門家が彼らの専門知識と一緒に、彼ら自身の偏見をプログラムに導入しました。この問題を解決する1つの方法は、プログラムに許可されるエキスパート入力のタイプと量を制限することです。他の人はほとんど「知識のない」マシンを持っています。 現代の研究と実践において、それはどの程度真実ですか? それは大きな問題ですか、それともチェスのゲームに特有の何かですか?

1
複数の時系列データでLSTMモデルをトレーニングする方法は?
複数の時系列データでLSTMモデルをトレーニングする方法は? 使用例:過去5年間、毎週20,000人のエージェントの売上があります。各エージェントの今後の週次売上を予測する必要があります。 バッチ処理手法に従う必要がありますか?一度に1つのエージェントを取得し、LSTMモデルをトレーニングしてから予測しますか?もっと良い方法は?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.