AlphaZeroはAGIの例ですか?


11

arxiv.org に関する DeepMindの研究論文から:

このホワイトペーパーでは、AlphaZeroと呼ばれる同様の完全に一般的なアルゴリズムをチェスと将棋およびGoのゲームに適用します。ゲームのルール以外の追加のドメイン知識はありません。これは、汎用の強化学習であることを示しています。アルゴリズムは、多くの挑戦的な領域にわたって、表形式のラサ、超人的なパフォーマンスを達成できます。

これは、AlphaZeroがAGI(Artificial General Intelligence)の例であることを意味しますか?

回答:


11

良い質問!

  • AlphaZeroは、主要なマイルストーンですが、AGIではありません。

AlphaGoは、囲碁のゲームでは強力ですが、狭く強力(「強狭AI」)であり、単一の問題または問題のタイプ(囲碁および他の偶然ではない完全な情報ゲームなど)の強さと定義されます。

  • AGIは、少なくとも、人間が取り組んだり解決したりするすべての問題において、人間と同じくらい強力でなければなりません。

AGIは、人間のレベルを超える知能として定義される、スーパーインテリジェンスと関連付けられることがよくあります。

AGIは、人工知能としての人間と同じ機能ですべての人間の活動を実行できるAndroidを検討するという意味で、必ずしも超知性を意味するわけではありません。

しかし、技術的には、AlphaGoは単一の問題ですべての人間のパフォーマンスを上回っているという点で狭いスーパーインテリジェンスです。


狭いスーパーインテリジェンスはありません。これを弱いAIと呼びます:)。人間が生涯でMicrosoft WordまたはExcelの準最適なコンパイルを見つけることはできません-現代のマシンは数時間でそれを行う可能性があります。
Quonux 2019

@Quonux定義によると思う。ボストロムのスーパーインテリジェンスの定義は、人工知能にほぼ類似していますが、語源的に言えば、この用語自体は「より高いインテリジェンス」、つまり「上+インテリジェンス」を意味します。この基本的な定義では、「強い-狭いAI」は「狭いスーパーインテリジェンス」と同義であり、「強い」の元の定義はAGIであったため、AlphaGoの後、学者は「狭い」修飾子を使用し始めました。
DukeZhou

ここで私のポイントの@Quonuxの部分は、AlphaGoの出現により、単一のタスクで人間の能力を超えるAIの「弱い」という用語は、「厳密に狭いAI」に取って代わられたようです。
DukeZhou

2

正しくない可能性のある仮定

紙の調子で識別できる2つの仮定があります。

  • すべてのメンタルチャレンジは、固定ルールのゲームに限定できます。
  • 人間よりも優れた機械は、人間が本当に望んでいる、または必要としているものです。

質問には別の2つがあります。

  • 一般的な知性は人間に存在します1
  • それが人間に存在する場合、それはコンピュータで実行可能です。

4つすべてが真実である可能性がありますが、4つはどれも確実ではありません。

AlphaZeroの生産性

チェス盤がクローゼットのゲーム棚にあり、芝生が長く、芝刈り機が壊れている場合、AlphaZeroがヒューマノイドロボットに接続されている場合、タスクシーケンス用にエンコードされたゲームルールはありません。

  • その所有者の要求を聞いて、
  • ロボットを操り人形マスターする方法を学び、
  • すべてのツールとスペアパーツを見つけて特定し、
  • 芝刈り機の修理、および
  • 芝刈り機を使用する準備ができていることをお知らせください。

したがって、そのシナリオでは、それは私たちにとって特別な消費者の価値はありません。あまり一般的ではありません。

すでに機能している芝刈り機で芝生を刈ることができたとしても、それは価値があります。それは何にも勝つ能力を必要とせず、むしろ花壇の上を走らないために必要な人間以下の知性に従う能力を発揮する能力です。

DeepMindの賢い人々が、空白のスレートではなくラテン語の表ラサを使用することを選択したことはは注目に値しますが、エンコードされたルールと実際のゲームプレイのみを入力として3つのゲームをプレイすることを学ぶことができる学習プログラムを構築するほど印象的ではありません。

これらのゲームプログラムを製品分野で真に有用であると考えるために、毎回購入者を打ち負かすソフトウェアの購入に対する持続的な関心に頼ることはできません。AI製品が実行可能であるためには、学習機能は口語的に常識と呼ばれる能力を備えている必要があります。これには、ゲームの固定ルールよりもはるかに幅広く柔軟なドメイン知識が必要です。ゲームプレイ学習の勝利でマイルストーンを達成したほとんどの研究者がその方向に向かっていると推測できます。彼らも、彼らの研究成果が最終的に製品化されるか、購入可能なSaaSオファリングにつながる必要があることを知っています。

これらの進歩をデータセンターのスペースでリダイレクトして、がんやヘルペスを治療したり、糖尿病やアルツハイマー病を治したりするための治療的遺伝子治療を生み出すことができるかどうかは、分野外の人々にとって印象的です。それから、私たちは、私たちのバスルームを掃除するロボットを操り人形マスターすることができるダウンロードを私たちに提供しなかったことを研究者に許すことができました。AlphaZeroが「多くの困難な領域にわたる超人的なパフォーマンス」を示すことをAlphaZeroが十分に実証したことは、論文から明らかではありません。

彼らがやったことはまだ印象的であり、他の人たちも進歩してきた道筋に沿っています。これらの一般的なゲーム学習プログラムは速く学習できず、いくつかのゲームインスタンス内で私たちを倒すことができないゲームを発明しようとする人はほとんどいません。

展望で見た進歩

確かに、算術の実行、メールの分類、そして今やゲームプレイにおいて、人類の発明は彼の道具なしで裸の人間の能力を拡張します。その進歩により、コンピュータシステムはツールの領域にしっかりと配置されます。バックホーもある意味で超人的です。パイプなしで1キロのパイプを敷設してみてください。

逆に、人類はコンピューターのヘルスケアプロバイダーの役割を果たしています。彼らが病気になったり失敗したりした場合、私たちはウイルスやワームを追放するか、失敗した部品を交換せざるを得ません。そうでなければ、私たちの家や企業は混乱に陥ります。

テクノロジーは、すべてのものと同様に、視点で見られる必要があります。

人間がゲームに夢中になることやお互いを打ち負かすことが少なくなり、新しく発明されたツールで社会的および経済的問題を解決し、新しい問題を作成したり招待したりしない方法でそうすることに向けられた協調的な社会的行動により焦点を合わせることが賢明です新しい残虐行為。


脚注

一般的な知能として説明されているものが人間に存在することは、反対の証拠に基づいて異議を唱えられます。多くの人は、これらの戦略と傾向を、インテリジェントな人間に対する限界の証拠として引用します。

  • 平和戦略としての核抑止
  • 有限で重要な自然エネルギー資源の消費における節度の完全な欠如
  • 中毒パターンの密度がグローバルに増加し続ける
  • 地球上で6回目の大量絶滅を引き起こす

編集のおかげで、(少なくとも私にとっては)この方法の方が良く、回答の技術的な部分により重点を置いています。AGIを完全に合理的または高性能にする必要があるかどうかについては、おそらく別の質問があります。同様に、私たちが人間を保持したい個人またはグループの行動の基準は何ですか-質問が具体的に人工知能との比較に関するものでない限り、このサイトには当てはまりません。
Neil Slater
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.