チューリングテストの特定の要件


9

チューリングテストの具体的な要件は何ですか?

  • テストを行う資格を得るために評価者が満たさなければならない場合、どのような要件がありますか?
  • 会話には常に2人の参加者(1人は人間、1台はコンピュータ)が必要ですか、それともそれ以上の参加が可能ですか?
  • プラセボテスト(実際にはコンピュータが関与していない場合)は許可または推奨されますか?
  • 複数の評価者がいますか?その場合、マシンがテストに合格するためには、すべての評価者の間で全会一致の決定が必要ですか?

回答:


9

「チューリングテスト」は、一般に、1951年の同名の論文で提案されたイミテーションゲームのアランチューリングの更新版を意味すると解釈されます。初期のバージョンには人間(男性または女性)とコンピューターがあり、裁判官はどちらがどちらであるか、そして人間の場合はどちらの性別であるかを決定しなければなりませんでした。それらが50%未満で正しかった場合、そのコンピューターは「インテリジェント」であると見なされました。

現在一般に受け入れられているバージョンでは、1人の競技者と、それが人間か機械かを判断する裁判官だけが必要です。ですから、人間をプラセボと見なすと、これがプラセボになる場合があります。

最初と4番目の質問は関連しています。厳密なガイドラインはありません。コンピュータがより多くの裁判官をだますことができるならば、もちろんそれはより良いAIと考えられます。

トロント大学のこの論文には、チューリングに関する妥当性のセクションがあり、チューリングテストが関連しない理由(人間も失敗する可能性がある)に関するジェイソンハッチェンスの解説と、チューリングの正式なインスタンス化であるローブナー賞へのリンクが含まれていますテスト。


2

ここには本当に2つの質問があります。1つは、「チューリング自身が述べたように、元のチューリングテストの特定の要件は何でしたか?」もう1つは、「最新のチューリングテストの特定の要件はどうあるべきか」です。チューリングの日以来、状況は大きく進歩しており、現在の理解を反映するように彼のテストを拡張/変更することを検討するのは合理的だと思います。

最初の質問の答えは調べるのが簡単なので、興味深いのは2番目の質問だと思います。インテリジェンスを決定するためのテストはどのようにすべきですか?それを念頭に置いて、私はOPが提起する4つの質問すべてに対する答えは「依存する」と思います。私は完璧なチューリング検定をどのように構成するかについて普遍的なコンセンサスがあるとは思わないので、与えられた実験者は彼/彼女が望むものを本当に自由に設定することができます。

もちろん、これはすべて、チューリングテストまたはチューリングテストのようなテストが実際に価値があるという仮定に基づいています。それは必ずしも所定のことではありません。ある程度、私たちが話しているのは、偽りの並外れた能力を持つAIの設計だと考えてください!つまり、質問者が単に「あなたは人間ですか」と尋ねることが許可されていると仮定すると、テストに合格したい場合、AIは嘘をついていると想定する必要があります。ですから、人は正しく質問するかもしれませんが、嘘をつくのが本当に上手になるシステムを設計することは、AIへの価値あるアプローチですか?


0

相対性理論を理解したい場合は、アインシュタイン1,2を読んでください。彼が理解していると思っている教授が書いた相対性理論に関する本ではありません。人間の対話の文脈でのアランチューリングの知能テストを理解したい場合は、チューリングをお読みください。3 解釈は価値がないよりも悪い場合があります。彼らはしばしば誤解を招くものです。原則が厚すぎると思われる場合は、理解するまでもう一度読んでください。

人間の対話の文脈におけるチューリングの知能のテストの場合、それを完全に理解するために、チューリングが書いたとき、1950年の記事を読むと明らかになる次の背景が想定されます。

  • チューリングの完全性定理はカートゲーデルの2番目の不完全性定理にどのように応答するか
  • 制御されたテストの戦略
  • (a)聞くことと話すこと、(b)聞くことと機敏に反応することの違い—チャットボットは(a)を行い、(b)を行うことから5〜500年離れている可能性があるため、今日これは特に適切です。(c)インスピレーションで深く理解し対応するために、AI研究者は人間の心のモデル化を超えて、ゲーデル、アインシュタイン、チューリングなどの人々の心のモデル化の課題に取り組む必要があります。それが起こるかどうかはまだ明らかにされていない。

模倣ゲーム、思考実験の説明の上にあるアランチューリングのサブタイトルの特定の要件は、記録の問題です。

特定の要件[実際の記事からの抜粋]

【イミテーションゲーム】は、男性(A)、女性(B)、尋問者(C)の3人で行われ、どちらの性別でもかまいません。質問者は他の2人の前の部屋にとどまります。質問者のためのゲームの目的は、他の2つのうちどちらが男性でどちらが女性であるかを判別することです。彼はXとYのラベルでそれらを知っており、ゲームの最後に「XはAであり、YはBである」または「XはBであり、YはAである」と言います。質問者はAとBに質問を送ることができます。

C:Xは髪の毛の長さを教えてくれませんか?

ここで、Xが実際にはAだとすると、Aは答える必要があります。ゲームでのAの目的は、Cに誤った識別を行わせることです。したがって、彼の答えは次のようになります。

「私の髪は帯状疱疹で、最長のストランドは約9インチの長さです。」

声のトーンがインテロゲーターを助けないようにするために、答えは書かれるべきです。理想的な配置は、2つの部屋の間で通信するテレプリンターを使用することです。あるいは、質問と回答を仲介者が繰り返すこともできます。3番目のプレーヤー(B)のゲームの目的は、質問者を助けることです。

彼女にとって最善の戦略は、おそらく真実の答えを出すことです。彼女は「私は女性です、彼の言うことを聞かないでください!」などを追加できます。彼女の答えには、しかし、男性が同様の発言をすることができるので、それは何も役に立ちません。

次に、「このゲームでマシンがAの役割を担うとどうなりますか?」という質問をします。男性と女性の間でゲームが行われるときと同じように、ゲームがこのようにプレイされるとき、尋問者は誤った判断をしますか?これらの質問は、私たちの元の「機械は考えることができますか?」を置き換えます。

アインシュタインの相対性理論とチューリングの検定の両方について何千もの批判がありましたが、どれも多くの価値をもたらしません。偉大な貢献者の考えを自分の言葉で研究します。それに続くすべての拒否は、主に偉大さの欠如で興味深いものになります。

このスレッドの二次質問

テストを行う資格を得るために評価者が満たさなければならない場合、どのような要件がありますか?

質問者(C)は評価者ではありません。評価は客観的であろうとする試みですが、チューリングの思考実験の前提は、質問者が彼女または彼の主観的な判断を提供することです。統計の観点から、質問者は(A)と(B)と話し言葉を共有する世界の人口からランダムに選択されるべきです。

会話には常に2人の参加者(1人は人間、1台はコンピュータ)が必要ですか、それともそれ以上の参加が可能ですか?

Alan Turingによって説明されたシナリオに適合するには、正確に2つある必要があります。(詳細については、以下を参照してください。)

プラセボテスト(実際にはコンピュータが関与していない場合)は許可または推奨されますか?

あらゆるものをテストすることができますが、研究者はそうしますが、それはチューリングの思考実験の範囲外です。4

複数の評価者がいますか?その場合、マシンがテストに合格するためには、すべての評価者の間で全会一致の決定が必要ですか?

実際の模倣ゲームを後援する人々に最も多くの情報を明らかにするのは、(A)、(B)、および(C)がランダムにそれらの男性、女性、またはソフトウェアのサンプルから抽出される二重盲検完全無作為化テストでしょう共通言語で会話できるテスト対象のタイプのシステム。テストはサンプルからランダムに選択して何度も実行されます。

テストで指定されたもの以外の全会一致、評価、追加の複雑さ、およびコミュニケーションは、「コンピュータは考えられるか?」という質問に関するチューリングの当初の意図に固執する場合にのみ、原因を苛立たせます。

知性の他の見方

チューリングは、マシンがチューリングのイミテーションゲームのあまり制御されていないバージョンを通過しないと述べたルネデカルトがそうであったように、対話のレンズを通して知性を見ました。他の人々は、対話以外の種類の対話と他の文脈を考慮しました。私は別の質問でこれに対処しました:

脳は身体なしで知性を発揮できるでしょうか?

参照と脚注

[1] 相対性理論:アルバート・アインシュタインによる特殊および一般理論、1916

[2] アルベルトアインシュタインとフランシスA.デイビスによる相対性理論の原理、1923年

[3] AM Turing(1950)Computing Machinery and Intelligence。マインド49:433-460。 https://www.csee.umbc.edu/courses/471/papers/turing.pdf

[4]チューリングの1950年の記事は、彼の思考実験を具体化し、将来のAIシステムの商業的検証に使用することを推奨していませんでした。しかし、アランチューリングは、キャリアのある特定の時点で、実用的なコンピューティングに関心を持っていました。そのとき、ナチスはフランスを制圧し、故郷を空中から粉砕し、イギリス海軍のかなりの部分をエニグマ暗号の助けを借りて下から沈めました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.