タグ付けされた質問 「automated-theorem-proving」

自動定理証明とは、コンピュータプログラムによる数学的定理の証明です。

2
P = NPの場合、Goldbachの予想などの証明を取得できますか?
これは私の専門知識のうち、素朴な質問です。事前におaび申し上げます。 数学のゴールドバッハの予想や他の多くの未解決の質問は、述語計算の短い公式として書くことができます。たとえば、クックの論文「コンピューターは数学的証明を日常的に発見できるか?」その推測を ∀ N [ (N > 2 ∧ 2 | N )⊃ ∃ R ∃ S (P(R )∧ P(S )∧ N = R + S )]∀n[(n>2∧2|n)⊃∃r∃s(P(r)∧P(s)∧n=r+s)]\forall n [( n > 2 \wedge 2 | n) \supset \exists r \exists s (P(r) \wedge P(s) \wedge n = r + s) …

1
TCS定理の合理的な自動証明システムはありますか?
マシンがチェックできるように、停止問題に関するチューリングの証明を形式化したいとします。有名な自動定理証明システムには、Mizar、Coq、HOL4などがあります。Coqをダウンロードして実験しましたが、Turingマシン用のライブラリがありません。私は自分でコーディングしようと思ったが、チュートリアルが欠けており、言語を習得するのが難しいことがわかった。 私の質問は次のとおりです。チューリング機械を含む定理を証明するのに一般的に優れている自動化された定理証明器はありますか?既に存在するライブラリを使用して、停止する問題の決定不能性の証明を形式化できれば、そのような定理証明者は「良い」と考えます。比較的簡単に手に入れることができれば、さらに良いと考えます。(記録のために、私は通常、プログラミング言語に問題はありません。) おかげで、 フィリップ


2
コンピューターが何かを証明するのがなぜそんなに難しいのですか?
これはばかげた質問と考えられます。私はコンピューターサイエンスの専攻ではありません(また、数学の専攻でもありません)。以下の質問にいくつかの主要な誤った仮定が表示されていると思われる場合はご容赦ください。 Fermatの最終定理を公式化する計画がありますが(このプレゼンテーションを参照)、コンピューターがピタゴラスのような「単純な」定理さえ証明できることを読んだり聞いたことはありません。 何故なの?一部の「組み込みの公理」によってのみ支援される、コンピューターによって完全に自律的な証明を確立することの背後にある主な困難は何ですか。 2番目の質問は、次のとおりです。コンピューターが単独で定理を証明することは現在不可能であるのに、なぜ多くの証明を形式化できるのですか?なぜそれが「難しい」のですか?

1
証明に「高次推論手法」が必要かどうかを判断する方法は?
質問: 公理と目標からなる問題の仕様があると仮定します(つまり、関連する証明問題は、すべての公理が与えられた場合に目標が満たされるかどうかです)。また、問題には公理間の矛盾や矛盾は含まれないと仮定します。問題を証明するには「高次の推論」が必要であることを事前に(つまり、完全な証明を構築せずに)決定する方法はありますか? 「高次の推論」とは、高次のロジックを書き留める必要がある証明手順を適用することを意味します。「高次推論」の典型的な例は帰納法です。原則として帰納法を書き留めるには、高次論理を使用する必要があります。 例: 「2つの自然数の加算は可換ですか?」という証明問題を指定できます。一次論理を使用する(つまり、コンストラクターzero / succを使用して自然数を定義し、標準公理とともに、「プラス」関数を再帰的に定義する公理と一緒に定義する)。この問題を証明するには、 "plus"の最初の引数または2番目の引数の構造の帰納が必要です( "plus"の正確な定義に依存)。入力問題の性質を分析するなどして、証明しようとする前にこれを知っていましたか?(もちろん、これは説明のための単なる例です-実際には、これはプラスの可換性よりも難しい証明問題にとって興味深いでしょう。) もう少しコンテキスト: 私の研究では、Vampire、eproverなどの自動化された1次定理証明を適用して、証明問題(または証明問題の一部)を解決しようとすることがよくあります。多くの場合、証明者は証明を思いつくのにかなりの時間を必要とします(ただし、1次推論手法のみを必要とする証明がある場合)。もちろん、高次の推論を必要とする問題に一次定理証明器を適用しようとすると、通常はタイムアウトになります。 したがって、証明問題が高次の推論手法を必要とするかどうかを事前に伝えることができる方法/技術があるかどうか疑問に思っていました)少なくとも、特定の入力の問題のために。 私は自分の質問に対する答えを文献で探し、定理の分野の仲間の研究者にそれについて証明しましたが、今のところ、良い答えはありませんでした。私の期待は、インタラクティブな定理証明と自動化された定理証明(Coqコミュニティ?Isabelleコミュニティ(Sledgehammer)?)を組み合わせようとする人々からのこのトピックに関する研究があることです。 一般に、ここで概説した問題は決定できないと思います(そうですか?)。しかし、問題の洗練されたバージョンには良い答えがあるかもしれません...?

1
述語メタ理論における命令システムの論理関係
System FのようなImpredicative言語の論理関係は、アンビエントロジックのimpredicativityに大きく依存しているようです。特に、forall-typeの解釈は、すべての型付き関係に関して定義されます。命令型システム(CiC / Coqなど)では問題ありませんが、予測型システム(Agdaなど)では不可能なようです。 これをどのように行うことができますか?たとえば、AgdaのSystem Fの正規化をどのように証明しますか?独自の不可解な宇宙を構築する必要がありますか?

6
ラベル付き遷移システムの実際に計算可能なプロパティとは何ですか?
ラベル付き遷移システムは、アプリケーションに適したモデルであることがわかりました。つまり、LTSを使用したユースケースのモデリングに関する論文があります。問題は、LTSについて簡単に証明できることです。既存のソリューションを再利用して、それらが私の用途に役立つかどうかを確認したいと思います。LTS(およびユースケース)のどのプロパティを簡単に自動的に証明できるかを知りたいので、ユースケースの問題に実際的な対応物があるかどうかを判断できます。

2
モナドクラスの最先端?
決定問題の単項クラスとしても知られる単項一次論理では、すべての述語が1つの引数を取ります。アッカーマンによって決定可能であることが示されており、NEXPTIME-completeです。 ただし、SATやSMTなどの問題には、理論的な限界にもかかわらず、それらを解決するための高速アルゴリズムがあります。 私は疑問に思っています、一次論理のSAT / SMTに類似した研究はありますか?この場合の「最先端」とは何ですか?また、最悪の場合に理論的な限界に達したにもかかわらず、実際には効率的なアルゴリズムはありますか?

2
Principia Mathematicaスタイルの形式化に適した自動定理証明のパラダイムは何ですか?
ラッセルのPrincipia Mathematica(PM)と論理的実証主義に触発された本を所有しており、公理を決定し、それらから定理を導き出すことにより、特定の領域を形式化しようとします。要するに、PMが数学のためにしようとしたことを、そのドメインのためにしようと試みます。PMと同様に、自動定理証明(ATP)が可能になる前に作成されました。 私はこれらの公理を現代のATPシステムで表現し、最初に著者が(手で)推定した定理を推定しようとしています。私は以前にATPシステムを使用したことがなく、それぞれの長所、短所、意図したアプリケーションを備えた豊富なオプション(HOL、Coq、Isabelleなど)を与えられたので、自分の特定の目的。 著者の形式主義はPMを密接に反映しています。クラス(セット?)、クラスのクラスなど、最大6レベルの階層があります。一次、そしておそらく高次のロジックがあります。PMとの関係を考慮して、私は最初にMetamathを調査しました。PMのいくつかの定理が他の人々によってMetaMathで証明されたからです。ただし、MetamathはもちろんATPシステムではなく証明検証者です。 さまざまなATPシステムの説明を見ると、教会の型理論、建設型型理論、直観型型理論、型付き/型なし集合理論、自然演duction、ラムダ計算のタイプ、多型、再帰関数理論、平等の存在(またはそうでない)。要するに、各システムは非常に異なる言語を実装しているようであり、異なるものを形式化するのに適切でなければなりません。数学を形式化するための既存のライブラリは、私の目的には関係ないと思います。 ATPを選択する際に私が求めるべき特性に関するアドバイス、またはこの質問を読んだ後にあなたが持つかもしれないその他のアドバイスは大歓迎です。参考のために、ここに本のサンプルページを示します。残念ながら、PMと同様に、これはペアノ​​ラッセル表記法です。 本- 「生物学における公理的方法」(1937)、JH Woodger、A。Tarski、WFフロイド 公理は単なる意味論から始まります。例えば、 1.1.2の和である場合の部分に含まれる、および場合ならば任意の一部であり常にある に属するの部分と共通する部分を有し:xxxαα\alphaαα\alphaxxxyyyxxxzzzαα\alphayyy S=Dfx^α^{α⊂P‘→x:.(y):yPx.⊃.(∃z).z∈α.P‘→y∩P‘→z≠Λ}S=Dfx^α^{α⊂P‘→x:.(y):yPx.⊃.(∃z).z∈α.P‘→y∩P‘→z≠Λ}S{ = }_{ Df }\hat { x } \hat { \alpha } \{ \alpha \subset \vec { { P }^{ ‘ } } x:.(y):yPx.\supset .(\exists z).z\in \alpha .\vec { { P }^{ ‘ } } y\cap \vec { …

3
コンピューターが発見した証拠
1996年、長年の未解決の問題がコンピューターによって解決されました。すなわち、ロビン代数とブール代数は同じです。この証明は、自動定理証明者によって発見されました。 さらに、4色定理の既知の証明には、コンピューター生成コンポーネントが含まれています。 この質問の目的は、コンピューターによって(完全または部分的に)発見された証拠(既知の唯一の証拠または初めて発見された証拠)をリストすることです。


1
プルーフキャリーコードでプルーフチェッカーが必要な理由
Neculaによる古典的なPLDI'98論文「認証コンパイラの設計と実装」では、高レベルの検証者は以下を使用しています。 検証条件を生成するVCGen(安全述語) 条件を証明する一次論理定理証明者 ステップ(2)からの証明をチェックするLF証明チェッカー 手順(3)で少し混乱しています。なぜそれが必要なのですか?(1)と(2)だけでは不十分でしょうか?定理の証明者によって生成された証明を信頼しないのはなぜですか?

1
有限モデルを持たない一次充足可能性
教会の定理から、一次の充足可能性を決定することは一般に決定不可能であることがわかっていますが、一次の充足可能性を決定するために使用できるいくつかの手法があります。最も明白なのは、有限モデルを検索することです。ただし、一次論理には有限モデルがないことを示すことができるステートメントがいくつかあります。たとえば、単射関数と非全射関数が動作するドメインは無限です。 有限モデルがないか、有限モデルの存在が不明である場合の1次ステートメントの充足可能性をどのように実証しますか?自動化された定理証明では、いくつかの方法で充足可能性を判断できます。 文を否定し、矛盾を探すことができます。見つかった場合は、ステートメントの1次の有効性、つまり満足度を証明します。 解像度の飽和を使用しており、推論が不足しています。多くの場合、推論の量は無限にあるため、これは信頼できません。 モデルの存在と理論の一貫性を前提とする強制を使用できます。 自動化された定理証明の機械化された手法として強制を実装している人は誰も知りませんし、簡単に見えませんが、それが行われたか試みられたかは、多くのステートメントの独立性を証明するために使用されているため、興味があります。集合論では、それ自体は有限モデルを持ちません。 自動推論に適用できる一次の充足可能性を検索するために知られている他の技法はありますか、または自動強制アルゴリズムに取り組んだ人はいますか?

1
Martin-LöfType Theoryは、証明可能な正しいコードを作成するためのより大きな能力につながりますか?
この投稿は、カリーハワード同型写像とマーティン・ロフ型理論に言及しています。 ポストは、数学の記述言語とコンピュータプログラミングの操作ベースの言語との間の将来の「統一」の主張をします。 私の質問は: これらのアイデアは、(言語を通じて)証明可能な正しいコードを書くためのより良い能力につながりますか? MLTTの完全な影響が理論的なレベルで発見されましたか? この投稿では、COQやAgdaですでに実行できなかったことが説明されていますか?

1
代数としてのチューリング機械
代数の枠組みの中で状態に基づく計算のダイナミクスを表現する方法についての調査を書いてみたいです。これまでのところ、DFA、NFA、ミーリーマシン、ムーアマシン、文脈自由文法、さらには単純な量子システムの代数表現に関する論文を見つけることができました。チューリングマシンを代数として表すための適切な情報源は見つかりませんでした。 どんな情報源/考え? ありがとう!
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.