理論計算機科学における一般的な誤った信念

62

10/12/08に編集：

質問を修正して、より多くの人が意見を共有できるようにしましょう。あなたの貢献が必要です！

この投稿は、MOの1つに触発されています：数学における一般的な誤った信念の例。大きなリストは、品質を制御するのが難しい膨大な数の回答を生成する場合がありますが、MOに関する関連記事が成功した後、TCSの一般的な誤った信念のリストを作成することが役立つと確信しています。

それでも、このサイトは研究レベルの質問に答えるために設計されているため、ような例は非多項式時間を意味するので、リストに載せないでください。その間、難しくないかもしれないいくつかの例が欲しいが、詳細に考えることなく、それは同様に合理的に見える。この例は教育的なものであり、通常は対象を初めて勉強するときに表示されます。 $\mathsf{NP}$

この分野で勉強している人々に見える、理論的なコンピューターサイエンスにおける一般的な誤った信念のいくつかの（自明でない）例は何ですか？

正確に言うと、TCSの驚くべき結果や直感に反する結果とは異なる例が必要です。この種の結果は人々を信じ難くさせますが、それは真実です。ここでは、人々は一見真実であると思われるかもしれないが、より深く考えた後、内部の欠陥が暴露されるという驚くべき例を求めています。

リストの適切な回答の例として、これはアルゴリズムとグラフ理論の分野から来ています。

以下のために -nodeグラフ、 -EDGEセパレータサイズのエッジの部分集合であるのノード、それぞれがせいぜいで構成され、2つの隣接していない部分に分割することができるノード。次の「補題」があります。 $n$ $G$ $k$ $S$ $k$ $G \setminus S$ $3n/4$

ツリーには1エッジのセパレータがあります。

右？

big-list examples

— Hsien-Chih Chang張顯之
ソース

投稿にはCWとしてリクエストするようフラグが設定されています。

— Hsien-Chih Chang張顯之

59

これは計算幾何学では一般的ですが、他の地域では風土病です。実際のRAMのアルゴリズムは、効率を損なうことなく整数RAMに転送できます（問題の整数制限のため）。 標準的な例は、「ガウス消去が時間で実行される」という主張です。実際、不注意な消去命令は、指数関数的に多くのビットを持つ整数を生成できます。 $O(n^3)$

さらに悪いことですが、残念ながら一般的です：フロア機能を備えた実際のRAMのアルゴリズムは、効率を損なうことなく整数RAMに転送できます。 実際、リアルRAM +フロアは、PSPACEまたは#Pの問題を多項式のステップ数で解決できます。

— ジェフス
ソース

5

ガウス消去法の誤解は非常に広まっています。おそらく問題の一部は、有限フィールドで作業することが多いことであり、そこには問題がないので忘れてしまいます。

— スリムトン

「整数ガウス消去法を実行した後、解決策を見つける方法がわかります。」

— アルバートヘンドリックス

40

この投稿に対する @XXYYXXの回答が貢献している別の神話が破壊されました。

すべての問題からXへの多項式時間（または対数空間）削減がある場合、問題Xは困難です。 $\mathsf{NP}$ $\mathsf{NP}$
指数時間仮説を仮定すると、3-SATには準指数時間アルゴリズムがありません。また、3-SATはます。 $\mathsf{NP}$
したがって、困難な問題Xには準指数時間アルゴリズムはありません。それ以外の場合、Xの部分指数時間アルゴリズム+多項式時間削減= 3-SATの部分指数時間アルゴリズム。 $\mathsf{NP}$

しかし、NP困難な問題の場合は、サブ指数時間アルゴリズムがあります。

— Hsien-Chih Chang張顯之
ソース

私は同じ印象を持っていました。

— モハマドアルトルコ

では、これは指数時間仮説について何を教えてくれるのでしょうか？または、この一連の推論の欠陥を見逃しましたか？

— ミハイルグルセンコフ

2

私は長い時間:)のために誤解きたまさにですポイント3に障害がある

— シェンロン-志チャン張顯之

障害が見つからないかどうかはわかりません。それは以来ということである、減少は必ずしも多項式であってはなりませんが、両方の問題はEXPTIMEになりますので、それは、時間が指数関数的にできること（原因ETHに？）

P \neq N P

$P \neq NP$

— chazisop

43

多項式時間の削減により、多項式の量だけ入力サイズを変更できます。ですから、サイズのPのインスタンスにサイズnのQのインスタンスを減らすのn乗、Pのルートnはアルゴリズムに2のみQ.ためのn個のアルゴリズムにあなたに2を与える場合

— ラッセル・インパグリアゾ

29

が効率的であると説明されているため、今年普及し、問題全体を説明しようとすると何度も言われる誤った信念： $P \neq NP$ $P$

「であれば、膨大な数の問題を効率的に解決できます。そうでなければ、できません」 $P=NP$

を解くことができる場合、です。誰もこのアルゴリズムを実行しようとは思わないでしょう。 $3SAT$ $O(n^{googolplex})$ $P=NP$

場合、我々はまだアルゴリズム持つことができるで実行されよりも小さい場合、のための。ほとんどの人は、40億の都市でを高速で解決できれば幸いです。 $P \neq NP$ $TSP$ $n^{\log(\log n)}$ $n^{5}$ $n\leq2^{32}$ $TSP$

— chazisop
ソース

5

リプトンのブログ投稿は素晴らしいです：rjlipton.wordpress.com/2009/07/03/is-pnp-an-ill-posed-problem

— Hsien-Chih Chang張顯之

6

「あなたが持っているすべての多項式時間アルゴリズムには、私が実行したい指数アルゴリズムがあります」-アラン・ペルリス、ゲーデルのロストレターとP = NPを介して。

— PAL GD

24

これは実際には数学に対する誤った信念ですが、TCSコンテキストではよく出てきます。ランダム変数とが独立している場合、を条件として独立のままです。（がとの両方に依存しない場合でもfalse 。） $X$ $Y$ $Z$ $Z$ $X$ $Y$

— MCH
ソース

2

あなたが推奨するお気に入りの簡単な例はありますか？

— DW

21

X

$X$

Y

$Y$

Z = X + Y

$Z = X+Y$

Z

$Z$

X

$X$

Y

$Y$

Z

$Z$

X

$X$

Y

$Y$

22

分散コンピューティング=分散高性能コンピューティング（クラスター、グリッド、クラウド、seti @ homeなど）。

分散アルゴリズム=これらのシステムのアルゴリズム。

ネタバレ：これが「誤った信念」のように聞こえない場合、PODCやDISCなどの会議を見て、人々が分散コンピューティングの理論的側面を研究するときに実際にどんな仕事をしているのかを確認することをお勧めします。

$n$ $\{1,2,...,\text{poly}(n)\}$ $n$ $n/1000$ $\Theta(\log^* n)$

つまり、人々は集中型アルゴリズムの観点から完全に些細な問題を研究することが多く、あらゆる種類のスーパーコンピューティングや高性能コンピューティングとの共通点はほとんどありません。ポイントは確かに、より多くのプロセッサ、またはそのようなものを使用することによって集中化された計算を高速化しないことです。

目標は、基本的なグラフの問題を計算の複雑さ（たとえば、必要な同期ラウンド数、送信するビット数）に従って分類することにより、複雑さの理論を構築することです。サイクル内の独立集合のような問題は無意味に思えるかもしれませんが、それらは集中コンピューティングにおける3-SATと同様の役割を果たします。つまり、削減の非常に有用な出発点です。具体的な実際のアプリケーションでは、グリッドやクラスター内のコンピューターではなく、通信ネットワーク内のルーターやスイッチなどのデバイスを見る方が理にかなっています。

この誤った考えは完全に無害ではありません。実際、分散アルゴリズムの理論に関連する作品を一般のTCS聴衆に販売することはかなり困難です。TCS会議から陽気な審判レポートを受け取りました...

— ユッカ・スオメラ
ソース

1

コンピューティングに関しては、これは誤った信念ではなく、時代遅れの信念であるとは言いません。マルチコアプロセッサ以外では、小規模な分散コンピューティングは、（少なくとも私の知る限りでは）高性能なコンピューティングの些細なケースでした。コアは「コンピューター」ですが、ネットワークが存在しない、距離が非常に短いため、新しい問題が発生します。ただし、m> = 2ノードには分散アルゴリズムを使用する必要があることに同意します。

— chazisop

並列コンピューティングと分散コンピューティングを混同していると言っているのですか？

— サショニコロフ

あなたの主張は、理論的なコンピューター科学者には当てはまらないと思いますが、理論的な背景のない実践者にも当てはまるかもしれません。Sasho Nikolovが指摘したように、この分野で働く人々は、並列コンピューティングと分散コンピューティングの違いをよく知っています。クラスター、グリッド、クラウドなどで発生する問題は、コンテキストに厳密に依存します。たとえば、クラスターまたはクラウドを使用している場合、障害は想定していませんが、グリッドについては想定しています。等々。

— マッシモカファロ

さらに、この科学コミュニティにとって、分散アルゴリズムとは、ナンシーリンチ、ハギットアティヤ、ジェニファーウェルチ、ジェラルドテルなどの本によく見られる問題のアルゴリズムです。そのため、これらのアルゴリズムは特定の理論的な分散コンピューティングモデル用に設計され、使用されるリソース（時間の複雑さ、メッセージの複雑さ、ビットの複雑さ、ラウンド数など）の観点から必要に応じて分析されます。

— マッシモカファロ

@MassimoCafaro：もちろん、分散コンピューティングの分野で働く人々は、分散コンピューティングとは何かを知っています。しかし、私の経験では、理論的なコンピューター科学者は一般に、分散コンピューティングとは何かを知りません。

— ユッカスオメラ

20

$T(n) = 2T(n/2) + O(n \log n)$ $T(1) = 1$

$n=1$ $n$

$\begin{align} T(n) &= 2 \cdot T(n/2) + O(n \log n) \\ &= 2 \cdot O(n/2 \log n/2) + O(n \log n) \\ &= O(n \log n/2) + O(n \log n) \\ &= O(n \log n) \\ \end{align}$

QED（そうですか？）

— シェンチーチャン張顯之
ソース

16

f (x) = O (g (x))

$f(x) = O(g(x))$

f (x) \in O (g (x))

$f(x) \in O(g(x))$

理論的なコンピューターサイエンスの研究者がこのエラーの変形を行うのを見ました;）

— ジェレミー

12

$M$ $T(n)$ $M_o$ $O(T(n)\log T(n))$

$M_o$
$M_o$ $\Theta(T(n)\log T(n))$

（例えば、この rjliptonの投稿を参照してください）

$EXP-TIME\neq NEXP-TIME$ $\Theta(T(n)\log T(n))$ $M_o$ $M_o$ $O(T(n)\log T(n))$ $T:\mathbb{N}\rightarrow\mathbb{N}$ $\Theta(T(n)\log T(n))$ $O(T(n)\log T(n))$ $EXP-TIME=NEXP-TIME$

この主張の証明は、ここのQ1の答えの証明と非常に似ているため、重要なアイデアのみを示します。

$L\in NEXP-TIME$ $L\subseteq\{0,1\}^*$ $k\in\mathbb{N}$ $L$ $M$ $2^{n^k}$ $M$

f (n) = {\begin{cases} (8 n + 2)^{2} & if (first ⌊ \sqrt[k]{⌊ \log n ⌋ + 1} ⌋ bits of b i n (n)) \in L \\ 8 n + 1 & else \end{cases}

$f(n)=\left\{\begin{array}{ll} (8n+2)^2 & \mbox{if }\left(\mbox{first } \lfloor\sqrt[k]{\lfloor\log n\rfloor+1}\rfloor\mbox{ bits of } bin(n)\right)\in L\\ 8n+1 & \mbox{else} \end{array} \right.$

f

$f$

$g(n)=\Theta(f(n)\log f(n))$ $g$

$L$

$x$ $n$ $x00\ldots 0$ $|x|^{k-1}$ $x=\left(\textrm{first }\lfloor\sqrt[k]{\lfloor\log n\rfloor+1}\rfloor\textrm{ bits of }bin(n)\right)$
$g(n)$ $g(n)$ $g(n)$ $x\in L$ $x\not\in L$ $n$ $g$

$L$ $L\in NEXP-TIME$ $EXP-TIME=NEXP-TIME$

— デビッドG
ソース

11

これが私の2セントです。

$\mathsf{RL}$ $\mathsf{RP}$ $M$

$M$ $1/2$
$M$ $1$

さらに、マシンは常に停止します。

定義は正しいですか？（番号）

— シェンチーチャン張顯之
ソース

9

$f$ $g$ $1^n$ $f(n)$ $g(n)$ $f(n+1)=o(g(n))$

$NTIME(f(n))\subsetneq NTIME(g(n))$

さて、階層は実際にはます。私たちは、例えば、必要となるのための。ような関数、は非常に一般的です。しかし、厳密に言えば、非決定的な時間階層は表面的に多くの場合述べられています。 $NTIME(g(n)) - NTIME(f(n))\neq\emptyset$ $f(n)\leq g(n)$ $NTIME(f(n))\subsetneq NTIME(g(n))$ $f,g$ $f(n+1)=o(g(n))$ $f(n)\leq g(n)$

ことを示すために、全て完全に時間構成可能のために保持していない ST、規定および。とが完全に時間構成可能であり、ことが簡単にわかります。非決定論的な時間階層から、超える言語ことがます。定義し $NTIME(f(n))\subseteq NTIME(g(n))$ $f,g$ $f(n+1)=o(g(n))$

f (n) = {\begin{cases} n + 1 & n odd \\ (n + 1)^{3} & else \end{cases}

$f(n)=\left\{\begin{array}{ll} n+1 & n \mbox{ odd}\\ (n+1)^3 & \mbox{else} \end{array} \right.$

g (n) = f (n + 1)^{2}

$g(n)=f(n+1)^2$

f

$f$

g

$g$

f (n + 1) = o (g (n))

$f(n+1)=o(g(n))$

L \in N T I M E ((n + 1)^{3}) - N T I M E ((n + 1)^{2})

$L\in NTIME((n+1)^3)-NTIME((n+1)^2)$

{0, 1}

$\{0,1\}$

L_{1} = {0 x_{1} 0 x_{2} \dots 0 x_{n}; x_{1} x_{2} \dots x_{n} \in L} .

$L_1=\{0x_10x_2\ldots 0x_n;\ \ x_1x_2\ldots x_n\in L\}.$

その結果、ます。に続くことがわかりますが、これは正しくありません。したがって、。 $L_1\in NTIME(f(n))$ $L_1\in NTIME(g(n))$ $L\in NTIME((n+1)^2)$ $L_1\in NTIME(f(n))-NTIME(g(n))$

— デビッドG
ソース

9

私は、Valiant-Vaziraniががにランダムに減少する、またはであると言っているとよく耳にしました又はその。特に、これは、Valiant-Vaziraniのランダム化を解除できる場合、を意味します。しかし実際、Valiant-Vaziraniはます。 $\mathsf{NP}$ $\mathsf{UP}$ $\mathsf{NP} \subseteq \mathsf{RP}^{\mathsf{UP}}$ $\mathsf{NP} \subseteq \mathsf{R} \cdot \mathsf{UP}$ $\mathsf{NP}=\mathsf{UP}$ $\mathsf{NP} \subseteq \mathsf{RP}^{\mathsf{PromiseUP}}$

密接に関連する誤った信念：は、一意の目撃者がいる場合にような非決定性のポリ時間検証器を持つ言語のクラスです。修正点は、検証者がすべてのインスタンスで最大1人の証人が存在するというセマンティックプロパティを満たさなければならないことです。上記の定義は、修正なしで、定義です。ただし、はとは大きく異なり。たとえば、です。 $\mathsf{UP}$ $L$ $x \in L$ $\mathsf{US}$ $\mathsf{US}$ $\mathsf{UP}$ $\mathsf{coNP} \subseteq \mathsf{US}$

— ジョシュア・グロチョウ
ソース

「すべてのインスタンスのセマンティックプロパティ」とはどういう意味ですか？

— T ....

1

@ 777：セマンティックプロパティとは、TM /アルゴリズム自体の構造（別名構文）から直接検証できないことを意味します。「すべてのインスタンスに最大で1人の証人がある」：そのプロパティ：あなたは、カンマを過ぎ、すなわちそれを継続した場合、フレーズは、より理にかなって

— ジョシュアGrochowは

-2

がの期待値である場合、が実際に発生すると予想されます。 $\mu$ $X$ $\{X=\mu\}$

— user1596990
ソース

9

これは確かに、理論的なコンピューターサイエンスの学生の間では一般的な誤った信念ですが、理論的なコンピューターサイエンスの研究者の間ではそれほど一般的ではありません。

— ジェフ