貪欲な推測はなぜそんなに難しいのですか?
私は最近、最短超弦問題の貪欲な推測について学びました。 この問題では、文字列のs1、… 、sns1、…、sns_1,\dots, s_nセットが与えられ、最短のスーパーストリング sssつまり各s私s私s_iがsss部分文字列として現れるようなものを見つけたいです。 この問題はNP困難であり、長い一連の論文の後、この問題の最もよく知られている近似アルゴリズムの比率は2 + 11302+11302+\frac{11}{30} [Paluch '14]。 実際には、生物学者は次の貪欲アルゴリズムを使用します。 各ステップで、すべてのペアで最大のオーバーラップを持つ2つの文字列(別の文字列のプレフィックスである最大のサフィックス)をマージし、残りの文字列(すべての入力文字列のスーパーストリング)になるまでこの新しいインスタンスで繰り返します) 以下の結合222本貪欲アルゴリズムの近似比率では、入力から得ることができるc (a b )k、(b a )k、(a b )kcc(ab)k、(ba)k、(ab)kcc(ab)^k,(ba)^k,(ab)^kc。 興味深いことに、これは最悪の例であると推測されました。つまり、Greedy は最短スーパーストリング問題の222近似を達成するということです。このように自然で簡単なアルゴリズムを分析するのは非常に難しいことを知って非常に驚きました。 この質問がなぜ難しいのかを示唆する直観、事実、観察、例はありますか?