貪欲な推測はなぜそんなに難しいのですか?


14

私は最近、最短超弦問題の貪欲な推測について学びました。

この問題では、文字列s1snセットが与えられ、最短のスーパーストリング sつまり各ss部分文字列として現れるようなものを見つけたいです。

この問題はNP困難であり、長い一連の論文の後、この問題の最もよく知られている近似アルゴリズムの比率は2+1130 [Paluch '14]。

実際には、生物学者は次の貪欲アルゴリズムを使用します。

各ステップで、すべてのペアで最大のオーバーラップを持つ2つの文字列(別の文字列のプレフィックスである最大のサフィックス)をマージし、残りの文字列(すべての入力文字列のスーパーストリング)になるまでこの新しいインスタンスで繰り返します)

以下の結合2本貪欲アルゴリズムの近似比率では、入力から得ることができるcabkbakabkc

興味深いことに、これは最悪の例であると推測されました。つまり、Greedy は最短スーパーストリング問題の2近似を達成するということです。このように自然で簡単なアルゴリズムを分析するのは非常に難しいことを知って非常に驚きました。

この質問がなぜ難しいのかを示唆する直観、事実、観察、例はありますか?


7
理由の1つは、問題の標準グラフ表現の既知の特性(MongeおよびTriple不等式など)が、貪欲な推測の証明には十分ではないことです。例えば、Laube、Weinard「条件付き不等式と最短の共通スーパーストリング問題」、およびWeinard、Schnitger「貪欲なスーパーストリング予想について」を参照してください。
アレックスゴロフネフ

@AlexGolovnev:私にとって完全に良い答えのようです!
ジョシュアグロチョウ

@JoshuaGrochow:ありがとう!それを答えに拡張します。
アレックスゴロフネフ

回答:


8

最初に、貪欲な推測について知られていることを要約してみましょう。

  1. Blum、Jiang、Li、Tronp、Yannakakisは、貪欲アルゴリズムが4近似を与えることを証明し、KaplanとShafrirは、最短共通スーパーストリング問題に対して3.5近似を与えることを示します。
  2. 貪欲なアルゴリズムのバージョンは、3近似を与えることが知られています(Blum、Jiang、Li、Tromp、Yannakakis)。
  3. 34
  4. 貪欲アルゴリズムが偶然に特定の順序で文字列をマージする場合に貪欲な推測が成り立ちます(Weinard、Schnitger ; Laube、Weinard)。
  5. Greedy Algorithmは、圧縮Tarhio、Ukkonenの 2近似を提供します(これは、入力文字列の合計の長さから最短の共通superstrtingの長さを引いたものとして定義されます)。
  6. Greedy Algorithm Ukkonenの非常に効率的な実装があります。

貪欲な予想を証明するのが難しい理由の一つは、次のようなものだと思います。貪欲アルゴリズムの近似保証を証明するアプローチのほとんどは、文字列の入力セットのオーバーラップグラフ(または同等にプレフィックスグラフ)を分析します。これらのグラフのいくつかの特性(MongeやTriple不等式など)のみを知っていますが、これらの特性は、貪欲な予想(Weinard、Schnitger ; Laube、Weinard)を証明するには不十分であると考えられます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.