私は最近、最短超弦問題の貪欲な推測について学びました。
この問題では、文字列のセットが与えられ、最短のスーパーストリング つまり各が部分文字列として現れるようなものを見つけたいです。
この問題はNP困難であり、長い一連の論文の後、この問題の最もよく知られている近似アルゴリズムの比率は [Paluch '14]。
実際には、生物学者は次の貪欲アルゴリズムを使用します。
各ステップで、すべてのペアで最大のオーバーラップを持つ2つの文字列(別の文字列のプレフィックスである最大のサフィックス)をマージし、残りの文字列(すべての入力文字列のスーパーストリング)になるまでこの新しいインスタンスで繰り返します)
以下の結合本貪欲アルゴリズムの近似比率では、入力から得ることができる。
興味深いことに、これは最悪の例であると推測されました。つまり、Greedy は最短スーパーストリング問題の近似を達成するということです。このように自然で簡単なアルゴリズムを分析するのは非常に難しいことを知って非常に驚きました。
この質問がなぜ難しいのかを示唆する直観、事実、観察、例はありますか?
7
理由の1つは、問題の標準グラフ表現の既知の特性(MongeおよびTriple不等式など)が、貪欲な推測の証明には十分ではないことです。例えば、Laube、Weinard「条件付き不等式と最短の共通スーパーストリング問題」、およびWeinard、Schnitger「貪欲なスーパーストリング予想について」を参照してください。
—
アレックスゴロフネフ
@AlexGolovnev:私にとって完全に良い答えのようです!
—
ジョシュアグロチョウ
@JoshuaGrochow:ありがとう!それを答えに拡張します。
—
アレックスゴロフネフ