漸近的な最悪のケースの分析を科学者に正当化する


22

私は、生物学者にとって興味深い/有用であることを目標に、計算の複雑さから理論生物学、特に進化と生態学いくつかの結果を導入することに取り組んでいます。私が直面した最大の困難の1つは、下限に対する漸近的な最悪ケース分析の有用性を正当化することです。科学的な聴衆に対して下限と漸近的な最悪のケースの分析を正当化する記事の長さの参照はありますか?

私は、私が利用できる限られたスペースで正当化する必要はありません(記事の中心ではないので)執筆の中で延期できる良い参考資料を本当に探しています。私はまた、認識しています他の種類パラダイムので、分析の私はない最悪の場合は、「最良の」分析であると言うの参照を求めている(それはあまりないときに設定があるので)、そうではありませんことを完全に役に立たない:実際の入力での実際のアルゴリズムの振る舞いに対する理論的に有用な洞察を依然として提供することができます。執筆が一般科学者を対象にしていることも重要です エンジニア、数学者、コンピューター科学者だけではありません。

例として、複雑性理論を経済学者に紹介するティム・ラフガーデンのエッセイは、私が望むものに対して正しい軌道に乗っています。ただし、セクション1と2のみが関連し(残りは経済的すぎます)、対象とする聴衆は、定理と補題に反した思考にほとんどの科学者より少し快適です[1]


詳細

進化における適応ダイナミクスのコンテキストでは、理論生物学者からの2つの特定のタイプの抵抗に出会いました。

[A]「なぜ、任意の振る舞いに注意を払う必要があるのnですか?ゲノムにはn=3109塩基対(または遺伝子)があり、それ以上ないことがすでにわかっています。」n=2104

これは、「ではなく秒待機することを想像できます」という引数を使用して比較的簡単に解決できます。しかし、より複雑な議論は、「確かに、特定のだけに関心があると言いますが、あなたの理論はこの事実を決して使用せず、単に大きいが有限であるということを使用します。漸近解析」。2 10 9 n1092109n

[B]「しかし、これらのガジェットでこの特定のランドスケープを構築することで、これが難しいことだけを示しました。平均ではなく、なぜこれを気にする必要があるのですか?」

この分野で一般的に使用されるツールの多くは統計物理学から来ているため、これは対処するのがより難しい批判です。統計物理学では、均一な(または他の特定の単純な)分布を仮定しても安全です。しかし、生物学は「歴史のある物理学」であり、ほとんどすべてが平衡または「典型的」ではなく、経験的知識は不十分です入力の分布に関する仮定を正当化するため。言い換えれば、ソフトウェアエンジニアリングの均一分布平均ケース分析に対して使用されるものと同様の引数が必要です。「アルゴリズムをモデル化するため、ユーザーがアルゴリズムとどのように対話するか、その分布を合理的なモデルを構築することはできません入力は、心理学者またはエンドユーザー向けであり、当社のものではありません。」この場合を除き、科学は「心理学者またはエンドユーザー」に相当するものが存在して、基礎となる分布を把握する(またはそれが意味がある場合でも)立場にありません。

メモと関連する質問

  1. リンクでは認知科学について説明していますが、考え方は生物学でも似ています。あなたの閲覧の場合の進化理論生物学誌、あなたはめったに定理・補題プルーフ表示されませんし、あなたが行うとき、それは通常、単に計算の代わりの存在証明や複雑な建築のようなものになります。
  2. アルゴリズムの複雑さ分析のパラダイム
  3. ワーストケース、平均ケースなどの他の種類の実行時間分析?
  4. アルゴリズムレンズによる生態学と進化
  5. 経済学者が計算の複雑さを気にするべき理由

23
最悪の場合の動作を正当化することは不可能です...シンプレックスアルゴリズムには指数関数的な最悪の場合の動作があり、これまで気にしていたのは理論家だけです。議論する必要があるのは、(a)平均ケースの漸近的挙動が重要であるということです。(b)平均ケースの漸近的挙動と最悪ケースの漸近的挙動はよく似ています。(c)最悪の場合の漸近的挙動は、多くの場合、平均的な場合の漸近的挙動よりも計算がはるかに簡単です(特に、関連する確率分布が何であるかを誰も知らないため)。
ピーターショー14年

5
漸近性はすでに問題のある側面です。私たちは皆、行列乗算アルゴリズムについての話を知っています(漸近的な上限は実際には無意味です)、そしておそらく暗号のパラメーターを選択する話も知っています(漸近的な下限は実際には無意味です;指数アルゴリズムは時々実行可能です[DES])。分析に実際の定数がある場合、より説得力があります。
ユヴァルフィルマス14年

6
入力プロバイダーとアルゴリズム間のゲーム(つまり、戦争)としての計算を考える場合、最悪のケースの分析は標準的な軍事的アプローチです-どれほど悪いかを知りたいのです。第二に、そしてさらに重要なことは、最悪の場合の分析では、知的に怠け者になり、あなたが世界がそうであると信じるもの(そして世界が実際にあるものではない)に良いかもしれない解決策を受け入れることができないことです。最後に、そしておそらく最も重要なことには、それはアルゴリズムを比較するための統一された方法を提供します。つまり、他のすべてを除いて、最悪のアプローチです。
サリエルハーペレド14年

6
最悪の場合の下限は、ボールをコートに戻すことと見なされるべきだと思います。妥当な時間枠内ですべてのインスタンスで問題を解決できるアルゴリズムがないことを示しました。彼らはインスタンスが簡単だと合理的に信じているかもしれませんが、そうだとすれば、それは重要な事実であることを示しただけです。したがって、彼らのモデルは、なぜそうなのかについて説明がない限り、不完全です。
アーロンロス14年

3
(これはゲーム理論家と話をするときにうまくいくと思われるアプローチです。市場が本当に急速に均衡するのであれば、最悪のケースの硬さを回避する実際の市場にはどのような特別な特性がありますか?そのような特性、および下限は、そうすることが重要な研究の方向であることを示唆しています)
アーロンロス14年

回答:


8

私の個人的な(そして偏った)考え方は、漸近的な最悪の場合の分析は、より実用的な種類の分析への歴史的な足掛かりであるということです。したがって、開業医に正当化するのは難しいようです。

最悪の場合の境界を証明することは、平均的な場合の「いい」定義でさえ境界を証明するよりも簡単です。また、漸近解析は、合理的に厳密な境界を証明するよりもはるかに簡単です。したがって、最悪の漸近解析は開始するのに最適な場所です。

Daniel SpielmanとShanghua TengのSimplexの平滑化分析に関する研究は、問題の形をよりよく理解し始めたときに何が起こるかを示す先駆者のように思われます。発展した。さらに、Aaron Rothがコメントで示唆したように、システムの「通常の」動作が最悪の場合と大きく異なる場合、システムはまだ完全には指定されておらず、モデルを改善するためにより多くの作業が必要です。したがって、最悪の場合を超えることは、一般に長期的な目標として重要と思われます。

漸近解析に関する限り、それは通常、長くて厄介な証拠から注意散漫な詳細を明確に保つのに役立ちます。残念ながら、現時点では、詳細を入力して実際の定数を取得するという面倒な作業に報いる方法はないと思われるため、ほとんど完了しないようです。(ページ制限もこれに対して機能します。)漸近境界の詳細を慎重に分析すると、定数に適切な境界を持つ実際のアルゴリズムが得られたため、この種の作業をもっと見たいと思います。おそらく、証明アシスタントシステムを使用してより多くの証明が形式化された場合、より少ない労力で定数を推定できます。(または、SowerédiRegularity LemmaのGowersの境界に沿った定数の境界は、より日常的になる可能性があります。)定数のない下限を証明する方法もあります。より明確なマシンモデル(決定性有限状態オートマトンなど)を使用する。ただし、より一般的な計算モデルのこのような(ほぼ)正確な下限は、多くの作業を必要とするか、完全に手の届かないものになります。これは、オートマタ理論の最初の全盛期の1958年から73年にかけて追求されたようですが、私が知る限り、それはほとんど放置されています。

Onk、銀河の隠された定数を持つ。実践者にとって最悪の漸近解析に現在焦点を合わせることを正当化することは難しいと思いますが、これをより長い旅の最初のステップと考えることはおそらく有用です。


漸近線を捨てて明確な定数を持つ正確な境界を優先することにあなたの熱意を共有しません。漸近は不正確かもしれませんが、それらは有用に不正確です。同じマシンモデルの実装の違いを抽象化します。たとえば、1950年代のハードウェアでは2次であったソートアルゴリズムは、今日のハードウェアでは2次のままです。さらに、漸近式はうまく構成されます。たとえば、線形と多項式は合成のもとで閉じられます。(最悪の場合と比較して、平均的な場合のより良い境界を主張することは、漸近

一般的には正しいですが、小さい定数と、関連するパラメーターの非基本関数である定数との間には大きな違いがあります。
アンドラスサラモン14年

私は全体的にこの答えが好きですが、@ brandjonには定数を隠すことが重要であることに同意します。私にとって、TCSが生物学で役立つ理由は、物理よりもマイクロダイナミクスに関する仮定をはるかに少なくする必要があるためです。ただし、マイクロダイナミクス(つまり、計算モデルの正確な仕様)について仮定しないと、定数因子を取り出すことができません。TCSのその他の便利な機能は、厳密な定性的二分法(バイオでのより定性的な観察と比較しやすいもの)です。通常、これらを取得するには、定数を捨てる必要があります。
アルテムKaznatcheev

OnO1/ϵ

1
補足として、最悪の場合の分析が理にかなっている例があります。たとえば、汎用サブルーチンのライブラリを開発し、それらがどのアプリケーションドメインで役立つかわからない場合、たとえば、誰かが最小コストの2部一致を計算するタイミングと理由をすべて予測することはできません。暗号化などの敵対的な設定は、さらに明確です(ただし、暗号化では、セキュリティパラメーターに関しては定数を本当に知りたいです)。
サショニコロフ14

4

下限と最悪の場合の分析は通常一緒には行きません。最悪の場合、アルゴリズムに少なくとも指数時間がかかるとは言わないので、それは悪いことです。あなたは、最悪の場合にはせいぜい線形時間しかかからないので良いと言います。前者は、単に平均的な入力ではなく、可能なすべての入力に対してアルゴリズムを実行する場合にのみ役立ちます。

不良を示すために下限を使用する場合は、ベストケース分析または平均ケース分析が必要です。最悪と平均はしばしば非常によく似ているという@PeterShorのポイントに依存することで物事を単純化し、これが当てはまるアルゴリズムのランドリーリストを提供できます。(例:クイックソート以外のすべての古典的なソート。)

一定の入力および一定の要因と比較した場合に漸近が重要であることを実証することに関して、このトピックに関する私のお気に入りの記事はJon Bentleyの「Programming pearls:algorithm design technique」です。彼は、単純な配列問題に対する4つの異なる解決策を提示し、線形アプローチが3次問題をどのように消滅させるかを示します。彼は、ロケット方程式の難治性のために物理学者によって使用された用語の後、彼のテーブルを「漸近性の圧制」と呼びます。この例を使用して、大学入学前の学生に、より良いアルゴリズムの検索を促します。

コンピューター以外の科学者は、コードを含む記事を読んで、全体像をつかむために低レベルの詳細をスキップすることを知っていますか?知りません。おそらく他の場所でより良いプレゼンテーションがあります。しかし、これは引用にふさわしいリソースだと思います。

そして、彼らが任意に大きなnを気にしないと主張する場合、3 * 10 9塩基対で再帰的でメモされていないフィボナッチを実行させ、DNA配列のサイズが固定されているのでO(1)であることを伝えます。;)


1
私はフィボナッチの例が好きです:)
Suresh Venkat 14年

3
再:あなたの最初の段落:実際には、それはほとんど正確に多くの複雑性理論が行うことです。問題がEXP完全である場合、最悪の入力では指数時間を必要とします。これは一般に、全体的な難易度の指標とみなされます(実際、これは一般的には一般的な指標ほど悪くはありません)。これは事実上の標準であり、「無限大」またはio下限と呼ばれます。平均ケースまたはほぼすべての下限(つまり、有限の入力を除くすべての入力)を取得することは、目標を追求することもありますが、多くの場合、下限に比べて手の届かないところにあります。
ジョシュアグロチョウ14年

2
ワーストケース分析と平均ケース分析が同じであるアルゴリズムのランドリーリストを提供できるだけでなく、それらが非常に異なる多数の例を提供できることを指摘しましょう(シンプレックスアルゴリズムは最も有名です)これらの)。どういうわけか、特定のアプリケーションで同じであると主張する必要があります。これを行うには、実験的なテストが良い方法です。
ピーターショー14年

1
@JoshuaGrochowまあまあ。声明を次のように改訂してはどうでしょうか:最悪のケースの下限は、非恐ろしさの数学的保証がないことを実証する場合に重要です。;)
brandjon 14年

-3

多くの人がこれを調査/カバーする重要なトピックに同意しましたが、まだそれほど多くはなかったようです。いくつかのスタイル/カバレッジ/聴衆/変化のレフリー形式ではない正確に要求しましたが、多少の近くに(最高のメディア検索で、これまでのオンライン見て、希望さらに任意のより良いものを聞くために、以下に、よりノート):

  • アルゴリズム Atkinson の複雑さ(論文では生物学に関する単一の参考文献のみですが、より一般的な科学/工学用語で十分かもしれません)

    アルゴリズムの現代理論は、漸近的実行時間測定の方法が使用され始めた1960年代後半にさかのぼります。主題は工学と科学の両方の翼を持っていると主張されています。工学の分野は十分に理解された設計方法論から成り、科学の分野は理論的基盤に関係しています。両翼の重要な問題が調査されます。最後に、主題が次に行く場所に関するいくつかの個人的な意見が示されています。

  • 複雑さとアルゴリズム J. Diaz。100枚のスライド。広い; 特に関連するものを抜粋することができます。

  • アルゴリズムの複雑さの分析への優しい紹介ディオニシス「dionyziz」Zindros

言い換えると、「科学者、エンジニア、および研究者のための複雑性理論」のような、科学の進歩するアルゴリズムレンズとの密接な組み合わせ/組み合わせ/コンパニオンにおける複雑性理論レンズの導入/調査/概要のようなものがありますますか?

かつての「アルゴリズミックレンズ」あなたは例えば引用しているのは良いレフリーがあるPapadimitriouが、後者の「複雑レンズ」に書かれている分野の専門家による満足度の高い参照していないようだが... まだ(おそらくいくつかの「エリート」このサイトのメンバー)は、その次の本や紙プロジェクトとしてそれを検討します。

また、複雑性理論のほか、これらの目的のためにある程度使用できる他の科学分野では、関連性P対NPに関する多くの文献があることに注意してください。興味がある場合はコメントに追加します。


3
これは本当に質問に答えるとは思わない。
ハックベネット14年

1
ええと、参考文献を見ました?私の答えの一部は、(まだ)理想的/完璧な答えはないということです:|
vzn 14年

1
彼らはそれを正当化することに集中するのではなく、漸近的で最悪のケースの分析を定義しているようですが、私は何かを見逃したのでしょうか?
ハックベネット14年

7
実際、TCS以外の研究者は、最悪の場合を「実際には発生しない人工的に構築された例」として簡単に却下でき、(そうでなければ強い説得力がなければ)平均的な場合にはるかに興味があると思います(明確ではないという事実にもかかわらず)平均ケースは、実際のインスタンスに非常に近いです)。
ジョシュアグロチョウ14年

1
@vzn:漸近的(例:ビッグオー)とワーストケースはやや直交しています。漸近的な最悪ケースの分析、漸近的な平均ケースの分析、または漸近的な最も簡単なケースの分析を行うことができます(後者はややひねくれているように思えますが)。代わりに、正確な最悪ケース分析、または正確な平均ケース分析などを行うことができますが、これらはモデル依存性が高く、堅牢性が低くなります。漸近線の使用を正当化する(および定数因子のようなものを隠す)ことは、最悪の場合と平均的な場合、または「実際の」場合(後者が意味するものは何でも)を正当化することとはまったく異なります。
ジョシュアグロチョフ14年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.