なぜこのF#コードはとても遅いのですか?


127

C#とF#のLevenshtein実装。C#バージョンは、約1500文字の2つの文字列で10倍高速です。C#:69ミリ秒、F#867ミリ秒。どうして?私が知る限り、彼らはまったく同じことをしますか?それがリリースビルドかデバッグビルドかは関係ありません。

編集:編集距離の実装を特に探している人がここに来ると、壊れます。作業コードはこちらです。

C#

private static int min3(int a, int b, int c)
{
   return Math.Min(Math.Min(a, b), c);
}

public static int EditDistance(string m, string n)
{
   var d1 = new int[n.Length];
   for (int x = 0; x < d1.Length; x++) d1[x] = x;
   var d0 = new int[n.Length];
   for(int i = 1; i < m.Length; i++)
   {
      d0[0] = i;
      var ui = m[i];
      for (int j = 1; j < n.Length; j++ )
      {
         d0[j] = 1 + min3(d1[j], d0[j - 1], d1[j - 1] + (ui == n[j] ? -1 : 0));
      }
      Array.Copy(d0, d1, d1.Length);
   }
   return d0[n.Length - 1];
}

F#

let min3(a, b, c) = min a (min b c)

let levenshtein (m:string) (n:string) =
   let d1 = Array.init n.Length id
   let d0 = Array.create n.Length 0
   for i=1 to m.Length-1 do
      d0.[0] <- i
      let ui = m.[i]
      for j=1 to n.Length-1 do
         d0.[j] <- 1 + min3(d1.[j], d0.[j-1], d1.[j-1] + if ui = n.[j] then -1 else 0)
      Array.blit d0 0 d1 0 n.Length
   d0.[n.Length-1]

7
インラインを使用したパフォーマンスの違いは何ですか?
gradbot

回答:


202

問題は、min3関数が総称比較を使用する総称関数としてコンパイルされていることです(これは単にを使用すると思いましIComparableたが、実際にはもっと複雑です-F#型の構造比較を使用し、かなり複雑なロジックです)。

> let min3(a, b, c) = min a (min b c);;
val min3 : 'a * 'a * 'a -> 'a when 'a : comparison

C#バージョンでは、関数はジェネリックではありません(それは単にを受け取りますint)。タイプアノテーションを追加してF#バージョンを改善できます(C#と同じものを取得するため)。

let min3(a:int, b, c) = min a (min b c)

...または次のようにすることmin3inline(この場合、int使用時に特殊化されます):

let inline min3(a, b, c) = min a (min b c);;

str長さが300のランダムな文字列の場合、次の数値が得られます。

> levenshtein str ("foo" + str);;
Real: 00:00:03.938, CPU: 00:00:03.900, GC gen0: 275, gen1: 1, gen2: 0
val it : int = 3

> levenshtein_inlined str ("foo" + str);;
Real: 00:00:00.068, CPU: 00:00:00.078, GC gen0: 0, gen1: 0, gen2: 0
val it : int = 3

1
F#がmin3をintを取る関数としてコンパイルしないのはなぜですか?これは、コンパイル時にこれを行うのに十分な型情報をすでに知っています。これは、min3がC ++テンプレート関数である場合に機能する方法です。そのため、F#がこれを行わない理由に少し戸惑いました。
sashang

42
F#は、それが可能な限り一般的であると推測します(たとえば、「比較をサポートするすべてのタイプXに対して」)。 inlineC ++テンプレートのように機能intし、呼び出しサイトに基づいて専門化します。
ブライアン、

13
C ++テンプレートは基本的にF#のように動作しますinline。デフォルトの動作が異なる理由は、ランタイムによって処理される.Netジェネリックを基に構築されているためです(そして、おそらく、ジェネリック数値コードを記述するのにはそれほど優れていません)。ただし、F#でC ++の動作を使用すると、コードの膨張につながります。これは、F#がジェネリックをより多く使用するためです。
Tomas Petricek

4
C ++テンプレートのセマンティクスは、C ++でもコードの肥大化を招く可能性があり、ランタイムメカニズムを使用するように切り替える便利な方法がないために、面倒な場合があります。ただし、コードの肥大化に対する恐怖は、通常は不合理です。一般的に、C ++テンプレートはうまく機能します。
Steve314 2012

@ Steve314:依存型を使用しないすべてのコードをリファクタリングすることで、一般的に簡単に回避できるため、異なるインスタンス化のためにコードが複製されることはありません。
ildjarn 2012
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.