forループ内のifステートメントを回避しますか?


116

私は次のようなWriter機能を持つ呼び出されたクラスを持っていますwriteVector

void Drawer::writeVector(vector<T> vec, bool index=true)
{
    for (unsigned int i = 0; i < vec.size(); i++) {
        if (index) {
            cout << i << "\t";
        }
        cout << vec[i] << "\n";
    }
}

パフォーマンスを心配しながら、コードを重複させないようにしています。関数では、私のif (index)すべてのラウンドでチェックを行っていますforは、結果は常に同じですループのます。これは「パフォーマンスの心配」に反します。

for-ループの外側にチェックを配置することで、これを簡単に回避できました。ただし、重複したコードが大量に取得されます。

void Drawer::writeVector(...)
{
    if (index) {
        for (...) {
            cout << i << "\t" << vec[i] << "\n";
        }
    }
    else {
        for (...) {
            cout << vec[i] << "\n";
        }
    }
}

したがって、これらはどちらも「悪い」解決策です。私が考えていたのは、2つのプライベート関数で、1つはインデックスを出し、もう1つは呼び出すものです。もう1つは値を出力するだけです。ただし、プログラムでそれを使用する方法がわかりません。if。呼び出すものを確認するチェックです...

問題によると、ポリモーフィズムは正しい解決策のようです。しかし、ここでそれをどのように使用すればよいのかわかりません。この種の問題を解決するための好ましい方法は何でしょうか?

これは実際のプログラムではありません。この種の問題をどのように解決すべきかを知りたいだけです。


8
@JonathonReinhartたぶん一部の人々はプログラミングを学びたいと思っており、問題を解決する方法に興味がありますか?
Skamah One 2013

9
私はこの質問を+1しました。この種の最適化はしばしば必要ではないかもしれませんが、第一に、この事実を指摘することが答えの一部になり得ます。第二に、まれなタイプの最適化が依然としてプログラミングに非常に関連しています。
jogojapan 2013年

31
問題は、ループ内のコードの重複と複雑なロジックを回避する優れた設計についてです。それは良い質問です。反対票を投じる必要はありません。
Ali

5
これは興味深い質問です。通常、コンパイラのループ変換パスはこれを非常に効率的に解決します。このように関数が十分に小さい場合、インライナーはそれを処理し、おそらくブランチを完全に削除します。テンプレートを使用してこれを解決するよりも、インライナーがコードを楽しくインライン化するまで、コードを変更したいと思います。
Alex

5
@JonathonReinhart:えっ?質問の最初の改訂は、これと実質的に同じです。あなたの「なぜあなたは気にするのですか?」コメントは、すべての改訂とは無関係です。あなたを公に叱責することに関しては、あなただけではなく、この問題を引き起こしている多くの人々がここにいます。タイトルは「forループ内のステートメント場合回避」されるとかなり明白であるべき質問は一般的なものであり、その例は単なる例示のためのものです。質問を無視してOPを馬鹿げた見た目にすると、彼が使用した特定の例示的な例のため、誰も助けになりません。
user541686 2013年

回答:


79

ループの本体をファンクタとして渡します。コンパイル時にインライン化され、パフォーマンスが低下することはありません。

変化するものを渡すというアイデアは、C ++標準ライブラリの至る所にあります。それは戦略パターンます。

C ++ 11の使用が許可されている場合は、次のようなことができます。

#include <iostream>
#include <set>
#include <vector>

template <typename Container, typename Functor, typename Index = std::size_t>
void for_each_indexed(const Container& c, Functor f, Index index = 0) {

    for (const auto& e : c)
        f(index++, e);
}

int main() {

    using namespace std;

    set<char> s{'b', 'a', 'c'};

    // indices starting at 1 instead of 0
    for_each_indexed(s, [](size_t i, char e) { cout<<i<<'\t'<<e<<'\n'; }, 1u);

    cout << "-----" << endl;

    vector<int> v{77, 88, 99};

    // without index
    for_each_indexed(v, [](size_t , int e) { cout<<e<<'\n'; });
}

このコードは完璧ではありませんが、アイデアはわかります。

古いC ++ 98では次のようになります。

#include <iostream>
#include <vector>
using namespace std;

struct with_index {
  void operator()(ostream& out, vector<int>::size_type i, int e) {
    out << i << '\t' << e << '\n';
  }
};

struct without_index {
  void operator()(ostream& out, vector<int>::size_type i, int e) {
    out << e << '\n';
  }
};


template <typename Func>
void writeVector(const vector<int>& v, Func f) {
  for (vector<int>::size_type i=0; i<v.size(); ++i) {
    f(cout, i, v[i]);
  }
}

int main() {

  vector<int> v;
  v.push_back(77);
  v.push_back(88);
  v.push_back(99);

  writeVector(v, with_index());

  cout << "-----" << endl;

  writeVector(v, without_index());

  return 0;
}

繰り返しになりますが、コードは完璧というにはほど遠いですが、それはあなたにアイデアを与えます。


4
for(int i=0;i<100;i++){cout<<"Thank you!"<<endl;}:Dこれは私が探していた種類の解決策です、それは魅力のように機能します:)あなたはいくつかのコメントでそれを改善することができます(最初はそれを理解するのに問題がありました)が、私はそれでとても問題がなかった:)
Skamah One

1
お役に立てて嬉しいです。C ++ 11コードでアップデートを確認してください。C++ 98バージョンに比べて肥大化は少ないです。
Ali

3
Nitpick:ループ本体が非常に小さいため、OPの例ではこれで問題ありませんが、それよりも大きい場合(単一行ではなく数十行のコードを想像してください)、cout << e << "\n";依然としてかなりのコードの重複があります。
サイアム2013年

3
C ++ 03の例で構造体と演算子のオーバーロードが使用されるのはなぜですか?なぜ2つの関数を作成し、それらにポインタを渡さないのですか?
Malcolm

2
@Malcolmインライン化。それらが構造体である場合は、関数呼び出しをインライン化できる可能性があります。関数ポインタを渡すと、それらの呼び出しインライン化できない可能性があります。
Ali

40

関数では、結果は常に同じですが、forループのすべてのラウンドでif(インデックス)チェックを実行しています。これは「パフォーマンスの心配」に反します。

もし、これは確かにそうである、分岐予測器は、(一定の)結果を予測する上で何の問題もありません。そのため、これは最初の数回の反復で予測ミスの軽度のオーバーヘッドを引き起こすだけです。パフォーマンスに関して心配することは何もありません

この場合、わかりやすくするためにループ内にテストを置くことを推奨します。


3
これは単なる例であり、この種の問題をどのように解決すべきかを学ぶためにここにいます。実際のプログラムを作成することすらありません。質問でそれを言及すべきだった。
Skamah One 2013

40
その場合、時期尚早な最適化がすべての悪の根源であることを覚えておいてください。プログラミングするときは常にコードの読みやすさに焦点を当て、他の人があなたが何をしようとしているのかを理解していることを確認してください。プログラムをプロファイリングし、ホットスポットを特定した後でのみ、マイクロ最適化とさまざまなハックを検討してください。最適化の必要性を確立せずに最適化を検討することはできません。たいていの場合、パフォーマンスの問題は、期待するところにはありません。
Marc Claesen、2013年

3
そして、この特定の例(わかりました、これは単なる例です)では、ループ制御に費やされた時間が、IOに費やされた時間の他にテストがほとんど見えない場合がほとんどです。これはC ++の問題であることがよくあります。保守を犠牲にして可読性と(仮想)効率のどちらを選択するかです。
クリス2013年

8
コードは、分岐予測が最初からあるプロセッサで実行されていると想定しています。C ++を実行しているシステムの大部分はサポートしていません。(ただし、おそらく有用なstd::coutdoを備えたシステムの大部分)
Ben Voigt

2
-1。はい、分岐予測はここでうまく機能します。はい、条件はコンパイラによってループの外で実際に引き上げられる可能性があります。はい、POITROAE。しかし、ループ内の分岐があるという危険な事が多いパフォーマンスへの影響を持っている、と私はちょうど「分岐予測を」と言って、それらを却下とは思わない誰かが本当にパフォーマンスを気にあれば良いアドバイスです。最も注目に値する例は、ベクトル化コンパイラーがこれを処理するための予測を必要とし、ブランチのないループよりも効率の悪いコードを生成することです。
オーク

35

アリの答えをさらに詳しく説明します。これは完全に正しいですが、一部のコードが重複しています(ループ本文の一部です。これは、残念ながら、ストラテジーパターンを使用する場合は避けられません)。

この特定のケースではコードの重複はそれほど多くありませんが、それをさらに削減する方法があります。これは、関数本体がいくつかの命令よりも大きい場合に便利です。

重要なのは、コンパイラの機能を使用して、定数の折りたたみ/デッドコードの除去を実行することです。のランタイム値をindexコンパイル時の値に手動でマッピングすることで(限られた数のケース(この場合は2つ)の場合に簡単に)を作成し、コンパイル時に既知である型ではないテンプレート引数を使用して、これを行うことができます。 -時間:

template<bool index = true>
//                  ^^^^^^ note: the default value is now part of the template version
//                         see below to understand why
void writeVector(const vector<int>& vec) {
    for (size_t i = 0; i < vec.size(); ++i) {
        if (index) { // compile-time constant: this test will always be eliminated
            cout << i << "\t"; // this will only be kept if "index" is true
        }
        cout << vec[i] << "\n";
    }
}

void writeVector(const vector<int>& vec, bool index)
//                                            ^^^^^ note: no more default value, otherwise
//                                            it would clash with the template overload
{
    if (index) // runtime decision
        writeVector<true>(vec);
        //          ^^^^ map it to a compile-time constant
    else
        writeVector<false>(vec);
}

このようにして、2つ目のコード例(outer if/ inner for)と同等のコンパイル済みコードができますが、コードを自分で複製する必要はありません。これで、テンプレートバージョンを作成できます。writeVectorを必要なだけ複雑にすることができます。維持するコードは常に1つです。

テンプレートバージョン(非型のテンプレート引数の形でコンパイル時定数をとる)と非テンプレートバージョン(関数の引数としてランタイム変数をとる)がどのようにオーバーロードされているかに注意してください。これにより、ニーズに応じて最も関連性の高いバージョンを選択できます。どちらの場合も、構文はよく似ており、覚えやすいです。

writeVector<true>(vec);   // you already know at compile-time which version you want
                          // no need to go through the non-template runtime dispatching

writeVector(vec, index);  // you don't know at compile-time what "index" will be
                          // so you have to use the non-template runtime dispatching

writeVector(vec);         // you can even use your previous syntax using a default argument
                          // it will call the template overload directly

2
ループ内のロジックをより複雑にする代わりに、コードの重複を削除したことを覚えておいてください。私は、この特定の単純な例について私が提案したものよりも良くも悪くもないと思います。とにかく+1!
アリ

1
別の可能な最適化を示しているので、私はあなたの提案が好きです。インデックスは最初からテンプレート定数である可能性が非常に高いです。この場合、writeVectorの呼び出し元によってランタイム定数に置き換えることができ、writeVectorがテンプレートに変更されます。元のコードへのそれ以上の変更を避けます。
クリス、2013年

1
@kriss:実際のところ、私の以前の解決策では、doWriteVector直接電話をかけた場合はすでに許可されていましたが、名前が残念でした。writeVector結果をより均一にするために、2つのオーバーロード関数(1つはテンプレート、もう1つは通常の関数)に変更しました。提案をありがとう。;)
サイアム2013年

4
IMOこれが最良の答えです。+1
user541686

1
@Mehrdad元の質問に答えないことを除いて、forループ内のifステートメントを回避しますか?ただし、パフォーマンスの低下を回避する方法については回答しています。「複製」に関しては、それがどのように最適に分解されるかを確認するために、ユースケースを含むより現実的な例が必要になります。前に言ったように、私はこの答えを支持しました。
Ali

0

ほとんどの場合、コードはすでにパフォーマンスと可読性に優れています。優れたコンパイラーは、ループの不変条件を検出し、適切な最適化を行うことができます。コードに非常に近い次の例を考えてみます。

#include <cstdio>
#include <iterator>

void write_vector(int* begin, int* end, bool print_index = false) {
    unsigned index = 0;
    for(int* it = begin; it != end; ++it) {
        if (print_index) {
            std::printf("%d: %d\n", index, *it);
        } else {
            std::printf("%d\n", *it);
        }
        ++index;
    }
}

int my_vector[] = {
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10,
};


int main(int argc, char** argv) {
    write_vector(std::begin(my_vector), std::end(my_vector));
}

次のコマンドラインを使用してコンパイルしています。

g++ --version
g++ (GCC) 4.9.1
Copyright (C) 2014 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
g++ -O3 -std=c++11 main.cpp

次に、アセンブリをダンプします。

objdump -d a.out | c++filt > main.s

の結果のアセンブリwrite_vectorは次のとおりです。

00000000004005c0 <write_vector(int*, int*, bool)>:
  4005c0:   48 39 f7                cmp    %rsi,%rdi
  4005c3:   41 54                   push   %r12
  4005c5:   49 89 f4                mov    %rsi,%r12
  4005c8:   55                      push   %rbp
  4005c9:   53                      push   %rbx
  4005ca:   48 89 fb                mov    %rdi,%rbx
  4005cd:   74 25                   je     4005f4 <write_vector(int*, int*, bool)+0x34>
  4005cf:   84 d2                   test   %dl,%dl
  4005d1:   74 2d                   je     400600 <write_vector(int*, int*, bool)+0x40>
  4005d3:   31 ed                   xor    %ebp,%ebp
  4005d5:   0f 1f 00                nopl   (%rax)
  4005d8:   8b 13                   mov    (%rbx),%edx
  4005da:   89 ee                   mov    %ebp,%esi
  4005dc:   31 c0                   xor    %eax,%eax
  4005de:   bf a4 06 40 00          mov    $0x4006a4,%edi
  4005e3:   48 83 c3 04             add    $0x4,%rbx
  4005e7:   83 c5 01                add    $0x1,%ebp
  4005ea:   e8 81 fe ff ff          callq  400470 <printf@plt>
  4005ef:   49 39 dc                cmp    %rbx,%r12
  4005f2:   75 e4                   jne    4005d8 <write_vector(int*, int*, bool)+0x18>
  4005f4:   5b                      pop    %rbx
  4005f5:   5d                      pop    %rbp
  4005f6:   41 5c                   pop    %r12
  4005f8:   c3                      retq   
  4005f9:   0f 1f 80 00 00 00 00    nopl   0x0(%rax)
  400600:   8b 33                   mov    (%rbx),%esi
  400602:   31 c0                   xor    %eax,%eax
  400604:   bf a8 06 40 00          mov    $0x4006a8,%edi
  400609:   48 83 c3 04             add    $0x4,%rbx
  40060d:   e8 5e fe ff ff          callq  400470 <printf@plt>
  400612:   49 39 dc                cmp    %rbx,%r12
  400615:   75 e9                   jne    400600 <write_vector(int*, int*, bool)+0x40>
  400617:   eb db                   jmp    4005f4 <write_vector(int*, int*, bool)+0x34>
  400619:   0f 1f 80 00 00 00 00    nopl   0x0(%rax)

関数が始まると、値を確認して2つの可能なループの1つにジャンプすることがわかります。

  4005cf:   84 d2                   test   %dl,%dl
  4005d1:   74 2d                   je     400600 <write_vector(int*, int*, bool)+0x40>

もちろん、これは、条件が実際に不変であることをコンパイラが検出できる場合にのみ機能します。通常、これはフラグおよび単純なインライン関数に対して完全に機能します。ただし、条件が「複雑」な場合は、他の回答からのアプローチの使用を検討してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.