XNAパフォーマンステストを自動化しますか？

XNAでのパフォーマンステストの自動化について、人々のアプローチや考えはどうなっていたのだろうと思いました。現在、私は2dでのみ作業していると考えていますが、それはさまざまな実装でパフォーマンスを改善できる多くの領域をもたらします。

例としては、空間分割の2つの異なる実装がある場合、1つは別の実装よりも高速かもしれませんが、実際のパフォーマンステストを行わないと、どれが確かにどれであるかを確実に判別できません（コードが明らかに明らかに遅い場合を除きます）。部品）。特定の時間枠で両方の実装のエンティティを追加/更新/削除し続けるユニットテストを作成し、各時間枠で作成された数を確認できます。高い方がより高速になります（この特定の例では）。

もう1つのより高いレベルの例は、60 fpsを下回ることなく、画面上に大まかにいくつのエンティティを表示できるかを確認する場合です。これの問題は、自動化することです。モックゲームを開始し、気になっている部分を純粋にテストして、他のすべてを無効にするために、隠しフォームトリックなどを使用する必要があります。

テストを自動化できたとしても、これは単純な問題ではないことを知っています。実際に結果が十分に優れているかどうかを判断するのは人間次第ですが、ビルドステップの一部として、これらのテストを実行して公開することができます。比較のためのどこかでの結果。

このようにして、バージョン1.1から1.2に移行したが、いくつかの基本的なアルゴリズムを変更した場合、一般にパフォーマンススコアが上がり、アプリケーションの全体的なパフォーマンスが向上し、1.2から1.3に気付く場合があります。その後、全体的なパフォーマンスが少し低下しました。

では、プロジェクトでこの種のことを自動化した人はいますか？そうであれば、パフォーマンス比較を高レベルでどのように測定し、どのフレームワークをテストに使用しますか？ほとんどのパーツでテスト可能/モック可能になるようにコードを記述しているので、パフォーマンス結果を得るためのメカニズムとしてテストを使用できます...

===編集===

わかりやすくするために、XNA内の自動テストを使用してパフォーマンスを追跡する最良の方法に興味を持っています。テストをプレイしたり、マシンでゲームを手動で実行して推測したりするのではありません。これは、ゲームがXハードウェアでプレイ可能かどうかを確認するのとはまったく異なります。ゲームエンジン/フレームワークが変化したときのパフォーマンスの変化を追跡することについてです。

コメントの1つで述べたように、「QuadTreeA内で2秒以内にいくつのノードを挿入/削除/更新できるか」を簡単にテストできますが、結果が変更されたかどうかを確認するために毎回これらの結果を物理的に調べる必要があります。うまく、バージョン間の違いに気づくかどうかを確認するためにそれを再生するだけに頼るよりも優れています。ただし、Assertを挿入して、2秒で5000を下回ると、失敗を通知して失敗を通知する場合は、実装だけでなくハードウェアのコンテキストでもあるため、もろいテストになります。そうは言っても、これらの種類の自動テストは、ある種のビルドパイプラインとしてテストを実行している場合にのみ実際に使用できます。

チェックアウト->ユニットテストの実行->統合テストの実行->パフォーマンステストの実行->パッケージ

したがって、ある種のレポートとして、CIサーバー上のあるビルドから別のビルドへの統計を簡単に比較できます。また、継続的インテグレーションに慣れていない場合、これは誰にとってもあまり意味がないかもしれません。この質問の主な核心は、ビルド間で人々がこれをどのように管理するか、そしてどのようにレポートするのが最善かを知ることです。私が言ったようにそれは主観的である場合がありますが知識は答えから得られるのでそれは価値のある質問のようです。

xna performance testing

— Grofit
ソース

素晴らしい質問を1つ。私はまだこれを行っていませんが、すぐにする必要があります。

— ashes999 2012年

明確にするために、プロファイラーや外部ツールについて実際に話しているわけではありませんが、遅いセクションなどの診断に役立つかもしれません。ユニットテストを利用して、状況を把握することについて、また、パフォーマンスを改善しているので、パスファインディングの新しいアルゴリズムを実装し、それを以前のバージョンと切り離してすぐにテストし、数値を比較して、それを改善したこと、または統合することなく時間を無駄にしたことがすぐにわかるようにすることができます。メインプロジェクトに入れてデプロイします。

— Grofit、2012年

あなたの質問は少し混乱しているようです。テストなしで実行できる一般的なパフォーマンス測定について話している。しかし、「テストXは3秒以内に発生する」のようなテストを書くこともできます。

— ashes999 2012年

うん、「テストXは3秒以内に発生する」というのは正しい道に沿っていますが、代わりに「クワッドツリーに5秒でいくつのノードを挿入できるか」のようなテストの結果、1つのビルドの結果は10000、次のビルドは5000になる可能性があります。問題が発生したかどうかをすぐに判断して、情報に基づいた決定を下すことができます。私にとっての問題は、このすべての情報が良いことですが、あなたはそれを見て行かなければなりません。時間内に7500未満のアサートを追加しても問題ないように見えるかもしれませんが、別のマシンで実行すると成功しない可能性がありますが、実際には実装は遅くありません。

— Grofit、2012年

回答:

「実際のゲームを実行する」を完全に排除したいと考えているので、基本的に私の答えは最初から失格です。しかし、おそらくあなたはそれから何かを取り除くことができるので、なぜ私がこれを投稿するのかは関係ありません：

修士論文では、ゲームエンジンのいくつかのモジュールで同じことを達成するために、さまざまな独立した/並列の実装があり、いくつかのパフォーマンス測定を実行する必要があります。技術的には、ゲームを実行して画面上のプロファイラーに表示される数字を見ることだけが妨げになることはありませんが、実装を変更するたびに実行するのは面倒なプロセスであるため、自動化したかったのです。

だから私が持っているのはこれです：

対象の関数/スコープの実行にかかった時間を測定するために使用されるスコープ付きプロファイラー（オブジェクトをスタックに置き、構築時にタイムスタンプを取得し、分解時にタイムスタンプを取得）
特定の数のプロファイルされたサンプルを保存し、最後のn個のサンプルの平均を単純なテキストファイルにダンプするモジュール
ゲームの開始、マップのロード、検査対象のモジュール内で使用されるアルゴリズムの変更、プロファイラーダンプファイルのパスの変更、その他多数の操作に使用できるゲーム内コマンドライン。上記のコマンドラインは、実行可能ディレクトリ内の特定の特別なファイルを確認し、そこから取得した文字列を実行するためにロードするように設定されています（非常に粗雑なプロセス間通信の手段として）。

したがって、これにより私ができることは、適切なスクリプト環境（たとえば、バッチスクリプトによるWindowsコマンドプロンプト-実際にはその目的でRubyを使用する）からアプリケーションを起動し、ダンプファイルのパスを設定し、マップをロードして、そのままにすることです数分間実行し、実行中のゲームを終了し、別のダンプファイルパスを設定し、使用するアルゴリズムを切り替え、マップを再度読み込み、すすぎ、繰り返します。Rubyスクリプトは、コマンドラインモジュールが探している特別なファイルを作成し、コマンドラインが理解できる構文に目的のコマンドを配置することで、ゲームと通信します。

現在、このプロジェクトで継続的な統合を実際に使用していませんが、Rubyスクリプトを起動して、生成されたパフォーマンスログを解析し、パフォーマンスが予期せずにCIシステムと通信するxUnit互換XMLを生成することを妨げるものはありません。なんらかの理由で問題が発生し、ビルドサーバーのすべてのフルビルドでスクリプトを実行します。

私のゲームはXNA（それはプレーンなC ++とDirectXです）で書かれていませんし、このアプローチはビルドサーバーで実際にゲームを実行したくないという事実を尊重していません。それはまた、おそらくあなたが望んでいるものほど柔軟ではありません-それでも、それは自動化されたパフォーマンス測定へのすっきりしたローテクなアプローチであり、ある程度CIにやさしいです（ビルドサーバーが頑丈な場合）。

編集： 私が実際にそのアプローチを取った距離については、この1つのモジュールのみの異なる実装から得られたパフォーマンス測定値のみを比較します。しかし、システム全体は、軽量プロファイリングフレームワークに定義されたカテゴリの1つをダンプし、外部スクリプト環境を使用して、その場で役立つと思われる方法で結果を解釈できるように設定されています。パフォーマンスプロファイリングの側面を方程式から外して、私はさらに

すべてのモデル/テクスチャ/サウンドを含むすべてのマップをロードし、異常がないかエンジンログをチェックして、すべてのアセットの有効性/一貫性を確認します
エンジンのストレステストを行い、数時間/日の期間にわたって予期しない動作がないかログを監視する

— コアル
ソース

すべての良い情報、あなたに+1を与えました。そのサウンドから、あなたが上記で行っていることはすべて、一種の統合テストで簡単に行うことができます。心配する必要があるのは、実際のゲーム/シミュレーションをモックアウトすることだけです。エンジン/フレームワークコンポーネントを分離して独自のコンテキストでテストできるようにすることにスポットを当てているので、ここで説明します。ゲームは絶えず変化するので、ゲームのパフォーマンステストはしたくないので、フレームワークはめったに変更されず、あなたが述べたような特定のシナリオを実行するように簡単に設定できます。

— Grofit 2012年

ありがとう。私が将来達成したいことで指摘されたように、私は実際のゲームで発生するものを自動化することを目指しました-結果は、パフォーマンス測定にも非常に便利でした。

— Koarl 2012年

あなたが有用なツールとして説明していることがわかりません。開発者として、単純なパフォーマンス値はほとんど役に立ちません。

必要なのは、コードのプロファイルを作成し、それを論理的なチャンクに分割して、それぞれが使用するピーク時間と平均時間を測定することです。これで、コードのどの部分が問題を引き起こしているかを知ることができ、最適化を探す場所がわかります。

トリッキーな部分は、あるビルドから別のビルドへのパフォーマンスの変更ではありません。それを把握するための自動化は必要ありません。トリッキーな部分は、異なるマシン間のパフォーマンスの違いです。異なるビデオカードを使用して、あるマシンから別のマシンにパフォーマンスを推定する方法はありません。

したがって、必要なのは、1回のクリックで実行してプロファイリング数を取得できるようにするベンチマーク機能です。これにより、複数のマシンを同時にテストできます。これにはいくつかの方法があります。たとえば、ユーザー入力をオーバーライドして、通常のゲームセッションの実行にできるだけ近づけることができます。

また、メモリリークを特定するために、より長いテストが必要になる場合もあります。

— aaaaaaaaaaaa
ソース

ビルドサーバーを介してソフトウェアを実行する一般的なCIスタイルのアプローチに従う場合は、常に同じマシンでテストするため、常に同じハードウェアでテストすることになります。これにより、数値のベースラインが得られます。それが僕の方向性だったからね。ビルド間のパフォーマンスの変化を把握するためのツールは必要ないと言っていますが、実際に実行して違いを確認することはできますが、ビルドシステムまたは現在のコンピューターでこれらの数値を取得できると便利です。テストを実行する以外のことを行うため。

— Grofit、2012年

テストについて少しでも真剣である場合は、複数の異なるテストマシンが必要です。とにかく、実際の問題は何ですか？ゲームにベンチマークをコーディングする方法がわかりませんか？

— aaaaaaaaaaaa 2012年

そのような問題はありません。私は、何人かの人々がこれを彼らのプロジェクトにどのように適用したかについての情報を得ようとしています。低ハードウェアでは30fpsで、高速ハードウェアでは60fpsで動作するかどうかを実際にテストしていないため、個別のマシンを用意しても効果はないと思います。ハードウェアを方程式から外し、エンジン/ソースコードを完全に調べています。あるビルドを別のハードウェアセットではなく、別のビルドに対してテストしているので、486またはクアッドコアのどちらでテストするかは問題ではありません。

— Grofit、2012年

これについては、GrofitとeBusinessの両方に少し同意する必要があります。自動化されたテストは、特に大規模なプロジェクトでは重要です。ビルドが完了すると、パフォーマンスが低下したり、パフォーマンスが向上したかどうかがわかります。これは1台のマシンで行うのが理想的です。少なくともPCゲームでは、多種多様なハードウェアをテストする必要もあります。自動テストではパフォーマンスが優れていると言えるかもしれませんが、古いGPUでゲームを実行するか、仮想メモリと突然すべてのパフォーマンスタンクにぶつかります。あなたはそれらが顧客の手に届く前にそれらのものをテストできる必要があります。

— ニックフォスター

@Grofit問題は、ビルドを壊すのは古いマシンだけかもしれないということです。新しいコンピューターでの変更によるパフォーマンスへの影響がまったくない、または改善であることは珍しくありませんが、同じ変更により、古いコンピューターでのゲームの実行が完全に妨げられます。ハードウェアを方程式から外すことはできません。分離されたコードのパフォーマンスなどはありません。ただし、1台のマシンだけで自動テスト実行を設定したい場合は、少なくとも古いジャンカーで実行すると、テストが失敗する可能性が高くなります。

— aaaaaaaaaaaa