intel-gpu-topお​​よびintel-gpu-overlayの出力をどのように解釈しますか?


10

これらのコマンドをコンパイルして実行していますが、その内容は少し不思議です。

からのプロセスはintel-gpu-overlay、次のようなものを読み取ります15R, 16B, 41ms waits。何がR何であるか、Bその待機時間は何を示しありませんか、?

それはCPUを持っています:152%(これは私が上から取得するものと同じだと思います)。レンダリング:32%、ビットストリーム:6%、blt:6%。これらの値がボトルネックになる原因となるコードの種類と、それらが発生したときのシステムの動作は何ですか?

以下は、intel-gpu-topのサンプルです。

               render busy:  23%: ████▋                                  render space: 12/16384

                      task  percent busy
                       GAM:  29%: █████▉                  vert fetch: 1380772913 (5386667/sec)
                        CS:  23%: ████▋                   prim fetch: 350972637 (1368891/sec)
                      GAFS:   9%: █▉                   VS invocations: 1375586768 (5385212/sec)
                       TSG:   8%: █▋                   GS invocations: 0 (0/sec)
                       VFE:   7%: █▌                        GS prims: 0 (0/sec)
                       SVG:   3%: ▋                    CL invocations: 677098924 (2648400/sec)
                        VS:   3%: ▋                         CL prims: 682224019 (2663834/sec)
                      URBM:   2%: ▌                    PS invocations: 9708568482932 (34396218804/sec)
                        VF:   2%: ▌                    PS depth pass: 15549624948405 (58732230331/sec)
                       SDE:   0%:                      
                        CL:   0%:                      
                        SF:   0%:                      
                       TDG:   0%:                      
                        RS:   0%:                      
                      GAFM:   0%:                      
                       SOL:   0%:

1
これは、stackoverflowに対するかなり良い答えです。これを閉じるだけです。stackoverflow.com
questions / 28876242

なぜあなたはこれを閉じるでしょう、ここでそのような素晴らしい答えに値しないのですか?
ジョージウドセン2017

回答:


4

OPのコメントに記載されているリンクから取得。

私も興味があったので、リファレンスマニュアルから入手できることをいくつか紹介します。また、興味深いのはintel-gpu-toolsソースであり、特にlib/instdone.cすべてのIntel GPUモデルで表示される内容を記述しています。このパッチは、これらの頭字語をすべて翻訳するのにも非常に役立ちました。

いくつかは間違っているかもしれませんが、より知識のある誰かがチャイムできればそれが大好きです!このことを学んだら、答えを更新するために戻ってきます。

まず、右側の3行:

  • レンダリングスペースは、おそらく通常の3D操作で使用されています。
  • グーグルから、ビットストリームはオーディオのデコードに関するものですか?これは非常に一般的な用語なので、クエリで見つけるのは困難です。ただし、私のGPU(Skylake HD 530)には表示されないため、どこにも表示されない場合があります。
  • ブリッタは巻に記載されています。11と2D操作(ブリッティング)のハードウェアアクセラレーションに責任があるようです。

固定機能(FF)パイプラインユニット(旧式のGPU機能):

  • VF:Vertex Fetcher(vol。1)。3Dパイプラインの最初のFFユニットで、メモリから頂点データをフェッチします。
  • VS:Vertex Shader(vol.1)。GPUによって描画された各プリミティブの頂点について計算します。GPUでのかなり標準的な操作。
  • HS:ハルシェーダー
  • TE:テッセレーションエンジン
  • DS:ドメインシェーダー
  • GS:ジオメトリシェーダー
  • SOL:ストリーム出力ロジック
  • CL:クリップユニット
  • SF:Strips and Fans(vol.1)、主な機能がストリップやファンなどのプリミティブトポロジーをプリミティブまたはオブジェクトに分解することであるFFユニット。

FFユニットとGPGPUの両方のスレッドおよびパイプライン管理に使用されるユニット(これがどのように機能するかについての多くの情報については、インテルオープンソースHDグラフィックスプログラマーマニュアルを参照してください):

  • CS:Command Streamer(vol.1)。コマンドをフェッチして解析し、適切なパイプラインにルーティングするグラフィックスプロセッシングエンジンの機能ユニット。
  • TDG:スレッドディスパッチャー
  • VFE:ビデオフロントエンド
  • TSG:スレッドスポナー
  • URBM:統合リターンバッファーマネージャー

他のもの :

  • GAM:GFX Page Walker(vol。5)は、Memory Arbiterとも呼ばれ、GPUがメモリページを追跡する方法に関係しています。RAMに対するTLBSLATも参照)の動作と非常に似ているようです。
  • SDE:South Display Engine ; 巻によると。12、「サウスディスプレイエンジンは、ホットプラグ検出、GPIO、GMBUS、パネル電源シーケンス、およびバックライト変調をサポートしています。」

クレジット:

StackOverflowユーザー F.X.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.