さまざまな形式のビデオを入力として取得し、それらを同じ形式に変換して格納および処理し、オブジェクト検出などの意味分析を行うシステムがあります。
まず、これが企業で採用されている共通の戦略なのでしょうか。
第二に、この質問で尋ねたように ffmpegトランスコード2回損失情報 たとえ入力ビデオと私のシステムの出力ビデオが全く同じフォーマットとエンコーディングパラメータ/設定を持っていたとしても、トランスコーディングプロセスの間に情報の損失があるでしょう。
この情報の損失を最小限に抑えたいのですが、これはコーデックの違いによるのではなく、2番目のエンコードによるものですが、それでも損失のあるトランスコーディングを使用する方法はありますか。
ありがとう。
「これが企業が採用している共通の戦略なのだろうか。」 - 答えるのは難しい。なぜビデオを再度エンコードする必要があるのか説明していません。これが必要なのはどのような処理ですか。意味解析は読み取り専用の操作です。ファイルサイズを小さくしたい場合は、もちろん、再エンコード以外の方法はありません。
—
slhck
私は、ある特定のエンコーディング規格(例えば1)で圧縮されたビデオ用にトレーニングされた意味解析モデルを持っています。しかし、私はそのモデルが他のコーデックでエンコードされたビデオでも同様に機能することを願っています(例えば2、3、...)。したがって、それらを2、3から1にトランスコードしたいと思います。しかし、このトランスコーディングプロセス中に有用な情報を失いたくはありません。
—
apoliver
しかし、モデルはビットストリームデータではなく、ピクセルデータで機能します。損失なしでエンコードしたいだけの場合は、
—
slhck
-crf 0
libx264の場合、たとえば、量子化損失なしでH.264にエンコードされます。しかし、実際にはそれほど現実的な方法ではありません。理想的には、圧縮されていないテストコンテンツから始めて、ニーズに応じてそれをエンコードします。見る vqeg.github.io/software-tools/video-databases
あなたの提案をありがとう。私はそれがMPEG 4コーデック(MPEG 4 Part 2)を使用して損失なしにエンコードすることが可能だろうかと思っていますか?ありがとうございました。
—
apoliver
私が知っているというわけではありませんが、私はMPEG-4 Part IIビデオを長い間使っていません。
—
slhck