YouTubeに動画をアップロードせずにGoogleのYouTube音声認識を使用する方法
字幕が欲しいレクチャービデオコンテンツがたくさんあります。YouTubeは、特定の条件下でビデオの字幕を自動的に生成します(これらの条件は、いまだに謎です)。 この音声認識技術をYouTube外で使用できるようにしたいと思います。トランスクリプトを取得するためだけにすべてのビデオをアップロードしたくはありません(時間がかかりすぎます)。さらに、約30分(ほとんどの場合)よりも長いビデオに対してYouTubeがそれを行うとは思いません。非公開のリストに掲載されている動画に対してはそれが行われるとは思わない(これは販売することを意図したプレミアムコンテンツであるため問題です)。 完璧なシナリオ:デスクトップから実行してこれらのビデオからトランスクリプトを取得できるプログラムがあり、YouTubeと同等またはそれ以上の品質で、SRTまたはYouTubeが生成するXMLに似たタイムコードを持っています[ How to YouTube字幕を取得する ]。 受け入れられるシナリオ:プライベートまたはパブリックに設定されているかどうかにかかわらず、YouTubeに強制的に動画を転記させるためにできるいくつかのトリックがあります。 実行可能なシナリオ:自分のプログラムをコーディングするために使用できるライブラリーまたは何かがあります。私はC#が得意で、C ++でも大丈夫です(しかし、私は本当にC#が好きです)。