Speech-to-Textを使用して字幕を自動的に生成するプログラムですか?


12

字幕を作成したいビデオがあります。初歩的な音声からテキストへの変換を実行できるプログラムはありますか

  1. 個々の字幕の正しい開始/停止を設定します
  2. 初歩的なテキストの字幕を作成する(何らかの音声読み上げを使用)

私はgnome-subtitlesについて知っています。ただし、これらの字幕を手動で作成するには多大な労力が必要です。各文の開始と停止を自分で選択する必要があります。

Youtubeには上記の機能があります(音声テキストを使用して、正しいタイミングで基本的なテキストの字幕を作成します)。ただし、字幕を取得するためだけにYouTubeに動画をアップロードすることは避けます。Ubuntuで字幕を効率的に行うことは可能ですか?

更新:.srt字幕のみを使用する予定であり、ビデオにハードコーディングする必要はありません。私の最大の要件は、プログラムが各文の開始/停止を自動的に見つけて、その中にテキストを書くことです。

アップデート#2:Linux用のSpeech-to-Textソフトウェアがあり、CMU Sphinxパッケージが含まれています。http://sourceforge.net/projects/cmusphinx/forums/forum/5471/topic/3949891に従って、字幕プログラムでCMU Sphinxを使用することが可能です。さらに、1つの字幕ツールがこのCMU Sphinx機能、httpを認識しています。 //groups.google.com/group/universal-subtitles-testing/browse_thread/thread/613361ffb921b43b(Webベースのツール)、ただし、CMU Sphinxを追加した最新のソースコードには参照がありません。Youtubeで既に行われているように、基本的な音声からテキストへのCMU Sphinxを使用するプログラム(正しいタイミングも設定される)を探し続けています。


このようなことをするカササギと呼ばれるアプリケーションがあります。
RolandiXor

回答:


3

私は数年前にWindowsでAegisubを使用しましたが、本当に満足していました。どうやらLinuxで利用可能です。それはかなり自明です。

Aegisubは、.srtファイルなどの字幕ファイルのみを作成します。ビデオと字幕を組み合わせてハードコードされた字幕を作成するには、2番目のプログラムを使用する必要があります。
WindowsではVirtualDubを使用しましたが、Linuxでは使用できません。LinuxでVLCを使用してこれを行うことができます

Aegisubで潜水艦を作成し、通常どおり.assファイルとして保存します。

VLCを使用して、その字幕トラックをビデオに追加します。字幕->字幕ファイルを追加...

字幕の表示スタイルと設定を構成して、好みに合わせて表示します。ツール->設定->字幕/ OSD

これで、ビデオを見て、潜水艦が意図したとおりに表示されていることを確認できます。たとえば、Aegisubで指定した特定のサブをチェックして、画面の下部ではなく上部に表示することができます。

出力は現在の表示と同じになるため、すべてが正常であることを確認してください。

  1. メディアに移動->変換/保存...(Ctrl + R)。

  2. [ファイルの選択]で、ビデオファイルを追加します。「字幕ファイルを使用する」にチェックマークを付けて、.assサブファイルを参照します。

  3. [変換/保存]ボタンの下矢印をクリックし、[変換...](Alt + O)をクリックします。

  4. [設定]で、[変換]オプションがチェックされていることを確認します。[出力の表示]オプションにチェックマークを付けます。これをチェックしない限り、何らかの理由で潜水艦は追加されません。

  5. ビデオとオーディオの設定が希望どおりになるようにプロファイルを編集します。[字幕]タブで、[字幕]ボックスにチェックマークを付け、DVB字幕コーデックを使用します。「ビデオの字幕をオーバーレイする」にチェックを入れてください。保存を押します。

  6. [宛先]ボックスに宛先フォルダーとファイル名を入力します。

  7. スタートを押します。

それが行われるのを待ち、それで終わりです。この方法の注意点は、ビデオでエンコードがリアルタイムで行われるため、2時間のビデオがある場合は2時間かかることです。これは、「出力の表示」ボックスにチェックを入れているためです。しかし、何らかの理由で、これにチェックを入れたときにのみ機能します。

他の字幕エディターもあります。

更新:
Aegisubに、字幕ファイルの音声文の開始と終了を自動的に設定する機能があることを覚えていません。そして、私はサイトのどこにもそのような機能の言及を見ません。ただし、(キーの組み合わせ)を使用すると、これらの時間を手動で設定するのは非常に簡単です。

そのような機能を備えたプログラムもありますか(すべてのOS)。


私もWindowsでAegsubを使用しましたが、Linuxで利用できることに気づきませんでした。Pit :)に感謝します。Aegsubは非常に有能な字幕です。形式).. Unicodeを処理し、カラオケテキストを準備するための特別なツールを持っています....
Peter.O

2
Aegisubをありがとう。このプログラムのワークフローを把握しようとしています。ビデオ全体をスキャンして、各字幕文のタイミングを作成できますか?音声テキスト変換機能はないようです。
user4124

docs.aegisub.org/manual/…を読むことをお勧めします。
ピット

Aegisubは字幕を自動的に生成しません。それを使って字幕を書かなければなりません。したがって、これはおそらくこの質問の解決策ではありません。
Harshitha Palihawadana

質問は私の答えの3年後に編集されました。オリジナルの「ビデオの字幕を作成するために使用するプログラム」は、自動または音声合成から何も言及していませんでした。
ピット

3

ビデオの音声を分析して、字幕プログラムに初歩的な字幕を自動的に追加する方法を見つけられませんでした。

したがって、私が使用する代替手段は

  1. YouTubeにビデオをアップロードし(たとえば、プライベートに)、ビルド機能を使用して、初歩的な字幕を自動的に作成します。

次に、

  1. Youtubeの自動化された方法が機能しない場合、または文章に誤りがある場合は、ビデオをhttp://www.universalsubtitles.org/に追加し、各文章の時間枠を手動で作成します
  2. 使用GNOME字幕字幕をクリーンアップし、任意のタイミングを修正するために(ソフトウェアセンターにあります)。

1
この回答は、字幕ファイルを自動的に生成する問題に最も関連があるようです。
ギャレット14年

YouTubeが(大まかな)字幕を自動的に生成できるのは驚くべきことですが、明らかにできるプログラムはありません。
ギャレット14年

3

個人的にはGnome Subtitlesが好きで、リポジトリで入手できます。

sudo apt-get install gnome-subtitles

1

このコマンドラインユーティリティを使用できます

Autosubは、自動音声認識と字幕生成のためのユーティリティです。ビデオまたはオーディオファイルを入力として受け取り、音声アクティビティ検出を実行して発話領域を見つけ、それらの領域のトランスクリプションを生成するためにGoogle Web Speech APIに並列リクエストを行い、(オプションで)別の言語に翻訳し、最終的に結果を保存しますディスクへの字幕。

https://github.com/agermanidis/autosub/

Python3ユーザーは、これを行います:

pip install git+https://github.com/BingLingGroup/autosub.git@alpha

ffmpegがインストールされていることを確認してください。


0

わかりました、字幕ワークショップに似ている見栄えの良いツールが見つかりました-字幕エディター(apt-get install subtitleeditor)。

Gnome Subtitlesと比較してみましたが、字幕エディターはより高度なツールに見えます。


0

KDEの場合、優れた字幕エディターはsubtitlecomposerです。コマンドでインストールします

sudo apt-get install subtitlecomposer

またはlink subtitlecomposerを使用して subtitlecomposerをインストールする

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.