既存のTXTファイルからTMXを作成する方法


1

印刷された形式の本がいくつかあります。コンピュータが主流になる前にそれらは英語からノルウェー語に翻訳されていたので、私はスキャナを通して翻訳を実行し、それをOCRしました。英語版はすでにデジタル化されていました。

私が修正する必要があるOCRエラーがあります、そしてまた私は英語の原文とノルウェー語訳の段落を合わせる必要があります。

Zanataのような翻訳メモリプログラムを翻訳用のツールとリポジトリとして使用する必要があるようですが、その前に既存の翻訳間のセグメントに一致するTMXファイルを作成する必要があります

どのように私はそれをやっていくことができますか?それとも、私はこの問題を間違った角度で攻撃していますか?


1
「翻訳を整列させる」とは説明的な用語です。 across.net/online-help/across/acrossHaupt141.htm
nitech


1
そしてこれ: sourceforge.net/projects/aligner - Windowsで動作します
nitech

回答:


0

"Align Translations"を検索すると、すでに翻訳された文書の段落(または文章)を揃えるために特別に設計されたいくつかのツールが見つかります。

私が使った sourceforge.net/projects/aligner これはクロスプラットフォームです。私はこのツールにはあま​​り感心していませんが、上の質問に限って言えば、仕事を終わらせることができます(テキストを整列させてからTMXファイルを作成することができます)

しかし、私は上記の質問から明らかではない理由でツールを残すことになりました。改行の数に関しては、オリジナルのものと正確に一致するテキストファイルを出力するようにアライナに要求しました。 LF Alignerは進行中のプロジェクトをテキストファイルに保存しますが、いくつかの問題がありました。

  • 私が二度目にプロジェクトを開いたとき、整列のいくつかはめちゃくちゃでした。特にこれは私が空の段落を追加した場所に関係していました。
  • 元の言語と翻訳の両方で空の段落を処理する一般的な問題。

私はこれを行うことができるツールを見つけたら私はこの記事にもっと情報を追加します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.