これは論評ほどの答えではありません。
品質は、(上記のアーロンが述べたように)1)言語のペアと2)トピックだけでなく、3)属と4)オリジナルのスタイル、5)使用する平行テキストの量など、いくつかのことによって異なりますMTシステムをトレーニングします。
舞台を設定するために、最近のほぼすべてのMTは平行テキストに基づいています。これは2つの異なる言語のテキストであり、一方はおそらく他方の翻訳(または両方は第三言語の翻訳)です。パラレルテキストに特定の単語が含まれていない場合、バックオフとして辞書を使用する(おそらく形態学的プロセスによって支援される)可能性があります。
さらに、他の人が言ったように、MTシステムは翻訳するテキストを決して理解しません。文字の文字列と、文字で構成された単語のシーケンスのみが表示され、以前に翻訳されたテキスト内の類似の文字列とシーケンスが検索されます。(わかりました、それよりも少し複雑で、計算システムのセマンティクスを取得しようとする試みがありましたが、今のところほとんどが文字列です。)
1)言語は異なります。一部の言語には多くの形態があります。つまり、他の言語が複数の単語で行うのと同じ単語で処理するということです。簡単な例は、スペイン語の「cantaremos」=英語の「we will sing」です。そして、スペイン語の非公式/正式な(tu / usted)区別のように、ある言語は他の言語でも気にかけないことをするかもしれません。または、ある言語は、別の言語が語順で行う形態学で処理する場合があります。または、言語が使用するスクリプトは、単語の境界さえマークしない場合があります(中国語など)。2つの言語が異なるほど、MTシステムがそれらの間で翻訳するのが難しくなります。統計MTの最初の実験はフランス語と英語の間で行われ、
2)トピック:聖書に平行したテキスト(ほぼすべての書かれた言語に当てはまる)があり、MTシステムをそれらからトレーニングする場合、エンジニアリングテキストでうまくいくとは思わないでください。(まあ、とにかく、MTシステムのトレーニングの基準では、聖書は比較的少量のテキストですが、ふりをしてください:-)。構造。(文法は基本的に同じですが、たとえば英語では、科学および工学のテキストでより受動的な声と複合名詞が得られます。)
3)属:パラレルテキストがすべて宣言的である場合(トラクターのマニュアルなど)、ダイアログで結果のMTシステムを使用しようとしても、良い結果は得られません。
4)スタイル:ヒラリー対ドナルドを考える; 博学と人気。一方のトレーニングでは、もう一方のトレーニングでは良い結果が得られません。同様に、成人レベルの小説でMTシステムをトレーニングし、児童書で使用します。
5)言語ペア:英語には多くのテキストがあり、特定の英語テキストと並行する他の言語のテキストを見つける可能性は、たとえばロシア語とイボ語の並行テキストを見つける可能性よりもはるかに高いです。(そうは言っても、インドの言語のような例外があるかもしれません。)総括として、MTシステムを訓練しなければならない平行テキストが多ければ多いほど、より良い結果が得られます。
要するに、言語は複雑です(だからこそ、私はそれを愛しています-私は言語学者です)。したがって、MTシステムが常に適切に機能するとは限りません。
ところで、人間の翻訳者もいつもそううまくいくとは限りません。10、2年前、私は人間の翻訳者からのドキュメントを英語に翻訳し、MTシステムのトレーニング資料として使用していました。翻訳の一部は理解するのが難しく、2人(またはそれ以上)の人間の翻訳者から翻訳を得た場合、翻訳者が同じドキュメントを読んでいたとは信じがたいものでした。
そして最後に、正しい翻訳は1つだけではありません。パッセージの翻訳には複数の方法がありますが、どの機能(文法の正確さ、スタイル、使用の一貫性など)に応じて、多かれ少なかれ良いかもしれません。「精度」の簡単な尺度はありません。