Mac OS X 10.8のコマンドラインユーティリティを呼び出して、標準のWestern Mac OS Romanエンコーディングで保存されたテキストファイルをより一般的なUTF-8に変換できるようにします。
作成したAppleScriptからユーティリティを呼び出します。非常に大きなテキストブロックで作業する場合、AppleScriptは非常に遅くなります。そのため、OS Xコマンドラインを使用してテキストの解析と変換を行いたいと思います。テキスト解析を実行できる「sed」というツールを見つけました。ただし、ファイルにはutf-8として開かれた場合にゴミとして表示される文字(スマート引用符や省略記号など)をクリーンアップする必要のある要素がまだ多くあります。
テキストエンコーディング変換を強制すると、ファイル内のすべての非utf8文字を削除するのに役立つと考えています。ただし、「sed」がどのようにテキストエンコーディングを簡単に変換できるかはわかりません。
組み込みのAppleScriptルーチンを使用して、MacRomanとしてtemp txtファイルをディスクに既に保存しています。
テキストエンコードを変換できる組み込みのコマンドラインツールについてのアイデアはありますか?私のスクリプトの他のユーザーは、ビルトインではない場合、適切なツールセットを必ずしも持っていないので、パフォーマンスとビルトインのためのコマンドライン。
ご協力いただきありがとうございます!