2
pandocで.docxを.pdfに変換する
メールで受信した.docxをpandocを使用して正しいPDFに変換しようとしています(GNU / Linuxを使用しています)。 文字エンコードに関するエラーがあります: $ pandoc file.docx -o file.pdf pandoc: Cannot decode byte '\x87': Data.Text.Encoding.decodeUtf8: Invalid UTF-8 stream 私はエンコーディングを特定しようとしました: $ file -i file .docx file.docx: application/vnd.openxmlformats-officedocument.wordprocessingml.document; charset=binary charset=binary(私は期待していたcharset=iso8859-15)に少し驚いています。しかし、とにかく.docxをutf8に変換しようとしましたが、機能していません: $ iconv -t utf-8 file.docx P! $iconv: séquence d'échappement non permise à la position 16 pandocドキュメントのコマンドラインでも同じエラーが発生します。 iconv -t utf-8 file.docx | pandoc …