この答えはすべてのテストに合格しますが、フローチャートはテスト文書にあります。
sudo apt-get install unoconv
doc2pdf respondus-docx-sample-file.docx
これが他の方法がこれまで示唆しているよりも優れているのはなぜですか?
これまでに提案された他のメソッド(特にoowriterおよびebook-convert)をテストしましたが、このメソッドよりも少ないテストに合格しています。このebook-convertメソッドは、ドキュメントから余白とテキストの一部を取り除きます。
この方法は、rainbowpdfのようなプロフェッショナルなコンバーターよりも優れた結果をもたらします。
また、htmlに変換しようとしましたが、円の中に正方形が描かれた図面とフローチャートは正しくありません。
フローチャートテストが失敗するのはなぜですか?
libreofficeとunoconvには、.docxファイル内のフローチャートを正しくレンダリングする際にいくつかの問題があるようです。これはおそらく、Microsoft Officeでスマートアートを使用して作成されたためです。それは問題。これもこのスレッドで説明されているバグです。あなたが見ることができるように、テキストと視覚情報は上記の方法から生じるpdfにあります(しかし、私はテキストを選択しなければなりませんでした)。

たとえば、フォントの色が適切に読み取られず、一部の行が長すぎます。スマートアートを正しく表示できるLinuxソリューションを知りません。:(
これはprint、このページに掲載されているすべてのソリューションが満足できない理由でもあります。
要するに
要するに、あなたがしていることは本当に難しく、現在あなたを完全に満足させる解決策はありません。docx2pdf変換のアキレス腱はスマートアートです。それなしで生活できるか、スマートアートを見つけて何らかの形で画像に変換する方法を見つけることができれば、目標を達成できます。
オプション1.ユーザーに問題を処理させる
これは非常に洗練されたソリューションです。コンテンツ作成者は、オフィスのヘルプページで説明されているように、スマートアートをjpgとして保存できます。したがって、サーバー上で変換が可能になります。
オプション2.問題を回避する
多くの場合、フローチャートが非常によく似ていて、開発者の能力に応じて、スマートアートを個別に変換することができます。ドキュメントの.docxクラスターからdrawing1.xmlファイルを抽出し、自然言語処理とクレイジーハックを使用してスマートアートを再構築できます。たとえば、このタイプのxmlをいじる必要があります。
<dsp:txBody>
<a:bodyPr spcFirstLastPara="0" vert="horz" wrap="square" lIns="8255" tIns="8255" rIns="8255" bIns="8255" numCol="1" spcCol="1270" anchor="ctr" anchorCtr="0">
<a:noAutofit/>
</a:bodyPr>
<a:lstStyle/>
<a:p>
<a:pPr lvl="0" algn="ctr" defTabSz="577850">
<a:lnSpc><a:spcPct val="90000"/>
</a:lnSpc>
<a:spcBef>
<a:spcPct val="0"/>
</a:spcBef>
<a:spcAft>
<a:spcPct val="35000"/>
</a:spcAft>
</a:pPr>
<a:r>
<a:rPr lang="en-US" sz="1300" b="1" kern="1200"/>
<a:t>All three sides are different lengths
</a:t>
</a:r>
</a:p>
</dsp:txBody>
または最小限のソリューションとして、あなたは、少なくとも抽出(テキストを<a:t>簡単な方法で?)ファイルから、それに保存します。または、pdfのフローチャートがすべて同じ場合、xml自体のテキストの色と行の長さを変更するスクリプトを作成できます。その後、実行することができdoc2pdf、本質的にすべての正しい情報を持っているファイルがありますが、おそらくフォーマットはありません。フローチャートの場合、おそらくフォーマットの一部も含める必要があります。これは、フォーマットが情報の一部であるためです。
オプション3.サードパーティのサービスを使用する
過去数日間、さらに調査を行ったところ、完全に変換を行うサービスzamzarが見つかりました。Zamzarでは、docxファイルをアップロードして、リンクをメールで送信できます。また、任意のファイルをpdf@zamzar.comに送信し、変換したファイルを受信トレイに戻すことができる(有料?)サービスもあります。ファイルを自動的に送信し、電子メールから解析するシステムを簡単に構築できます。これはそれほど多くの作業ではなく、最終的な結果が最高です。
ノート
このページで提案されているさまざまな方法を実際にテストするのに時間がかかりました。実際のテストでコメントをバックアップしてください。