「ソースの表示」-Word文書と同等ですか?


11

Word文書は多かれ少なかれ壊れているように見える場合があります。通常、レイアウトが非常に複雑になり、文書が数回手やバージョンを変更した場合です。症状は、文書の特定の場所で本当に機能するはずの場所でキーBackspaceまたはEnterキーを押しても何も起こらないこと、またはフォーマットが多少ランダムに適用およびリセットされるように見えることです。私たちは皆そこにいたと思います。

多くの場合、Wordの内部で起こることは非常に不透明なので、何が間違っているかを正確に知ることは非常に困難です。空のように見えるドキュメントを作成することもできますが、実際にはフォーマットなどに関する基本的な状態は非常に複雑になる可能性があります。

このような場合、ページに表示されるものの背後にあるソースコードを覗いてみると便利です。ブラウザでソースを表示する方法や、理想的には、ラテックスを使用するときのように、ソースコードで直接編集を行うことができます。Microsoft Word文書用のソース表示コマンドまたはユーティリティはありますか?

私の推測では、そのようなコマンドは存在しないか、それについて聞いたことがあるでしょう。その場合、Word文書で迷惑な「隠された書式設定」を把握することに関して、だれかが良いアプローチを取っていますか。

.doc形式と.docx形式にはいくつかの違いがあると思われます。私は両方のケースに興味があります。

回答:


11

書式設定が主に関心のあるものである場合、Wordには、Reveal Formattingと呼ばれるテキストおよびオブジェクトに適用されるすべての種類の書式設定を検査するための優れた機能があります。Word 2007および2010では、このパネルのショートカットはShift+ F1です。

ここに画像の説明を入力してください

それ以外の場合は、ドキュメント形式のさらに深い理解を探しているなら、DOCXファイルのXMLを見ることができます。

  1. ディスクでDOCXドキュメントを見つけます。
  2. ドキュメントの拡張子を.docxから.zipに変更します。
  3. ファイルをダブルクリックして、デフォルトのアーカイブマネージャーで開きます。
  4. zipプログラムの「Word」フォルダーに移動し、Document.xmlを開き ます。これは、ドキュメントコンテンツの大部分を構成するコードの背後にありますが、他のファイルもスタイルやフォント情報などの他の方法で使用されます。

データを表示するためだけにまともなXMLエディターが必要になりますが、それでも非常に複雑で、大きなドキュメントの場合は非常に長くなります。

DOCに関しては、別個のストリームで構成されるバイナリファイルであるため、「ソースを表示する」簡単な方法はなく、したがってコンテンツを表示する簡単な方法はありません。


それは非常に便利です、私はそれを知りませんでした。ただし、.docファイルについても同じことができないのは残念ですが、それは私の会社が今でも使用していることです。しかし説明をありがとう!
ゴッドスミス

1
@Godsmith新しいバージョンのWordを使用してDOCXとしてDOCを保存し、変更を加えた後にDOCに戻すことができます。このプロセスではフォーマットが失われますので、注意してください。ただし、DOCXで行うことで、DOCタイプに変更を加えたり問題を修正したりできる場合があります。
ThisClark

また、MS WordでファイルをHTMLとして直接保存することもできます。あるいは、RTFとして保存し、RTFファイルをテキストとして開くことができます
-phuclv

3

.doc形式はかなり難しいと思いますので、ここでお手伝いすることはできません。ただし、.docxは、実際にはすべての詳細がXMLファイルに保存されたzipファイルです。したがって、ファイルの名前を.zipに変更し、ソースを確認してください!


0

* .docのようなバイナリ形式になると、事態は複雑になります。LibreOfficeのmso-dumperを使用できます。ソリューションをローカルマシンに複製して実行するだけです

python doc-dump.py \path\to\file.doc >output.xml

これで、バイナリファイル内のすべてのものが、以下で説明されている正確な形式のxmlに変換されます。 Word(.doc)バイナリファイル形式でます。

またあります WordFileDumpます。これはmso-dumperほど簡単ではませんが、強力ではません。

残念なことに、これらは構造を分析するためのものであり、xml出力を* .docファイルに再アセンブルするツールはありません。そのため、根本原因を見つけたら、Wordを使用して編集する必要があります。したがって、*。docxに変換し、*。docxファイルを調べ、必要に応じて* .docに変換し直すのが簡単です

または、ファイルをrtfとして保存することもできます。rtfは、office xmlの代わりに「人間が読める」テキストファイルです。または、Wordファイルをhtmlとして保存します

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.