XML、HTML、およびXHTMLドキュメントの有効なコンテンツタイプ


123

XML、HTML、およびXHTMLドキュメントの正しいコンテンツタイプは何ですか?

これらの種類のファイルのみをフェッチする単純なクローラーを作成する必要があります。

現在、http://example.net/index.htmlは、たとえばmod_rewriteによりJPEGファイルを提供できるため、応答ヘッダーからコンテンツタイプを確認し、許可されたコンテンツタイプのリストと比較する必要があります。

そのようなリストはどこから入手できますか?


フラグメントについては、stackoverflow.com / q
Peter Krauss

回答:


206

HTML:、text/htmlフルストップ。

XHTML application/xhtml+xml:、またはHTML互換性ガイドラインに従っている場合のみtext/html。W3 Media Types Noteを参照してください

XML:text/xmlapplication/xmlRFC 2376)。

application/rss+xmlまたはなど、XMLをベースにした他の多くのメディアタイプもありますimage/svg+xml。認識されていないが登録されている末尾+xmlがXMLベースであることは間違いありません。末尾が。の登録済みメディアタイプについては、IANAリストを参照してください+xml

(未登録のx-タイプの場合、すべての賭けはオフに+xmlなりますが、尊重されることを望みます。)


32
違いについてはtext/xmlapplication/xmlこちらをご覧ください。stackoverflow.com
questions / 4832357 /

同じことがフラグメントも当てはまります。w3.org / TR / xml-fragmentまたはこの他の説明を参照してください。
Peter Krauss
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.