ダウンロード元のWebサイトのURLをファイルに関連付ける方法はありますか？

Ubuntuを使用して、ファイルがダウンロードされたWebサイトのURLをそのファイルに関連付ける方法を見つけようとしています。これまでに調査したことによると、URLは拡張属性を使用して保存できますが、私の問題は、ファイルがダウンロードされたサイトのURLを知る/インターセプトする方法です。

次のリンクも見つけました-http://www.freedesktop.org/wiki/CommonExtendedAttributes/- しかし、これがまだ開発中であるか、ダウンロードしてインストールできるかはわかりません。

— user2900870
ソース

実際にファイルをダウンロードするプログラムの仕事のように見えます。

— drk.com.ar 14

のようなプロキシサーバーを使用している場合squid、データはアクセスログで利用できます。アクセスログはローテーションされ、最終的に削除されます。データは、アクセスログが利用可能で、保存に使用されるファイル名がURLと一致する限り、ダウンロードしたファイルと簡単に一致させることができます。ファイルがキャッシュされている場合、キャッシュヘッダーにはファイルのソースが含まれます。

html ファイルには、ページのダウンロード元のホストを示すメタデータが含まれる場合があります。

ダウンロードプログラムがダウンロード時に拡張属性を書き込むと、はるかに簡単になります。私はそれを知りません。

などのツールwgetは、URLのドメイン名を使用して名前が付けられたディレクトリ構造にファイルを保存します。これは、拡張属性を設定するために使用できます。

このデータを収集するユースケースは何ですか？

— ビルソー
ソース

さて、ファイルがダウンロードされたWebサイトのURLを拡張属性で保存するアプリケーションを開発しようとしています。この情報をダウンロードした各ファイルに関連付けると面白いと思いました:)

— user2900870 14

@ user2900870アプリケーションがダウンロードを実行している場合、属性を追加するのは簡単です。他のアプリケーションは一般に、簡単にアクセスできる場所の周りにその情報を保持しないでください。

— BillThor 14

それは、私は、このアプリケーションは、何らかの形でファイルをコンピュータに保存されているウェブサイトのURLをインターセプトする必要がありますが、私が読んでいるもののために私は私のアプローチを再考する必要があり、それはファイルをダウンロードし開発していたアプリケーションではありません

— user2900870