一意のファイル名と新しいファイルの束は、定期的に「見える」1を 1台のサーバー上で。(毎日数百GBの新しいデータと同様に、ソリューションはテラバイトまで拡張可能である必要があります。各ファイルのサイズは数メガバイトで、最大で数十メガバイトです。)
これらのファイルを処理するマシンがいくつかあります。(数十、ソリューションは数百まで拡張可能でなければなりません。)新しいマシンを簡単に追加および削除できるようにする必要があります。
各着信ファイルをアーカイブストレージにコピーする必要があるバックアップファイルストレージサーバーがあります。データは失われてはならず、すべての受信ファイルは最終的にバックアップストレージサーバーに配信される必要があります。
各受信ファイルは、処理のために単一のマシンに配信さミスト、およびバックアップストレージサーバにコピーされるべきです。
受信サーバーは、途中で送信したファイルを保存する必要はありません。
上記の方法でファイルを配布するための堅牢なソリューションをアドバイスしてください。ソリューションは Javaに基づくものであってはなりません。Unix方式のソリューションが推奨されます。
サーバーはUbuntuベースで、同じデータセンターに配置されています。他のすべてのものは、ソリューション要件に適合させることができます。
1 ファイルシステムへのファイルの転送方法に関する情報を意図的に省略していることに注意してください。その理由は、今日、ファイルがいくつかの異なるレガシー手段によってサードパーティから送信されているためです(奇妙なことに、scp経由、およびØMQ経由)。ファイルシステムレベルでクラスター間インターフェイスを切断する方が簡単に思えますが、実際に特定のトランスポートが必要なソリューションがある場合は、レガシートランスポートをそのトランスポートにアップグレードできます。