回答:
私はこれについて研究してきましたが、十分面白いです。
S3へのバックアップは、最終的な一貫性のために、地域によっては失敗する可能性があります。基本的な警告は、これを十分に行うと、サーバー間でAmazonが同期するバックグラウンドでのファイルシステムの魔法により、ある時点でファイルのオープンまたは検索エラーが発生するため、バックアップが信頼できない場合があることです。
別の方法で保存する必要があるかどうかは、リスク管理に依存します。Amazonがデータを保持することを信頼していますか?
何かを失ったり、ストレージシステムに大きな障害が発生したりする可能性があります。彼らはあなたのデータを失ったらそれがあなたの問題だと明記する条項を契約に持っていることは間違いありません。彼らのものではありません。また、データが他の場所に格納されているのを見ると、データがそれで何をするのかわかりません。法執行機関はあなたのデータが欲しいですか?他の誰かがアクセスしたことさえ知らないかもしれません。
あなたはそれを信頼していますか?データがビジネスにとって重要ではなく、このリスクを受け入れても構わない場合は、オフサイトストレージにダウンロードする必要はありません。Amazonのストレージサーバーでデータが安全であるというリスクがない場合は、定期的に自分のストレージにダンプするよう手配する必要があります。
言い換えれば、これはあなたのリスク許容度とビジネスのニーズに依存するため、これに対する直接的な答えはないと思います。多くの人々は、クラウドでのストレージだけで収入を完全に信頼するわけではありません。個人的には少し警戒心があります...
これをより良くするために、議論と研究で検討すべき別のアプローチは、データを保存し、EC2インスタンスにアタッチし、そこにデータを保存するのに十分な大きさのEBSボリュームを作成し、次にボリュームをアンマウントし、そのデータをS3に保存することです。ボリュームファイル自体をS3に保存するか、コンテンツに保存するかを調査していますが、ストレージコストを節約するためにEBSインスタンスを削除できます。
編集すると、その逆ではなく、S3からEC2インスタンスに保存していることが再読されます(最終的な一貫性の問題がまだ問題を引き起こす可能性があるかどうかはわかりませんが)。バックアップとしてEC2インスタンスにデータを保存しようとしていますか?コスト面ではそれは健全な戦術ではないと思います。そのような種類のデータの長期保存とVM時間を考慮すると、物事をローカルドライブにバックアップする方が安くなる場合があります。ドライブコストを使用すると、バックアップとしてデータをローカルディスクにコピーできます。
Amazonとそのストレージを信頼することについての警告を引き続き保持します。すべてをAmazon S3に保持し、冗長性を高めたい場合は、リージョン間でS3バケットを複製し、1つのリージョンに影響する停止がある場合、それらすべてをノックアウトしないでください。あなたは願っています。しかし、何でも可能です。
それは、データをどれだけ評価するか、そのデータに対してどれだけ支払う意思があるか、そしてどの程度のリスクを許容したいかにかかっています。
これを行うにはs3cmd を使用s3cmd sync
しました。動作は少しrsyncに似ており、S3と選択した別のLinuxシステムとの間でディレクトリ全体をプッシュおよびプルできます。
s3cmd sync
実行中のEC2インスタンス、または独自の開発者ワークステーション(またはストレージサーバー)にアクセスできなかった理由はわかりません。
VPCインスタンスを設定し、VPC内の小さなノードにバックアップサーバーの役割を割り当て、Amazonのネットワーク内とローカルサブネット内の両方にIPを割り当てることができます。
これは古いスレッドですが、Googling S3バックアップ時に最初に表示されるので、追加することを考えました...
これについて自分で調べてみると、Rclone https://rclone.org/を発見しました。これは、クラウドファイルストレージサービス間でコピーし、それらのほとんどをサポートするように設計されたrsync-ishソフトウェアです。所属していないので、まだ使用していないので、良いか悪いかは言えませんが、誰かに役立つかもしれないと思いました。
クラウドでホストされたファイル(S3、Googleストレージ、Rackspaceクラウドファイルなど)の「オフサイト」バックアップを行うホストサービスの機会があるように思えます。