バックアップ用のクラウドサービスを選択する方法


12

クラウドサービスを使用して、クライアントのWebサイトの1つをバックアップすることを考えています。

私(クライアント)の主な関心事は(重要度の降順)

  1. IP(企業秘密、ソースコード)、ユーザーアカウントの詳細などの保護
  2. サービスプロバイダーが提供するアップタイム保証(Webサーバーのダウンタイムを最小限に抑えるため)
  3. 費用
  4. アップロード/ダウンロード速度

理想的には、長く結びついていないサービスが必要です(つまり、「従量制」サービスのようなものを好むでしょう)

また、別のサービスに移動することがほとんど不可能なベンダーロックインも避けたいと思います。

以下に関する一般的なガイドラインが必要です。

  1. サービスプロバイダーの選択方法
  2. フィールドの主な選手は誰ですか
  3. 使用するソフトウェアの推奨事項:バックアップ/復元/および保存/復元されたファイルのアップロード/ダウンロード

サーバーソフトウェアは、UbuntuまたはDebianのいずれかになります(サーバーとして使用するOSについては、おそらく質問を投稿します-私はすでにUbuntuに精通しています)


ウェブサイトの大きさは?大規模なデータベースが含まれていますか?顧客がいくら使ってもいいかについての球場の数字はありますか?(100ドル/月、10,000ドル/月?)
RJFalconer

3
「企業秘密とソースコード」に関する限り、非常に重要な情報は、サービスがいかに評判の良いものであるかに関係なく、「クラウド」に属していません。

回答:


4

所有者が保持するキーによるクライアント側の暗号化を含まないソリューションは、最初に述べた要件(IP保護/セキュリティ)を満たしません。サーバー側のハッキングは暗号化されていないデータを公開します。これにより、キーを所有するDropboxなどのクラウド同期システムが除外されます。

ある時点でハッキングされる可能性が高いWebサイトのサーバーで、すべての重要な暗号化キーをホストしないようにするには、次のようにします。

  1. 顧客自身のサイトの社内バックアップサーバー-他の両方のサーバー用の暗号化キーとSSHキーがあります
  2. Webサイトをホストするサーバー-Webホストである可能性があります
  3. クラウドバックアップサーバーまたはサービス

ステップ1:サーバー(1)は(2)からバックアップを取得するため、Webサイトサーバーのほとんどのハックはバックアップを危険にさらしません。この時点で暗号化が行われます。

  • 私が使用するrsnapshotをバックアップする大規模なDBを持っていない限り、それは、帯域幅や店舗サイトの複数のバージョンでは非常に効率的である、 -これはバックアップサーバのWebホスト上で、社内最低限の要件を持っているように、キーベースのログインを使用してSSH経由また、古いバックアップの削除も処理します。
  • 暗号化は、GPGなどのファイルからファイルへのツールで実行でき、rsnapshotツリーを別のツリーにコピーできます。または、手順2で重複を使用してディスク容量を節約できます。
  • バックアップサーバーからの「プル」は重要です。メインサーバー(2)にバックアップサーバーのパスワード/キーがある場合、ハッカーはメインサーバーをハッキングした後にバックアップを削除できます(以下を参照)。高度なハッキングにより、トロイの木馬のSSHバイナリがインストールされ、バックアップサーバーが侵害される可能性がありますが、ほとんどの企業ではそうではありません。

ステップ2:サーバー(1)は暗号化されたバックアップを(3)にプッシュし、オフサイトバックアップを作成します。手順1でバックアップが暗号化されている場合は、リモートシステムに対してローカルrsnapshotツリーのrsyncミラーを使用できます。

  • 二枚舌は、リモートサーバへの直接暗号化とバックアップ暗号化されていないrsnapshotツリーに良いオプションになります。Duplicityの機能は、GPGで暗号化されたtarアーカイブを使用するrsnapshotとは少し異なりますが、リモートホストでバックアップ暗号化を提供し、そのホストでSSHのみを必要とします(またはAmazon S3を使用できます)。Duplicity はハードリンクをサポートしていないため、これが必要な場合(サーバーの完全バックアップなど)、スクリプトがrsnapshotツリー(ハードリンクをサポートしている)をtarファイル(> 1つのハードリンク。これは非常に小さくなります)。したがって、重複によりtarファイルをバックアップできます。
  • リモートサーバーはSSHホストであり、rsyncを使用している可能性があるため、Webホスト(ただし、異なるホスティングプロバイダーおよび国の異なる部分から)、またはrsyncおよび/またはSSHを提供するクラウドサービスになります。クラウドへのrsyncバックアップに関するこの回答は、bqbackupとrsync.netの推奨についてのものですが、言及したバックアップのセットアップには同意しません。
  • 重複のあるリモートサーバーとしてAmazon S3を使用できます。これにより、非常に優れた可用性が得られますが、大規模なバックアップの場合はコストがかかる可能性があります。
  • リモート暗号化バックアップのその他のオプションには、Boxbackup(それほど成熟していない、いくつかの優れた機能)とTarsnap(シンプルなコマンドラインインターフェイス、優れた重複排除、非常に徹底した暗号化を備えたAmazon S3に基づく商用クラウドサービス)があります。

すべてのさまざまなホストのセキュリティは重要であるため、クライアントのセキュリティプロファイルに合わせて調整する必要があります。つまり、脅威、リスク、攻撃ベクトルなどを分析する必要があります。しかし、すべてのサーバーでセキュリティへの注意が必要です。

このセットアップは、2つの独立したバックアップを提供します。1つは高可用性クラウドストレージサービスであり、プルモードで動作するため、Webサイトへのほとんどの攻撃は同時にバックアップを破壊できません。多くの管理が必要です。

  • ハッカーはWebサイトのハッキングと同時にすべてのバックアップを実際に削除することがあるため、独立したバックアップが重要です-最新の場合、ハッカーは4800のWebサイトを破壊しました。これには、サイトではなくWebホスティング環境のハッキングによるバックアップも含まれます。この回答これも参照してください。
  • rsnapshotを使用すると、復元が非常に簡単になります。バックアップされたファイルごとに各スナップショットツリーに1つのファイルがあるので、Linuxツールでファイルを見つけてrsyncするか、Webサイトに戻します。何らかの理由でオンサイトバックアップサーバーが使用できない場合は、重複を使用してクラウドバックアップサーバーから復元するか、GPG、rdiff、tarなどの標準ツールを使用してバックアップを復元できます。

このセットアップは標準のSSHとrsyncを使用するため、適切なアップタイム保証、強力なセキュリティなどを備えた適切なプロバイダーを選択する方が簡単です。長い契約を締結する必要はありません。障害が発生した場合、ローカルバックアップがまだあり、別のバックアップサービスに簡単に切り替えることができます。


rsnapshotはハードリンクをサポートするだけでなく、ハードリンクを内部表現で使用します。そのため、重複はrsnapshotデータストアをtarなしで正しくバックアップしません。
ptman

@ptman:それは本当です-ただし、すべてのrsnapshotツリーをtarar upする必要はありません。複製を使用して、rsnapshotツリーのrsnapshot "daily.0"ディレクトリのみをバックアップします。このディレクトリには、バックアップされるディレクトリツリーの最新のスナップショットがあります。daily.0、daily.1などの間のRsnapshotのスナップショット間リンクは、バックアップのシステム上のハードリンクに対応するdaily.0スナップショットツリー内の2つのファイル間のリンクのみを表示する重複バックアップとは関係ありません。Tarはこれらのリンクをキャプチャでき、重複はtarファイルを介してバックアップできます。
-RichVel

2

ソフトウェア的には、非対称暗号化とダムレシーバー(非クラウドハウツー)を使用した増分バックアップの重複を考慮してください。


1

私は常に、最高で、最も安価で、最も効率的なバックアップソリューションは、あなた自身の目的のために自分で構築するものであることをクライアントに伝えています。

クライアント用のシステムを構築するとき、rsyncとSSHキーを使用して、serverAとserverBの間の認証を処理します。serverAにはバックアップするデータが含まれます。データをアーカイブおよびrsyncするコマンドは、Webアクセスできないディレクトリのbashスクリプトに含まれており、H時間ごとにcronによって呼び出されます(毎日24時間など)。

バックアップサーバーserverBは、バックアップにのみ使用されます。バックアップのダウンロードとバックアップを可能にするために、SSHキー認証で非常に長いパスワードを使用することを常にクライアントに勧めます。クライアントがバックアップをD日間保存する必要がある場合があるため、それを処理するスクリプトを作成します(アクティブなバックアップディレクトリからデータを取得し、タイムスタンプを適用し、別のディレクトリのアーカイブに追加します)。


0

中小企業/プロシューマーには、Amazonのストレージサービスをお勧めします

  • 地域管理(つまり、EUに保存されたオブジェクトは、EUを離れることはありません)。
  • 任意の請求サイクルで99.9%の稼働率
  • 1か月あたり1 GBあたり$ 0.150を保存
  • ダウンロードしたGBあたり$ 0.170
  • 2010年6月まで無料アップロード、その後はGBあたり$ 0.10

そして、「データが不正アクセスから安全に保たれるようにするための認証メカニズムが提供されている」というかなり曖昧な保証


0

bluenovemberはS3で正しい軌道に乗っていますが、Amazonのシステムは実際にはドロップインバックアップソリューションではありません。それは、それが少数のAPI呼び出しであろうと、完全バックアップ管理スイート。バックエンドでS3を使用するが、バックアップソリューションとして使用するためのより優れたインターフェイスを提供するJungleDisk Server Editionのようなものがおそらくより良いでしょう。

さらに、JungleDiskは組み込みの暗号化を提供します。これは、S3 /「クラウド」への接続方法に関係なく、追加する必要があるものです。Linux向けのクライアントソフトウェアもいくつかあります。


0

バックアップをAmazon AWSに保存し、無料ツールs3cmdhttp://s3tools.org/s3cmd)を使用します

非常に簡単にインストールできます(Debian:apt-get install s3cmd)。

S3にファイルを保存するには、Amazon AWSアカウントが必要です。次に、単純なコマンドを使用して、増分バックアップまたは同期ソリューションとしてバックアップを実行できます。例:

s3cmd sync /srv/backup  s3://your-bucket-name-at-amazon/

実行してください

s3cms --configure 

最初にAWS認証情報を入力します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.