vmの効率的なオフサイトリモートバックアップソリューションの推奨事項


15

現在の6つのvmをバックアップするための推奨事項を探しています(すぐに最大20に拡大します)。現在、2ノードのproxmoxクラスターを実行しています(これは、管理するカスタムWebフロントエンドで仮想化にkvmを使用するdebianベースです)。AMD phenom II x4とasusマザーボードを備えた2つのほぼ同一のボックスがあります。それぞれに4つの500 GB sata2 hdd、1つはOSおよびproxmoxインストール用の他のデータ、3つはmdadm + drbd + lvmを使用して2台のマシン間で1.5 TBのストレージを共有します。すべての仮想マシンのlvmイメージをkvmにマウントします。現在、1台のマシンから別のマシンへ、通常数秒以内にライブ転送を行うことができます(m $ SQLサーバーでwin2008を実行している最大のvmでは約2分かかります)。proxmoxの組み込みvzdumpユーティリティを使用して、vmのスナップショットを取得しています sネットワーク上の外部ハードドライブに保存します。次に、リモートオフサイトバックアップ用にvzdumpフォルダーを同期するjunglediskサービス(ラックスペースを使用)があります。

これはすべてうまくいきますが、あまりスケーラブルではありません。1つは、バックアップ自体が毎晩最大数時間かかる場合があることです。junglediskのブロックレベルの増分転送では、同期はデータのほんの一部をオフサイトに転送しますが、それでも少なくとも30分かかります。

もちろん、はるかに優れたソリューションは、2つの時点の差(午前6時から午前7時までに書かれたもの)を即座に取得し、それを圧縮し、その差分ファイルをバックアップサーバーに送信して、すぐにラックスペース上のリモートストレージ。私はzfsを少し調べましたが、それは送受信を行う能力です。bzipまたは何かのデータのパイプと相まって、完璧に思えます。ただし、nexfsaサーバーをzfsで実装するには、iSCSIブロックボリュームを(zvolを介して)proxmoxサーバーに提供するために、少なくとも1つまたは2つの専用ストレージサーバーが必要です。できる限りセットアップを可能な限り最小限に抑えることをお勧めします(つまり、別個のストレージサーバーを持たない)。

また、zumastorについても簡単に読みました。私が望むこともできるように見えますが、2008年に開発を停止したようです。

それで、zfs、zumastor、その他?

回答:


3

これはあなたの状況では不可能かもしれないので、その場合は投票しないように願いますが、バックアップ戦略を変更する方が効率的かもしれません。VMスナップショットの代わりに特定のデータをバックアップすると、バックアップがより速く実行され、変更をキャプチャするのが簡単になります。

VMとその用途に応じて、現在スナップショットを保存している場所(または適切なスケジュール)にデータをバックアップするだけで、JungleDiskはデータのみをバックアップできます。これにより、変更されたファイルがより効率的に転送され、バックアップに必要なスペースと必要な時間が削減されます。さらに、スナップショットを作成して保持することもできますが、その頻度はそれほど高くありません(たとえば、毎週)。

この場合、常に新しいVMを起動してデータを復元するか、古いスナップショットを使用してVMを復元し、データバックアップを使用して最新のポイントに復元することができます。


1
私はすでにそのようなことを考えていました。問題は、少なくとも1つのプライマリvmがHVAC業界向けに特別に調整されたカスタムデータベースソフトウェアを実行しており、sqlデータベースに見られるようなダンプ機能がないことです。このデータの一部をM $ SQLにエクスポートしていますが、すべてではなく、1日に1回だけエクスポートしています。残念ながら、ネットワーク管理者だけでは、vmで実行しているものでそのような設計上の決定を下すことはできません... vmを実行してバックアップする方法のみです。
セノスマイル

1

オフサイトバックアップを行っている場合、次のオプションを選択します。

(a)SCPをリモートサーバーにコピーするシェルスクリプト。この方法では、バックアップを作成するスクリプトを自動的に実行するcronジョブを追加できます。さらに、実際にファイルを転送する前に一時的なアーカイブファイルを作成し、gzipの実行中に転送しないことで帯域幅を節約するようにできます。

または

(b)Webminなどのサーバー管理ツールをインストールし、自動バックアップを実行します。私は現在、問題なく本番サーバーでこれを歌っています。問題なく動作します。また、オールインワンソリューションを提供するため、多くのvmを管理するためにcloudmin(有料)もお勧めします。

いくつかの追加リンク:

http://www.debianhelp.co.uk/backup.htm

http://ubuntuforums.org/showthread.php?t=35087

役立つことを願っています、RayQuang


ありがとう!これらのリンクには多くの良い情報があります。問題は、稼働中の仮想マシンで動作し、差分を計算するために何時間も実行する必要がないものが必要だということです。究極の単一マシンは、xen、kvm(Linuxカーネルで明らかにオン)、または同様のものを実行できるnexentaインストールになります。そうすれば、WindowsおよびLinuxサーバーをイメージファイルまたはlvm(またはzvol)にインストールするための高性能な仮想化ソリューションと、無制限のスナップショットを作成し、最後のバックアップからの差分のみをすばやく転送する方法があります!
セノスマイル

1

backuppcをご覧ください。

backuppcは、増分コピーを行うrsyncの上で動作できます。

さらに、バックアップする必要のないフォルダのブラックリストを簡単に作成できます。例えば:temp / / tmp .garbages / ...

http://backuppc.sourceforge.net/

backuppcにはクリーンなWebインターフェイスがあり、バックアップの一部を直接zipファイルとしてダウンロードできます。check_backuppcを使用してnagiosで監視できます。


backuppcは完全に異なるプロジェクトに最適だと思います!どうもありがとう。また、別のサイトへのリモートバックアップを実行したり、オフサイトバックアップ用にjunglediskを追加したり、置き換えたりするのに適した代替品になる場合もあります。
senorsmile

1

スケーラビリティを向上させるためにどの程度のアーキテクチャの変更を計画していたのかはわかりません。ただし、VMプラットフォームの切り替えを受け入れる場合は、VMWareをご覧ください。

優れたVMWareバックアップソリューションはたくさんありますが、私は個人的にVzionCoreを使用しました。その後、スナップショットとポイントインタイムリカバリを使用して、洗練された作業を行うことができます。リモートサイトにフェールオーバーする機能もあります。


残念ながら、私は現在実行しているものとかなり似たものを探しています。特に、オープンソースでスケーラブルである必要があります。VMWareソリューションを確認しましたが、CDPに近いサードパーティ製の優れた2ノードvirtクラスターでさえ、非常に高価です。
セノスマイル

VzionCoreではなく、VizionCoreを意味すると思います。
ショーンレイフシュナイダー

0

zfsは素晴らしいことですが、2サーバースケールではうまく機能しないというマイナス面も知っていると既に述べました。また、DRDBフェールオーバーを提供しません。つまり、Nexentaは単一障害点になります。

OpenSolarisまたはNexentaCoreでVirtualBoxを取得することを検討できますが、ProxMox + DRDBほど簡単ではないため、既存のマシンを再利用できます。

変更を測定し、十分に低いことがわかったら、3番目のミラーをオフサイトで使用してDRDBを試すことができます。VMでの書き込み数が非常に少ない場合にのみ機能します。

スティーブRadich - 1995年以来ホスティング&SQLパフォーマンスのWindows - http://www.BitShop.com/Blogs.aspx


0

大規模なproxmoxクラスターを実行しているため、バックアップ戦略を、組み込みのvzdumpスナップショットスタイルのバックアップから変更することを推奨する必要があります。

「ゲスト」ファイルバックアップソリューションの多くを検討してください。Backuppc、Urbackup、bacula、amandaなど...

特定のファイルを復元するのがはるかに高速になり、消費するスペースがはるかに少なくなります。


0

私は私の質問に対する究極の答えを見つけたかもしれないと思う:

BUP https://github.com/bup/bup

特徴:

  • ローリングチェックサムアルゴリズム(rsyncと同様)を使用して、大きなファイルをチャンクに分割します。これの最も有用な結果は、巨大な仮想マシン(VM)のディスクイメージ、データベース、およびXMLファイルを通常はすべて1つの巨大なファイルにまとめてバックアップし、複数のバージョンに大量のディスクスペースを使用しない場合でもです。

    git(オープンソースバージョン管理システム)のpackfile形式を使用しているため、bupのユーザーインターフェイスが気に入らなくても、保存されているデータにアクセスできます。

    gitとは異なり、(個別のガベージコレクション/リパックステージを使用する代わりに)パックファイルを直接書き込むため、膨大なデータが大量にある場合でも高速です。bupの改善されたインデックス形式により、git(数百万)よりもはるかに多くのファイル名を追跡し、はるかに多くのオブジェクト(数百または数千ギガバイト)を追跡できます。

    データは、どのバックアップが他のどのバックアップに基づいているかを知る必要なしに、増分バックアップ間で「自動的に」共有されます-バックアップがお互いを知らない2台の異なるコンピューターから作成された場合でも。バックアップするようにbupに指示するだけで、必要な最小限のデータのみが保存されます。

    バックアップするコンピューターに大量の一時ディスク領域を必要とせずに、リモートbupサーバーに直接バックアップできます。バックアップが途中で中断された場合、次の実行は中断したところから再開されます。また、bupサーバーのセットアップは簡単です。sshにアクセスできるマシンにbupをインストールするだけです。

    Bupは、ディスクに不良セクタが検出されていない場合でも、「par2」冗長性を使用して破損したバックアップを回復できます。

    バックアップが増分バックアップの場合でも、完全バックアップの復元について心配する必要はありません。その後、各増分バックアップを順番に復元します。増分バックアップは、まるで完全バックアップのように機能し、必要なディスク容量が少なくなります。

    bupリポジトリをFUSEファイルシステムとしてマウントし、その方法でコンテンツにアクセスし、Samba経由でエクスポートすることもできます。

編集:(2015年8月19日)そしてさらに優れた別の素晴らしいソリューションが出てきます:https//github.com/datto/dattobd

ライブスナップショットが可能になり、基本的にLinuxの通常の古いファイルシステムにCOWのような機能を提供します。

編集:(2016年7月15日)そして、水を吹き飛ばす別の優れたソリューション:https : //github.com/borgbackup/borg

刈り込み時のバップよりも特に優れています。圧縮、暗号化、効率的な重複排除を強力にサポートしているようです。dattobd + borg ftw !!!

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.