スナップショットの削除が非常に遅い


13

iSCSI経由で公開されたHP LeftHandストレージを備えたESXiボックスがあります。

1TBのディスクを持つ仮想マシンがあり、そのうち800GBが消費されています。ディスクは、LeftHandストレージにシックプロビジョニングされています。

VMでスナップショットが開かれ(Veeam Backup and Recoveryが処理できるように)、約6時間開かれました。この間に約5GBのデルタディスクが作成されました。

スナップショットの削除には5時間以上かかりましたが、まだ完了していません。ストレージアレイは、そのアレイで実質的にIOPS(バックグラウンドノイズである約600)、スループットなし(バックグラウンドノイズである約8MB /秒)、平均キュー深度9を実質的に報告しています。

言い換えれば、スナップショット統合プロセスはIOバウンドではないようです。スナップショットの削除が非常に遅くなる原因は何もわかりません。それはされて差分ファイルを見て判断し、取り組んでいます。

この(比較的小さい)スナップショットを削除するのが非常に遅い理由について、他に検討すべきことはありますか?


あたりとしてVMwareのマニュアル、私は見ているls -lh | grep -E "delta|flat|sesparse"今、私は変更されている2つの差分ファイルを参照してください。

-rw-------    1 root     root      194.0M Jun 15 01:28 EXAMPLE-000001-delta.vmdk
-rw-------    1 root     root      274.0M Jun 15 01:27 EXAMPLE-000002-delta.vmdk

あるスナップショットファイルが統合され、他のスナップショットファイルは統合プロセス中にデルタを収集していると推測しています。次に、新しいものが統合され、そのプロセス中に別のデルタが作成されます。

ファイルサイズ各反復(まあ、ほとんどの反復)で低下しているので、最終的にこの統合手順が完了すると思います(変更を生成せずにこれを完了するには、30分間VMをネットワークから取り外す必要があるかもしれません) 。

統合するには、デルタ100メガにつき約2分かかります。これは確かに前に起こったことはありません。通常のVeeamバックアップでのスナップショットの削除には約40分かかります(確かに高速ではありませんが、この速度ではありません)。


6時間2分後に、スナップショットは最終的に削除されます。ただし、この種の問題(ストレージのパフォーマンス以外)を通常トラブルシューティングする方法があるかどうかを引き続き知りたいと思います。


8Mbit /秒は、10Mbit /秒のネットワーキングからオーバーヘッドを少し引いたものにかなり近いことに気づかずにはいられません。これはiSCSIリンク上のネットワーク関連の問題です-危険なパッチリードは失敗し始めていますか?それは単一のリンク、単一のホストですか?それ以外の場合、ホストは持続的な読み取り/書き込みに対してOKを実行していますか?スイッチポートのエラーを確認できますか?
TessellatingHeckler

@TessellatingHeckler私はいくつかのテストを行っただけで、アレイから1.5Gbit / secのシーケンシャルを取得できます。昨夜スナップショットの除去がかかった3分をはるかに最速の私がきたことである、これまで通常それはその長い10倍程度だ(それを見て、私はその誰もが時間後にシステムを使用していなかった疑いがあるので、ここでの最後の夜に大きなサッカーの試合がありましたバックアップが実行されると、小さなデルタと小さなコミット時間になります)。そのため、それはすぐに実行できますが、一度実行できませんでした。
マークヘンダーソン

うーん。VMware Storage IO Controlを実行していますか?データストアは他のVMと共有されていますか?ホストまたはSANハードウェアにストレスをかけることなく、何らかのスロットル/ソフト制限に達した可能性はありますか?
TessellatingHeckler

ESXiおよびvCenterバージョン?
ニルス

両方の@Nils 5.5
マークヘンダーソン

回答:


2

ESXIスナップショットの削除には長い時間がかかる(通常はかかる)ことを理解しています。スナップショットを削除する前に、古いスナップショットからの変更を次のスナップショットに順番に書き込む必要があります。このプロセスを可能な限り迅速かつ効率的に実行するために、常に最も古いスナップショットから最新のスナップショットを常に削除するように教えられました。

当然、スナップショット間の変更が多いほど、マージに時間がかかります。


1
5GBのスナップショットを削除するのに6時間を要するのは不合理です。前述したように、通常、スナップショットを削除するには約40分かかり、40分も遅すぎると感じています。これはそのVM上の唯一のスナップショットであり、ESXiの以降のバージョンではスナップショットの削除も変更されており、削除される順序はそれほど重要ではありません。
マークヘンダーソン

2
以前、ストレージでのI / Oがほとんどないスナップショットの動作が遅いのを見てきましたが、原因を特定することはできませんでした。私はいつもハイパーバイザーがメモリ内のデルタを噛んでいると思っていました。(問題のマシンは直接接続されたストレージを使用していたか、SANの問題も調べていたかもしれませんが、VMWareのスナップショットサブシステムの大きなデルタまたは最適化されていないコードに常にチョークを付けてきました)。
voretaq7
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.