高負荷時にReFS /ストレージスペースドライブが削除される


8

画像処理(Photoshop)やソフトウェア開発(Eclipse)などの業務にWindows 10ワークステーションを使用しています。これは、i7-2600Kベースのコンピューター、Gigabyte GA-B75M-D3H B75マザーボード、16 GB RAMです。OSはSamsung 850 pro SSDにあり、データ用に別の850 pro、データ用にWD Black、さらにストレージスペースミラー内のSATA 3ポート、フォーマット済みReFSにそれぞれ2つの4GB HGSTドライブがあります。アレイは1.63GB使用、1.99GBは無料です。

最近、記憶域スペースミラーのReFSドライブが低下し始めました-これまでのところ、月に3回。これは通常、中程度から重い負荷のもとで、長期間経過した後に発生します。他のディスクはどれも負荷がかかる範囲で低下しないため、ReFS、ストレージスペース、または基盤となるディスクの問題であると想定しています。再起動するとディスクがオンラインになります。

以下のようなエラーがイベントビューアに表示されます。これらはすべて1か所にあるわけではなく、「アプリケーションとサービスのログ-> microsoft-> windows」の下にNTFSと記憶域スペースのログ領域がありますが、ReFSにはありません。

これらの問題の原因を追跡し、解決してシステムを稼働させていただけると助かります。

16:27.05 (under event viewer -> application and services log -> microsoft -> windows -> storagespaces-driver-operationsl
Virtual disk {26bf58b3-1cb9-4b93-a945-1b89331bb565} requires a data integrity scan.                                    
Data on the disk is out-of-sync and a data integrity scan is required.                  To start the scan, run the following command:                  

Get-ScheduledTask -TaskName "Data Integrity Scan for Crash Recovery" | Start-ScheduledTask                  

Once you have resolved the condition listed above, you can online the disk by using the following commands in PowerShell:                  

Get-VirtualDisk | ?{ $_.ObjectId -Match "{26bf58b3-1cb9-4b93-a945-1b89331bb565}" } | Get-Disk | Set-Disk -IsReadOnly $false                  
Get-VirtualDisk | ?{ $_.ObjectId -Match "{26bf58b3-1cb9-4b93-a945-1b89331bb565}" } | Get-Disk | Set-Disk -IsOffline  $false

16:27.05 (windows system event log): The file system was unable to write metadata to the media backing volume R:. A write failed with status "A device which does not exist was specified." ReFS will take the volume offline. It may be mounted again automatically.
16:27.06 (windows system event log): The file system detected a checksum error and was not able to correct it. The name of the file or folder is "<unable to determine file name>".
18:35.50 (windows system event log): Failed to connect to the driver: (-2147024894) The system cannot find the file specified. 
18:35.50 (Kernel PNP) The driver \Driver\WudfRd failed to load for the device SWD\WPDBUSENUM\_??_USBSTOR#Disk&Ven_Generic&Prod_STORAGE_DEVICE&Rev_9451#7&2a9fd895&0#{53f56307-b6bf-11d0-94f2-00a0c91efb8b}.

18:35.58: Virtual disk {26bf58b3-1cb9-4b93-a945-1b89331bb565} could not be repaired because there is not enough free space in the storage pool.                  
Replace any failed or disconnected physical disks. The virtual disk will then be repaired automatically or you can repair it by running this command in PowerShell:                  
Get-VirtualDisk | ?{ $_.ObjectId -Match "{26bf58b3-1cb9-4b93-a945-1b89331bb565}" } | Repair-VirtualDisk

yagmothがこのエラーを指摘しているので、UPDATEにはUSBに関するものが含まれています。このエラーの発生を思い出すシナリオは、a)外部USBディスクにバックアップする場合b)別の内部SATAディスクにCrashPlanバックアップを実行する場合


1
アンチウイルスは、Windows 10の互換性の問題に備えて削除されましたか?mcafeeがアニバーサリーアップグレードで問題を抱えているように
yagmoth555

@ yagmoth555私はそう思うかもしれませんが、それは私にはあまりありそうにありません。推測してチェックするのではなく、問題自体をトラブルシューティングする方法にかなり興味があります。
Tim

悲しいことに、これ以上ログがないので、ハードウェアの問題が疑われます。AVのアイデアは簡単なテストだったので、ミラーがIOを処理できないかのように、アクセス時/書き込み時のAVドライバーは役に立ちません(ドライバーを間にインストールすることでIOが遅くなるため)テスト/エラーなしで調査したい場合最初にプロセスモニターを試し、すべてをログに記録することができます。すべてが失敗した場合は、ミラーリングを削除して、後でもう一度テストします(ただし、そのテストは悲しいことにテスト/エラーテストです)。監視ログを更新してください
yagmoth555

ミラーリングがUSBディスクで行われたかどうかを尋ねることはできますか?カーネルエラーがUSBドライバーを示しているため
yagmoth555

どちらのディスクもSATA 3Gbpsです。USBエラーに関する適切なスポッティング。質問を更新しました。1週間ほどマシンにいませんが、もう一度トリガーして、ログが異なるかどうかを確認します。ProcessMonitorは大量のログを生成するように見えますが、いつか試してみます。
Tim

回答:


2

ストレージスペースは書き込みレイテンシの影響を非常に受けやすいようです。スパイクが多すぎると、ボリュームが低下する可能性があります。

ここで見つけることができるように、これは消費者向けSSDを使用する場合の既知の問題のようです


その情報をありがとう。私のReFS / Storage SpaceディスクはSSDではなく4TB HGSTハードドライブです。SSDはNTFSを実行しています。書き込みレイテンシは興味深いものです。
Tim、

1

まず、本当にHCLを確認する必要があります。Storage Spaces HCLについて、あなたが言及したことは何もありません。vSANと同様に、Windowsとストレージスペースは完全に異なるHCLを持っています。ドライブを調べなくても、エンタープライズグレードのドライブではないため、HCLに含まれることはありません。

安定したソリューションが必要な場合は、LSI SASカード(非RAID)を入手し、エンタープライズSATA HDDを入手して、Intel dcシリーズSSDを入手してください。高いですか?うん。信頼できるでしょうか?ストレージに関しては、Windowsと同じくらい(これは素晴らしいことではありません)。

私、ストレージスペースを捨てて、LSI RAIDカードに戻りました。同じハードウェアで2年間以上、データ破損から毎週堅実なストレージに移行しました。そして、私はHCLにあるすべてのエンタープライズグレードのキットを持っていました。

ハードウェア互換性リスト(HCL)は、https: //www.windowsservercatalog.com/results.aspx ?& chtext =& cstext =& csttext =& chbtext =& bCatID = 1642 cpID = 0 avc = 10& ava = 0 avq = 0 OR = 1& PGS = 25 ready = 0にあります。


1
あなたの考えをありがとうエリック。多分あなたはあなたの投稿を編集して「HCL」を拡張することができます。私がそれが何を意味するのか、そして他の人もこの投稿を読んでいないからです。ストレージスペースなどのソフトウェアRAIDの全体的なポイントは、高価なエンタープライズグレードのソリューションの必要性を回避することだと思いました。「それを捨てて別のものを買う」というあなたの答えが本当に私の質問に答えているかどうかはわかりません。
ティム

私のコメントを参照してください。HCL=素人の言葉で動作することが認定されているハードウェア。SW RAIDは、エンタープライズグレードのハードウェアと同等またはそれ以上の機能を提供できるわけではありません。つまり、SWベースのソリューションに柔軟性があるということです。
エリックC.シンガー

...そしてReFSの使用を停止し、NTFSに切り替えます。ReFSよりもはるかに成熟しているようです。ReFSには多くの可能性がありますが、それだけでなく、成熟させる必要があります。
エリックC.シンガー

Storage Spaces BTWに関するブログ投稿全体を書き、シリーズを始めましたが、IMOはPOSであるため、あきらめました。ほとんどのMSソリューションと同様に、その半分焼きました。 ericcsinger.com/backup-storage-part-5-realization-of-a-failure RAIDカードに切り替えて以来、問題は発生していません。ミラーリングを使用しているので、データを1つのディスクから別のディスクにコピーするようにいくつかのrobocopyスクリプトを設定する方がよいでしょう。トラブルシューティングがより簡単になり、おそらくより信頼性が高くなり、コンシューマーグレードのディスクを保持できるようになります。
エリックC.シンガー

1
それはあなたがあなたのディスクをミラーリングしているので、あなたが、言ったことができ、一つのディスクを立ち退かNTFSでフォーマットし、それを上にデータをコピーします。表示されている問題はReFSの問題ではなく、ストレージスペースの問題であるため、ストレージスペースは使用しないことを強くお勧めします。ディスクが削除されたり、障害が発生したりすることと関係があるのは、ストレージスペースに関連しています。ローカルレプリカを作成するためにディスクの同期を維持するだけの場合は、robocopyが最も簡単な方法です。リアルタイムではありません。
エリックC.シンガー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.