ディスク速度はどのように測定され、何が高速ですか?1500 GBのコピーに必要な時間は?


11

ディスク速度はどのように測定されますか?MbitまたはMbyte per second readですか?今日の平均は何で、業界では何が高速で、何が非常に高速ですか?

1500 GBのファイル(データベースファイルなど)のコピーを作成するのに時間がかかる、プロのシステムにかかる時間、ハードディスクの速度を考慮して計算する方法を誰かが言うとしましょう?

回答:


19

通常、ディスク速度は次の単位で測定されます。

  • 毎分回転数での回転速度(4200rpmで最低、その後5400、7200、10kおよび15k-これはSSDまたはフラッシュメモリには適用されません)。
  • インターフェースの速度は、ディスクエレクトロニクスがディスクコントローラーにデータを送信できる最速です(ATAの100MBpsからSATAの150/300/600 Mbps、Fibre-Channelの2/4/8/16 Gbps、さらにPCIe速度までの範囲) FusionIOなどのフラッシュベースのストレージ)。
  • シーク時間は、単にディスクの特定のセクターの読み取りまたは書き込みを開始するのにかかる時間です。これらは、ディスクの場合は3〜15ミリ秒、SSD /フラッシュディスクの場合はその一部です。
  • 次に、期待できる実際の速度に到達します。気にする必要がある速度は4つあります。順次読み取り(非常に大きなデータブロックの読み取り)、順次書き込み(同じですが書き込み)、ランダム読み取り(ディスク全体からデータを取得)、ランダム書き込み。これらは非常に異なりますが、回転するディスクでは、シーケンシャルな読み取りと書き込みで25MBpsから150MBps、ランダムな読み取りと書き込みで3MBpsから50Mpsが期待できます。通常、SSDはシーケンシャルでは200MBpsの範囲であり、ランダム操作では通常わずかです。FusionIOはすべて1GBpsを簡単に達成できますが、通常は小さくて高価です。

ご覧のとおり、実際の平均値はありません。購入する商品についての提案が必要な場合は、できるだけ多くの情報をお気軽にご連絡ください。これには、予算、アプリケーションタイプ、データセットサイズ、ユーザーベースが含まれます、ハードウェア/ OSに加えて、役立つと思われるものすべて。

1.5TBコピーに関しては、USB 2に接続された7200rpm SATAディスクに対してこれを行っている場合、少なくとも30MBps〜40MBpsを取得する必要があります。そのため、1.5TBのフル容量は10時間以上かかります。これが典型的なプロフェッショナルDAS / SANシステムであれば、100MBpsの領域で約3時間かかります。

これが、MB =メガバイト、MBがメガビットであることを明確にするために役立つことを願っています。


8

これらの種類の計算には、非常に多くの変数が関係しています。実際のディスクシステムには、多くの相互依存関係があります。単一のコンピューター内で:

  • ドライブ自体の実際の定格速度(通常はRPM、5200、7200、10K、15K)
  • 使用中のファイルシステム
  • RAIDシステムが使用されているかどうか
    • その場合、RAIDカードのパフォーマンス
    • RAIDの種類
  • 使用中のオペレーティングシステム
  • 読み取り操作と書き込み操作のパフォーマンス特性は完全に異なります
  • 操作の読み取り/書き込み比率
  • 順次操作の場合、ストレージの断片化要因

ご覧のとおり、ディスク自体の速度は多くの要因の1つにすぎません。これは大きな要因ですが、それでも多くの要因の1つです。その1.5TBのコピーがすべて同じディスク上にある場合、ディスクは(95%の確率で)100%のランダムな読み取り/書き込みパフォーマンスを実行することになり、通常、最悪のパフォーマンスメトリックになります。コピーが1つのディスクから別のディスクにあり、データが100%シーケンシャルであり、ターゲットディスクが完全に空の場合、このディスクサブシステムで可能な限り高速なパフォーマンスが得られます。現実世界のパフォーマンスは、これらの両極端の間のどこかになります。

2つの別々のサーバー間でコピーする場合は、さらに多くの要因が関係します。

主にシーケンシャル操作を行うときに3Gb(gigaBIT)SASチャネルを飽和させることができるストレージアレイを職場で使用しています。6Gb SASがあれば、おそらくそれらも飽和状態に非常に近づいてしまうでしょう。ランダムI / Oの場合、この特定のシステムのパフォーマンスはOSによって大きく異なります(たとえば、OpenSolarisは最悪のランダムI / Oで、Linux XFSは3倍の最高です)。

この質問に明確に答えるにはあまりにも多くの変数があります。


3

1.5TBのデータのコピーにかかる時間は、データのタイプに大きく依存します。1,500個の1GBファイルが数個ある場合、おそらく数時間しかかかりませんが、10億半の1KBファイルがある場合は、おそらく数日かかります。

これは、ディスク上の2つの競合する仕様、スループットと平均アクセス時間のためです。100MB /秒のスループットと10msのアクセス時間を備えた従来のディスクはかなり一般的です。データを連続してストリーミングできる場合、100MB /秒を取得できます。ただし、別の場所にジャンプする必要がある場合は10ミリ秒かかります。ストリーミングしていたら、別の場所にジャンプするのにかかる時間に1MBのデータを書き込むことができたでしょう。

ファイルの作成には数回のシークが必要になる可能性があるため、1KBのファイルを作成すると、数MBのデータをストリーミングするのと同じくらい「コスト」がかかります。

そのため、場合によっては、rsyncなどの方法でファイルシステムにコピーするよりも、ブロックデバイスのrawディスクコピーを行う方が良い場合があります。多くのファイルがある場合、たとえば50%以上がいっぱいのファイルシステムでは、時間がかかる限り、 "dd"を介してブロックデバイス全体をコピーする方がよい場合がよくあります。もちろん、ファイルシステムがマウントされている間はこれを行うことができないため、これには欠点もあります。

SSDは、アクセス時間が約100倍高速であるため、これを緩和するのに役立ちますが、MLC SSDドライブには、事前に消去されたブロックのプールの可用性によって複雑なアクセスの問題があります。SLC SSDはこれに役立ちます。

組み込みキャッシュを備えたRAIDコントローラーは、SSDを介してブロックデバイスをキャッシュできるフラッシュキャッシュカーネルモジュールなどのように、シークに役立ちます。

RAIDシステムは、複数の並列シークを可能にし、平均アクセス時間を効果的に短縮し、スループットを向上させるための並列化も可能にします。ただし、全体的なパフォーマンスは、多くの場合、含まれるファイルの数に依存します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.