データセンターで探すべき重要事項


34

データセンターの品質を判断するための簡単なチェックリストを作成しようとしています...どこで何を探すべきか、所有者の発言を確認するにはどうすればよいですか(たとえば、「UPSはパワー」)は本当ですか?典型的な兆候または良いまたは悪いデータセンターとは何ですか?

回答:


43

以下は、前回データセンターに買い物に行ったときに自分のために作成した質問のリストです。

  • スプリンクラーが私たちの機器から外れるのに必要なことを説明してください。
  • リモートハンドは何をするつもりですか?たとえば、ハードドライブのインストール、テープの回転…
  • リモートハンドは24時間365日利用できます。チケットを提出してからケージに到達するまでの平均待機時間(チケットの入力方法)
  • 複数のグリッドにいますか?
  • 上げ床冷却はありますか?
  • これ以外にいくつのデータセンターを運用していますか?
  • データセンターをバックアップ電源で実行できる期間はどれくらいですか?
  • 機器をデータセンターに直接配送できますか?
  • 配達用ドックと無料の駐車場はありますか?
  • ベンダーがデータセンターに来た場合、それらに同行する必要がありますか?
  • どのような周囲温度と湿度が維持されますか?
  • ISPの選択肢はいくつありますか?
  • データセンターの歴史の中で、顧客が電力を失ったことがありますか?
  • このデータセンターはどのくらいの期間稼働していますか?
  • フロアと機器の両方に対して、どのようなアクセス制御が設定されていますか?

複数のサイトにアクセスして、価格、訪問の印象、およびそれらの回答の間でこれらの質問をすると、どの質問が必要かが明確になるでしょう。必ずそれらを訪問し、十分な量を訪問するようにしてください。


2
よくやった。あなたに+1。
gWaldo

3
また、フロアと機器の両方へのアクセス制御についても質問します。
スコットパック

素晴らしいリスト!! 「建物を所有していますか?」また、スプリンクラーがあれば、立ち去ってください!
JakeRobinson

@JakeRobinsonスプリンクラーは、多くの場所のデータセンターであっても、火災コードに必要です。スプリンクラーが表示されたら、ドライパイプスプリンクラーかどうかを尋ねます。
sysadmin1138

3
@JakeRobinson 2003年に引っ越した新しいDCには、FM200とスプリンクラーの両方がありました。消防元sは非常に固く、そこにスプリンクラーがいるはずでした。FM200が火を消すことができるなら、素晴らしい。しかし、もしそうでなければ(UPSブローアウトがFM200エアダムを破り、ダンプ後にO2が入ることができます)、大量の水が建物を救います。適切なドライパイプシステムは、スプリンクラーヘッドがぶつかってもDCがあふれないことを意味します。
sysadmin1138

6

カイルはそれをかなりうまくカバーしましたが、ここにいくつかのポイントがあります:

物理的セキュリティは巨大です。中に入るには、ほぼ議会の行為(議会、動きの遅い官僚制度をここに挿入)が必要です。

スプリンクラーではなく、ハロンの消火が必要です。サーバーを湿らせないでください。(地元の消火規則が優先される場合があります...)

優先されるサーバーベンダーを確認します。非常に特定の理由(Googleのようなデータセンターの実行など)でない限り、ネームブランドサーバーである必要があります。(Dell、HP、IBM、Sun、Appleなど)彼らが「ホワイトボックス」またはあなたが認識しないブランドを言う場合、実行します。信頼できる評判の良い下位層サーバーベンダーがいくつかあることに注意してください(たとえば、System76)が、「カスタムビルド」とは、彼ら自身が物事をまとめることを意味します。あなたの家には素晴らしいが、データセンターには悪い。(これには、HP Proliant DL580の購入やメモリオプションキットやドライブケージなどのインストールは含まれません。)

どのような所有権オプションが利用可能ですか?それらを通して購入しますか?直接購入し、そこでドロップシップを購入しますか?リース?VM?


4
「ハロン」のために「ここハロン/ FM200 / Argonite / Inergen /他の消火剤ガス」をお読みものの、消火に同意
MADHATTERはモニカサポートして

11
実際にスプリンクラーは、多くの場所で火災コードによって必要とされています。2003年、私が支援したDCビルド中にそれを発見しました。FM200が熱源を消さない場合にのみ発火するはずです。不活性ガスをバックアップするドライパイプスプリンクラーシステムである必要があります。
sysadmin1138

2

いつものように素晴らしいカイル、経験から学んだこと:

  • UPSをバックアップする発電機があるかどうかを尋ねます。もしそうなら、発電機をテストしましたか?

  • 電気技師が電力を殺すのを防ぐために、どのような物理的なロックとチェックがありますか?

  • 彼らにはどのような賠償責任/保険が適用されますか?

  • SLAを満たしていない状況にどのように対処しますか?

  • 彼らはどれくらいの頻度でSLAを満たしていないのですか?

  • 各ラック/ケージなどにどれくらいの電力を供給しますか?(電力に制約があり、余分な電力のために別のラック/ケージが必要になりますか?)

  • あなたの業界では参考になるでしょう。

当時は面白くなかった面白い話:

  1. バンクーバーでは、DCから4ブロック離れた地下の電気コンパートメントで火災が発生し、火災により半径10ブロックの電力が消費されました。UPSは、発電機セットがオンラインになるまでライトを点灯し続けました。発電機は、過熱するまで約1時間オンラインのままでした。発電機セットが安全にシャットダウンした後、UPSはさらに30分間ライトを点灯させることができました。発電機セットは建物に属し、IIRC DCはそれらを責め、手を洗うことができました。

  2. 電気技師が、DCの数列のラックへの電源を切断しました。パネルが何らかの方法で倒れ、すべてのブレーカーが開いたためです。また、別のDCの電気技師がUPSで作業することを聞いたことがありますが、バイパスモードにせず、DC全体を停止します。


そのような場合にラックUPSを使用することをお勧めしますか、それとも、すべての接続が通常とにかく切断されるので問題ではありませんか?
AX1

私たちのDCは、ラックにUPSを設置することは許可されていないと言っていたので、理由を教えてくれましたが、それが何だったかは思い出せません。
クリント

たぶん熱?ラックUPSの経験はあまりありませんが、消費者UPSは常に熱くなっています。
AX1

4
@ AX1:デイジーチェーンのUPSは相互に混乱しています。彼らは現在の特定の特性を期待しており、他のUPSはそれらを除外することができます。DCの電源が切れるとネットワークがダウンする可能性があるため、サーバーが稼働していてもネットワークは停止しません。
quinnr

EPOが攻撃された場合、消防隊は活力がないと予想しているので、消防コードである可能性があります。
ショーンレイフシュナイダー

1
  • おそらくデータセンターの3分の1が技術品目です({VESDA、給油契約、UPSでカバーされているチラー、複数の電力網、多様なファイバーの入口があります)。

  • もう1つは、物事がうまくいかない場合の対処方法です。彼らはプライドを飲み込み、失敗を調べ、それが二度と起こらないようにするために何をすべきかを考え出しますか?それとも、以前はうまくいかなかったことを続けているだけですか?

  • そして、残りの3番目は人員です。彼らは賢く、扱いやすく、毎月裏返さないのですか?

しかし、さらに重要なことは、必要なスペースがあるかどうかです。私たちが入ろうとしている場所の1つで、2年以内に利用可能なスペースより多くのスペースを使用していました。


1

私はシリコンバレーの小さなデータセンターで働いています。私はビジネスの管理対象サーバー側のシステム管理者です。

悪い兆候:

  • 電力、温度、湿度の冗長な監視と警告の欠如
  • ネットワークデバイス、コロス、サーバー、その他の機器の監視の欠如
  • 整理整頓し、整理整頓されたラックを維持するためにケーブルタイやその他のケーブル管理を使用しない

良い兆候:-自動フェイルオーバーを備えたオンサイトディーゼル発電機-自動フェイルオーバーを備えたバックアップチラーとエアハンドラー-主要なキャリアバックボーン(AT&T、XO Comm)の十分な帯域幅-冗長ネットワークプロバイダー-冗長コアルーター、ファイアウォール、ロードバランサー、スイッチ-実行中サーバーを展開する前のメモリチェックとハードウェア診断

ネームブランドサーバーは問題ありませんが、古いもので何回もブロックされている場合は、使用する前にハードウェア診断に合格していることを確認することをお勧めします。

優れたデータセンターは、帯域幅の消費と稼働時間を監視できるWebサイトを顧客に提供する必要があります。また、質問に答える必要があります。UPSのメーカーとモデルを尋ねます。UPSの現在の負荷を確認するよう依頼します。この情報を使用すると、電源が供給されない状態でどれくらいの期間が経過するかを確認できます。

しかし、正直なところ、UPSは心配するべきではありません。UPSは短い稼働時間(30分程度)のみを提供します。より良い懸念は、DCにバックアップジェネレーターがあるかどうかです。DCがどのグリッドにあるのかを尋ねることも価値があります。電圧低下と停電に関しては、異なるグリッドに異なる優先度が割り当てられます。何だと思う?病院と消防署の優先度が高い(電源が切れることはありません)。データセンターが同じグリッド上にある場合、信頼性の高い電力が保証されます。

ラックごとに使用可能な電力量を尋ねます。私が働いている場所では、各ラックに3つの25アンペア回路を提供しています。典型的な1uサーバーは1〜3アンペアを消費します。


私が行きたいと思うものは、ラックごとに40アンペアを持っています。それは低すぎますか?それはあなたが言うことのほぼ半分(75アンペア)です。
AX1

1
@ AX1、110Vでの40Aは4400Wです。230Vでは9200Wです。高密度(Twin / Twin ^ 2 / Blade)またはHPC / GPUでない限り、それは大量です。
ミルチャチレア
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.