ユーザーは電子メールにアクセスできず、CEOは会社のホームページにアクセスできず、ポケットベルは「911」コードで送信されました。すべてが爆発したとき、あなたは何をしますか?
ユーザーは電子メールにアクセスできず、CEOは会社のホームページにアクセスできず、ポケットベルは「911」コードで送信されました。すべてが爆発したとき、あなたは何をしますか?
回答:
最初の答えは落ち着いてください!パニックを起こす困難な方法はしばしば事態を悪化させるだけだということを学びました。それが達成されたら、次のことは問題が何であるかを実際に確認することです。ユーザーとマネージャーからの苦情があらゆる角度からあなたに来て、彼らができないことをあなたに話しますが、問題は何ではありません。
問題がわかったら、それを修正する計画を開始し、怒っているユーザーにタイムスケールを与え始めることができます!
落ち着いて
びっくりしないでください。呼吸して!(横隔膜から、それは助けになります。)瞑想を勉強したことがあるなら、それも助けになります。
極度のストレスに直面した場合、あなたの体は生死の状況にあるとあなたの体が考えるので、あなたの体は飛行または戦闘モードに入ります。この時点で、あなたの体は実際には脳の一部に送られる血液が少なくなり、推論などの機能が低下します。これにより、合理性ではなく本能が脳機能を支配し始め、IQが効果的に低下します。あなたが今までに白熱した議論をしたか、目撃したことがあるなら、人々の感情が燃え上がり、合理性が休暇を取るので、これらの症状を認識するかもしれません。後に、人々がクールダウンする機会があるとき、彼らは間違いを犯したか、間違っていたことを受け入れる可能性が高くなり、反対側を見ることができるようになりますが、今の暑さの中ではそうではありません。
落ち着きを保ち、あなたについての知恵を保つことは、脳が最大限に機能し続け、感情や恐怖ではなく証拠と理由に基づいて合理的な決定を下すことを保証します。
トリアージ
ここでは、限られたリソースを効率的に適用して、最小のコストで最大の利益を達成することが非常に重要です。すぐに修正する必要があるもの、少し(数時間、数日)待つことができるもの、および無期限に待つことができるものをできるだけ早く決定します。また、何かが救い得ず保存する価値がない場合(たとえば、ルーターの半分が溶けて、それが唯一のものであったとしても、それを保存したり、新しいものを購入したり、ポストヘイストでサイトに入れたり、できるものを見つけたりすること)一時的にギャップを埋めます)。
状況認識を保持する
いくつかの興味深い問題や、まだ十分に理解していない何かに注意が向けられないようにしてください。全体像と最も重要なものを機能させることに集中してください。
科学的方法を使用する
仮説を立てます。この仮説をテストする方法を決定します。仮説をテストするためのデータを収集します。不確認データも探してください。仮説を調整し、行動を起こすのに十分な自信があるまで、必要な回数だけサイクルを繰り返します。
実用的であること
今はドグマの時ではありません。災害から回復するとき、あちこちでいくつかのショートカットをとっても構いません。これは本質的に技術的な負債を生じています。多くの企業では、壊滅的な障害は収益の壊滅的な損失を意味します。揺れている場合でも、物事を実行する方が、会社の生活を危険にさらして危険にさらすよりも優れています。いつものように、ここでは判断が非常に重要です。サーバーラックに向けられたボックスファンを立てることが理にかなっている場合もあれば、そうでない場合もあります。
自分自身の面倒を見ます
この緊急事態にどのくらい取り組んでいますか?最後に水を飲んだのはいつですか?最後に食べたのはいつですか?どれくらい起きていますか?緊急事態があるからといって燃え尽きないでください。水分補給、摂食、休息をとる時間をとってください(長い複数日にわたるスローの場合)。
募集ヘルプ
あなたの会社には、やる気があり、助けを借りることができる才能のある人がほぼ確実にいます。しかし、あまりにも多くの人が走り回り、お互いにトラブルを引き起こすことに注意してください。また、人々を「ファイアドリル」に通すことで、迷惑な人々に注意してください。既に支援したい人を見つけ、ターゲットを絞ったタスクに取り組んでもらい、人々が互いに通信していることを確認します。
通信する
コミュニケーションは重要です。未知のものほど怖いものはありません。何かが壊れていること以外に人々が何も知らない場合、X時間でバックアップされるという空のステートメントはわずかに安心します(X時間が過ぎても物事が壊れた後の安心感はさらに低くなります)。プレー中のプレッシャーは、過度に楽観的なWAGの時間推定値を与えるようにあなたを導くことができますが、これは間違ったコースです。作業中だと言うだけでなく、X timeで修正されると言うだけではありません。オープンで、プロセスを示し、進捗状況と失敗を詳しく説明します。問題、それを追跡するプロセス、および問題を修正するための計画についての洞察を提供します(ただし、細かい点で人々をdrれさせないでください)。問題が手に負えないことを示し、物事が最終的に正しく行われることを示し、問題に有能な人々がいることを示し、
私はものをpingします。その後の処理は、pingの結果によって大きく異なります。
申し訳ありませんが、この質問はFavorite sysadmin cartoonですでに完全に回答されています。
RTFLF-Frakkin 'ログファイルの読み取り
(私はこれを信用できません、それはすべてScott Hanselmanに行きます)
あなたがその上にいることを人々に知らせ、可能であれば、物事がいつ正常に戻るかについての見積もりを与えてください。
実際のトラブルシューティングに関しては、明らかに何が間違っているかに依存します。私は通常、さまざまなサービスの「ステータスの確認」スクリプトのコレクションを保持しています。
ケーブルを確認してください!簡単なEth0ケーブルスワップで問題を解決できたときに、他のものをチェックするのに何時間も費やしました...
このトラブルシューティングリストが気に入っています Simple Trouble Shooting Application Now Fixes Everything =)
ステートメントから特定のアクションセットを提供することは困難です。あなたの最初の動きは以下に基づいています:
明らかに、落ち着いて、目前の問題について注意を払う必要があります。ネットワークのトラブルシューティングの経験から、これは次のような些細なことになる可能性があることがわかります。
とはいえ、次のカテゴリでも深刻な問題になる可能性があります。
重要な要素は、問題をどれだけ知っているかです。あなたの基準点は何ですか?(「システムダウン」とはどのような観点からですか?)。