再起動後数分間、ProCurve CPUが100%になる


9

HPスイッチでファームウェアのアップグレードを行っています。2つの異なるモデルがアップグレードされました。

  • ProCurve Switch 5406zl Intelligent Edge(J8697A):K.15.06.0008からK.15.12.0012にアップグレード
  • HP 2520-24G-PoEスイッチ(J9299A):J.14.54からJ.15.09.0021にアップグレード

新しいイメージを起動した直後に各スイッチを確認すると、次のようなことがわかりました。

  1. スイッチは新しいファームウェアイメージをエラーなしでロードし、スイッチが起動するとすぐに接続が回復しました。この時点でCPU使用率は低い(10%未満)
  2. 数秒後、CPU使用率が最大100%になり、数分間そのままになりました。この時点では、SSHを介したCLIが少し遅いことを除けば、問題を検出できませんでした。通常の接続、ログメッセージなし...
  3. 100%で5〜10分後、CPUは私の側から何の変化もなく通常に戻りました。

どちらのモデルもこの動作をしていました。各モデルの1つのユニットを以前のファームウェアイメージにロールバックしましたが、それらは同じように動作しました。

起動直後のこのCPUスパイクは問題を引き起こしませんでしたが、通常のネットワーク動作がこのスパイクの原因であるのではないかと思いますが、私はそうは思いません。私は以下の側面を検討しました:

  1. ブート直後にSTPが実行を開始し、BPDUを生成して、スイッチのすべてのポートをBloking、Listening、Learning、およびForwarding状態に切り替えます。ただし、802.1Dを使用しても、デフォルトのタイマーを使用すると、このプロセスは1分以内で完了します。さらに、私はSSHを介してスイッチをチェックしていたため、すべてのSTP計算は、スイッチに接続できるようになるまでにすでに行われていました。

  2. ブート直後、MACアドレステーブルは空であり、最初のフレームを転送するにはブロードキャストが必要です。しかし、24ポートのスイッチでは、このブロードキャストが100%CPUを使用し、5分間ではるかに少ないとは思えません。

  3. L2デバイスとして機能するすべてのスイッチ、L3機能は有効になっていないため、ルーティングやその他のL3プロセスを破棄します。

接続を維持したまま、再起動後5分間このCPU使用率を説明する可能性のあるネットワーク操作の「通常の」何かが欠けていますか?たぶんそれは、スイッチが再起動直後に実行されるある種のバックグラウンドプロセスですか?

回答:


8

これはGoogleで2秒もかかりませんでした: HPネットワークポータル

HP ProCurve 5400zlスイッチシリーズ-起動の問題後のCPU使用率が高い(99〜100%)

スイッチを開始した直後に、高い(99-100%)CPU使用率が観察されます。解決

スイッチが起動すると、初期化タスクの1つは暗号化キーの作成です。事前にキーを作成しておくと、後で、キーを使用するSSLやSSHなどの機能を構成または使用するときに、可用性の遅延が最小限になります。スイッチのモデル、ロードされる設定、およびソフトウェアリビジョンによっては、このタスクが起動するまでに数秒かかります。タスクはCPUの最大100%を消費しますが、非常に低い優先度で実行されます。したがって、CPUサイクルを必要とする別のタスクが開始されると、この優先度の低いタスクはバックオフします。この初期化/キー生成タスクが優先度の高いタスクによって中断されることなく実行される場合、完了するまでに約10分かかります。CPUが他のタスクでビジー状態の場合、完了時間が延長されます。

表示されている昇格されたCPUが実際にここで説明されているものであり、トラブルシューティングが必要なものではないことを確認するには、以下に記載されているコマンドを使用してください。

task-monitor cpu (this command was introduced in K.13.04)

show uptime

show cpu

出力は次のようになります。

Switch#task-monitor cpu Switch#show uptime 0000:00:01:42.36 Switch#show cpu

99 percent busy, from 27 sec ago
1 sec ave: 100 percent busy
5 sec ave: 100 percent busy
1 min ave: 66 percent busy

Task usage for last 5 sec
 % CPU | Description
-------+--------------------------
   0.3 | Sessions & I/O
  99.7 | System Services

これは私が経験した問題を説明しているように思われます。しかし、その後、新しい疑問が頭に浮かびます。私が言ったように、私はSSH接続を介してスイッチをチェックしていました。ログインしてから数秒後にSSHキーが生成されている場合:キーの準備ができる前にSSHセッションを開始するにはどうすればよいですか?
ダニエルユステアロカ2014年

2
Procurve Access Security Guideから:スイッチでホストキーペアを生成すると、スイッチはキーペアをフラッシュメモリに(running-configファイルではなく)配置します。また、スイッチは、電源の再投入を含め、再起動後もキーペアを維持します。スイッチの公開鍵と秘密鍵のペアを削除(ゼロ化)すると、スイッチはSSH操作を実行できなくなり、スイッチのIP SSHが自動的に無効になります。
ダニエルユステアロカ2014年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.