HPスイッチでファームウェアのアップグレードを行っています。2つの異なるモデルがアップグレードされました。
- ProCurve Switch 5406zl Intelligent Edge(J8697A):K.15.06.0008からK.15.12.0012にアップグレード
- HP 2520-24G-PoEスイッチ(J9299A):J.14.54からJ.15.09.0021にアップグレード
新しいイメージを起動した直後に各スイッチを確認すると、次のようなことがわかりました。
- スイッチは新しいファームウェアイメージをエラーなしでロードし、スイッチが起動するとすぐに接続が回復しました。この時点でCPU使用率は低い(10%未満)
- 数秒後、CPU使用率が最大100%になり、数分間そのままになりました。この時点では、SSHを介したCLIが少し遅いことを除けば、問題を検出できませんでした。通常の接続、ログメッセージなし...
- 100%で5〜10分後、CPUは私の側から何の変化もなく通常に戻りました。
どちらのモデルもこの動作をしていました。各モデルの1つのユニットを以前のファームウェアイメージにロールバックしましたが、それらは同じように動作しました。
起動直後のこのCPUスパイクは問題を引き起こしませんでしたが、通常のネットワーク動作がこのスパイクの原因であるのではないかと思いますが、私はそうは思いません。私は以下の側面を検討しました:
ブート直後にSTPが実行を開始し、BPDUを生成して、スイッチのすべてのポートをBloking、Listening、Learning、およびForwarding状態に切り替えます。ただし、802.1Dを使用しても、デフォルトのタイマーを使用すると、このプロセスは1分以内で完了します。さらに、私はSSHを介してスイッチをチェックしていたため、すべてのSTP計算は、スイッチに接続できるようになるまでにすでに行われていました。
ブート直後、MACアドレステーブルは空であり、最初のフレームを転送するにはブロードキャストが必要です。しかし、24ポートのスイッチでは、このブロードキャストが100%CPUを使用し、5分間ではるかに少ないとは思えません。
L2デバイスとして機能するすべてのスイッチ、L3機能は有効になっていないため、ルーティングやその他のL3プロセスを破棄します。
接続を維持したまま、再起動後5分間このCPU使用率を説明する可能性のあるネットワーク操作の「通常の」何かが欠けていますか?たぶんそれは、スイッチが再起動直後に実行されるある種のバックグラウンドプロセスですか?