ドライブに障害が発生したときにHPサーバーからメールを受け取るにはどうすればよいですか?


11

理想的には、できるだけ簡単にインストールし、サーバーを再起動する必要はありません。主にDL380 G5'sそれが役立つかどうかのために。


恥ずかしがるのはG7ではない、またはHP Insight Managerを使用できるということです。
トム・オコナー

サーバーはWindowsまたはLinuxを実行していますか?
トム・オコナー

これらのサーバーで実行しているオペレーティングシステムは何ですか?
ewwhite

それらはすべてバニラとR2の両方の2003年または2008年です。SIMでプレイしましたが、G5と通信できませんでした。
DrZaiusApeLord

SIMは引き続きG5 ProLiantsと互換性があります。以前に試したときにエージェントをインストールしましたか?
ewwhite

回答:


16

これは、サーバーで実行しているオペレーティングシステムによって多少異なりますが、一般に、HP ProLiantサーバーおよびSmartアレイRAIDコントローラーからアラートを取得することが可能です。

DL380 G5システムの完全なドライバーおよびソフトウェアサポートのリストは、ここに記載されています

SNMPと監視ソリューションが最適なアプローチです...しかし、HPのツールのいくつかを使用してそれを強化できます。HPは、HP Systems Insight Managerを提供しています。これは、ダウンロード可能で、サーバーに付属しています。これは、サーバーのコレクションに最適です。管理または監視インフラストラクチャを構築せずに1回限りのアラートを探している場合は、HP Management Agent(別名ProLiant Support Pack)をインストールするだけです。

スタンドアロンLinuxシステムの場合、エージェントに電子メールでトラップを送信させます。通常、デフォルトまたはカスタムバンドルでサポートパックを構成し、受信者のアドレスを指すように行を編集/opt/hp/hp-snmp-agents/cma.confおよび変更しtrapemailます。

########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
#             trapemail /usr/bin/logger
#       will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' systems@1234.net

Linuxを実行していて、完全なHP管理スイートをインストールしたくない場合は、cciss_vol_statusユーティリティに関するスクリプトを開発して、コントローラー/ディスクのステータスを照会できます。参照:OpenFilerへのHPエージェントのインストール


ドライブをスロットから引き出す以外に、RAIDアレイの障害に関するアラートをテストするエレガントな方法はありますか?いくつかのProLiant DL360 G7サーバーがあり、HP SIMが監視用に設定されています。
バンジャー

私が知っていることではありません。Insightエージェントは間違いなく機能します。hpacucliユーティリティを使用してアレイのステータスを確認でき、HP SIMでアラートを受信して​​いることがわかっている場合は、動作するものと想定するのが妥当だと思います。
ewwhite


3

@ewwiteが彼の答えで言及した軽​​量プログラムを使用しました: cciss_vol_status

付随するINSTALLの指示に従うと、スクリプトはに配置され/usr/local/bin/cciss_vol_statusます。

以下は、cciss_vol_statusの出力をgrepし、アレイのステータスがFAILEDの場合に電子メールを送信するために使用するラッパースクリプトです。

#!/bin/bash
#
# Check status of RAID volumes on HP Smart Array controllers.  Send an email
# alert if any volumes have a FAILED status.
#
status=`/usr/local/bin/cciss_vol_status /dev/sd*`

# email lock file
lockfile=/tmp/raid.check.hp.smartarray.lock
# how often to send an email (minutes)
_notification_freq=59
_host=`hostname`
# To: email
_toemail=root

# create email lock file
[ ! -f ${lockfile} ] && /bin/touch ${lockfile}

if echo $status | grep -q FAILED
then
    # make sure we haven't sent a notification in the last X minutes
    if test `find ${lockfile} -mmin +${_notification_freq}`
    then
        echo -e "${status}" | /bin/mail -s "System Alert! RAID failure on ${_host}" ${_toemail}

        # update lock file mod time
        /bin/touch ${lockfile}
    fi
fi

cronで上記のスクリプトを呼び出します。2分ごとにチェックを実行します。

*/2 * * * * /usr/local/bin/raid.check.hp.smartarray.sh

私たちは使用しないでくださいHPシステムInsight Managerの当社HP年代が稼働しているかどうかをチェックするために、それを越えて何も。他の監視ソリューションが用意されているので、Linuxエージェントは私たちにとってはやりすぎだとわかりました。そのため、上記のスクリプトは特定の目的に十分に役立ちます。

更新

これに遭遇した場合のトラブルシューティングのヒントです。このスクリプトは、今朝、故障したアレイに関するメールを受け取ったときに役に立ちました。

キャッシュのダーティ制限に達しました

デバイスは読み取り専用になり、では表示されませんでした/proc/partitions。サーバーを再起動すると、起動時に次のメッセージが表示されました。

データ損失の可能性があるため、論理ドライブが無効になっています。「F1」を選択して、論理ドライブを無効にして続行します「F2」を選択して、データの損失を受け入れ、論理ドライブを再度有効にします

F2を選択しましたが、RAIDは問題なく、ブート時にマウントされました。


1

smartmontoolsをインストールします。ドライブが失敗する前にメールを送信します。


2
約30%の時間。SMARTは特効薬ではありません
HopelessN00b
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.