理想的には、できるだけ簡単にインストールし、サーバーを再起動する必要はありません。主にDL380 G5's
それが役立つかどうかのために。
理想的には、できるだけ簡単にインストールし、サーバーを再起動する必要はありません。主にDL380 G5's
それが役立つかどうかのために。
回答:
これは、サーバーで実行しているオペレーティングシステムによって多少異なりますが、一般に、HP ProLiantサーバーおよびSmartアレイRAIDコントローラーからアラートを取得することが可能です。
DL380 G5システムの完全なドライバーおよびソフトウェアサポートのリストは、ここに記載されています。
SNMPと監視ソリューションが最適なアプローチです...しかし、HPのツールのいくつかを使用してそれを強化できます。HPは、HP Systems Insight Managerを提供しています。これは、ダウンロード可能で、サーバーに付属しています。これは、サーバーのコレクションに最適です。管理または監視インフラストラクチャを構築せずに1回限りのアラートを探している場合は、HP Management Agent(別名ProLiant Support Pack)をインストールするだけです。
スタンドアロンLinuxシステムの場合、エージェントに電子メールでトラップを送信させます。通常、デフォルトまたはカスタムバンドルでサポートパックを構成し、受信者のアドレスを指すように行を編集/opt/hp/hp-snmp-agents/cma.conf
および変更しtrapemail
ます。
########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
# trapemail /usr/bin/logger
# will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' systems@1234.net
Linuxを実行していて、完全なHP管理スイートをインストールしたくない場合は、cciss_vol_statusユーティリティに関するスクリプトを開発して、コントローラー/ディスクのステータスを照会できます。参照:OpenFilerへのHPエージェントのインストール
ProLiant DL360 G7
サーバーがあり、HP SIMが監視用に設定されています。
HP Insightマネージャーをご覧ください
https://www.hpe.com/us/en/product-catalog/detail/pip.489496.html#
サーバーで動作するはずです。
@ewwiteが彼の答えで言及した軽量プログラムを使用しました: cciss_vol_status
付随するINSTALLの指示に従うと、スクリプトはに配置され/usr/local/bin/cciss_vol_status
ます。
以下は、cciss_vol_statusの出力をgrepし、アレイのステータスがFAILEDの場合に電子メールを送信するために使用するラッパースクリプトです。
#!/bin/bash
#
# Check status of RAID volumes on HP Smart Array controllers. Send an email
# alert if any volumes have a FAILED status.
#
status=`/usr/local/bin/cciss_vol_status /dev/sd*`
# email lock file
lockfile=/tmp/raid.check.hp.smartarray.lock
# how often to send an email (minutes)
_notification_freq=59
_host=`hostname`
# To: email
_toemail=root
# create email lock file
[ ! -f ${lockfile} ] && /bin/touch ${lockfile}
if echo $status | grep -q FAILED
then
# make sure we haven't sent a notification in the last X minutes
if test `find ${lockfile} -mmin +${_notification_freq}`
then
echo -e "${status}" | /bin/mail -s "System Alert! RAID failure on ${_host}" ${_toemail}
# update lock file mod time
/bin/touch ${lockfile}
fi
fi
cronで上記のスクリプトを呼び出します。2分ごとにチェックを実行します。
*/2 * * * * /usr/local/bin/raid.check.hp.smartarray.sh
私たちは使用しないでくださいHPシステムInsight Managerの当社HP年代が稼働しているかどうかをチェックするために、それを越えて何も。他の監視ソリューションが用意されているので、Linuxエージェントは私たちにとってはやりすぎだとわかりました。そのため、上記のスクリプトは特定の目的に十分に役立ちます。
更新
これに遭遇した場合のトラブルシューティングのヒントです。このスクリプトは、今朝、故障したアレイに関するメールを受け取ったときに役に立ちました。
キャッシュのダーティ制限に達しました
デバイスは読み取り専用になり、では表示されませんでした/proc/partitions
。サーバーを再起動すると、起動時に次のメッセージが表示されました。
データ損失の可能性があるため、論理ドライブが無効になっています。「F1」を選択して、論理ドライブを無効にして続行します「F2」を選択して、データの損失を受け入れ、論理ドライブを再度有効にします
F2を選択しましたが、RAIDは問題なく、ブート時にマウントされました。