CentOS 6でDell PERC H710 RAIDコントローラーの背後にあるハードディスクの状態を監視する方法は?


26

Raid 5セットアップを備えたRaid ControllerカードをCentOS 6使用して実行しているDellサーバーがありPERC H710、Raid Controllerの背後にあるハードディスクの障害/動作ステータスを監視したい。

次に、bashスクリプトを使用して、ハードディスクの状態を監視し、何か問題が発生した場合にアラートメールを送信できるようにします。

CentOS / Red Hat / Linux用のLSI MegaRAID SASコマンドツール(LSI MegaRAID SAS Linuxツールについて)は、PERC H710をsmartctlサポートしておらず、サポートもしていません。

デルのWebサイトに基づいてCentOS、このサーバーはサポートされていません(NX3200 PowerVault)。ハードディスクを監視するためのLinuxプログラムをダウンロードできませんでした。

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

CentOS 6を搭載したDell PERC H710のハードウェアレイドの背後にあるハードディスクの状態を監視する方法は誰でも知っていますか?

回答:


26

SMARTは、ディスクまたはストレージの監視における最後の言葉ではありません !! これはコンポーネントですが、最新のRAIDコントローラーは他の方法と一緒に使用して、ドライブとアレイの状態を判断します。

これはDell PowerEdgeサーバーのPERCコントローラーであると想定しています。

デルのハードウェアの健全性監視に対する通常のLinuxフレンドリーなアプローチは、Yum- http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setupを介してLinux用のDell OMSAエージェントをインストールすることです。

yum install srvadmin-allエージェントの完全なスイートをインストールします。インストールしたら、omreportコマンドを使用してアレイに関する情報取得できます。

例:

$ omreport storage vdisk

$ omreport storage pdisk controller=0

$ omreport storage vdisk controller=0 vdisk=1

7
これにより、LinuxサーバーにWebサーバー/ SSLなどの追加コンポーネントがインストールされますが、他に選択肢はないようです!不要なパッケージをサーバーに追加するのは嫌です。
Xianlin 14

2
これらのOMSAプログラムのいずれかからの潜在的なメモリリークに注意してください。3〜4週間かけて徐々にブームになり、Linuxのメモリはまったくなくなりました。
bksunday

1
はい、リークはdsm_sa_snmpdにあります(「killall -9 dsm_sa_snmpd」を実行し、解決しました)。
markusN

5
PERC 7xxおよび8xxコントローラーは単なるLSI Megaraidコントローラーであり、dellライブラリや、最近ドロップしている他のサービスやカーネルモジュールでシステムを汚染したくない場合、LSI MegaCLIツールは正常に動作します。LSIバイナリ用のMegaCLIチートシート、nagios監視スクリプト、およびパフォーマンスチューニングのヒントがたくさんあります。それはもちろん私の個人的な好みと意見です。私はミニマリストです。
アーロン

@Xianlin、これは完全に真実ではありません。はい、それは多くのゴミをインストールしますが、私の答えを参照してください。不要なパッケージを追加したくなかったので、ストレージに必要なものだけを見つけました。
マイクS

25

smartctlコマンドとその-d引数を使用して、ディスクのSMARTステータスを確認できます。たとえば、アレイの最初のディスクを表示するには:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

これは、smartmontools-5.43-1.el6.x86_64を備えたScientific Linux 6(別のRHEL6ベースのOS)にあります。


-d megaraid,0smartctl 6.6コマンドラインで十分でした。ではDEVICESCAN、文字列で/etc/smartd.confも必要-d removable
スチュアートCardall

9

受け入れられた答えは、大胆であることを推奨していyum install srvadmin-allます。ブレッチ。以下に、Blechch-yをわずかに減らす方法を示します(ただし、それでもBlechch-yです。HPのプラットフォームではより無駄を省くことができます。しかし、回避します...) 。

ところで、ユーザーの質問に対する直接的な答えは、下のリストの「vdisk 0上の物理ディスクを表示する」という項目にあります。

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

ルートの.bashrcに追加します。

export PATH=$PATH:/opt/dell/srvadmin/bin

楽しい:

RAIDコマンド

  • コントローラ0のすべての物理ディスクを表示します

    $ omreport storage pdisk controller=0
    
  • コントローラ0上のすべての論理ディスクを表示します

    $ omreport storage vdisk controller=0
    
  • vdisk 0上のすべての物理ディスクを表示します

    $ omreport storage pdisk controller=0 vdisk=0
    
  • raid0からraid1になるようにvdiskを再構成します(COOL !!!!

    $ sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
    
  • 新しいディスクに仮想ディスクを作成します。

    $ sudo omconfig storage controller controller=0 action=clearforeignconfig
    $ sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
    

詳細情報

ところで、これはDellブランドのLSI MegaCLIカードにすぎないので、Han Soloの答えはさらに良くなるかもしれません!ただし、まだ試していません。

甘さ

以下に、omreportの出力の例を示します。grepを使用して、おいしいデータのバンドルを取得します。

$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D

@slmあなたの編集に関して-それは本当にルートなしで動作しますか?最近、私の目の前にomreport / omconfigがありませんが、どのユーザーも仮想ディスクを作成できるかどうかはわかりません。コマンドラインの「$」は、rootではなく通常のユーザーを意味します。
マイクS

ええ、私は先日、Dell 730を使ってこれを行いましたが、「作成」を行う2つを除くすべてのコマンドはルートを必要としませんでした。修正します。
slm

6

また、CentOSで動作させるために苦労していましたが、ここhttp://mirror.ndchost.com/software/lsi/で動作するパッケージを見つけました

MegaCli-8.07.10-1.noarch.rpm」と呼ばれます

コマンドリファレンスhttp://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS

役に立てば幸いです。


1
/ opt / megacli / MegaCli64 -PDList -aALLを使用します。grep -i firmwareを実行すると、物理ディスクに問題がないかどうかがわかります。(コマンドはerikimh.com/megacli-cheatsheetからのものです -間違ったものを使用したかどうかを確認してください)。基本的にRAIDケアはディスクを監視するのに非常に役立つので、ディスクの動作状態に関する意見を追跡するだけです。
一部のLinuxオタク

3
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:

8
読んでみてください、私は良い答えを書くにはどうすればよいですか?ヘルプセンターで回答を修正します。あなたの司令部は技術的には解決策かもしれませんが、これは他のはるかに古い回答でも言及されており、いくつかの説明を歓迎します。前もって感謝します。
HBruijn

1
もう1つの答えは「sat + megaraid」を使用しましたが、それは私には機能しませんでした。(そうです、smartctlコマンドをよく知らず、コマンドをどのように変更して機能させるかを知りませんでした。)この答えは私を正しい道に導きました。
永偉呉

1

perccliあなたはうまくそれを聞いている場合、コマンドはまた、あなたのドライブ情報の多くを表示することができます:

# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.


Drive /c0/e32/s0 :
================

-------------------------------------------------------------------------
EID:Slt DID State DG       Size Intf Med SED PI SeSz Model            Sp
-------------------------------------------------------------------------
32:0      0 UGood -  278.875 GB SAS  HDD N   N  512B ST3300657SS      U
-------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded


Drive /c0/e32/s0 - Detailed Information :
=======================================

Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature =  40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes

これは、各エンクロージャスロットに対して繰り返す必要があります。または、少なくとも1つのperccliコマンドですべてを一度に印刷する方法を見つけていません。

また、他のより包括的なオプションと比較して簡単にインストールできます。

# curl -C - -O 'https://downloads.dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/

perccliDelll OMSAのような包括的な監視スイートではありませんが、多くの人が包括的なものを望んでおらず、代わりにまともなシンプルなツールが必要なようです。


-1

こんにちは、同様のDell PERC / LSIカードがあり、RAIDステータスを確認する必要がありました。LSIにはsas2ircuと呼ばれるユーティリティがありますが、これは非常に便利です。WindowsとLinux向けのバージョンもあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.