まだaacraidを取得中:推奨される手順を実行した後、ホストアダプターは要求エラーを中止します


9

悪名高いaacraid:高I / Oでの新しいAdaptec RAIDコントローラーでのホストアダプターアボート要求エラーが発生します。Adaptecsでさえ、いくつかのフォーラムを読みました。/sys/block/sdX/device/timeoutの値を45に設定すると、これが修正されます。しかし、私はUbuntuのサーバー12.04を実行しています。このサーバーのデフォルト値は45です。私はまた、モボのBIOSを最新のものに更新するという次の提案も試しました。

これらの手順を実行した後でも、他の誰かがこの「aacraid:Host adapter abort request」エラーに遭遇したかどうかはわかりません。

これは私のsyslogに表示されるものです:

kernel: [ 5493.523282] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523309] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523375] aacraid: Host adapter reset request. SCSI hang ?

私のウナメがここにある

Linux server 3.2.0-29-generic #46-Ubuntu SMP Fri Jul 27 17:03:23 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux

皆さんありがとう、

ジム

回答:


1

これをまだ解決していない場合に備えて、私は最近、同じ問題に取り組んできました。この問題は、IOが増加するにつれて、数分間5分ごとにアレイがハングするように急速にエスカレートしました。UbuntuはデフォルトでCFQスケジューラーを使用しますが、これはハードウェアRAIDには最適ではありません。スケジューラーをnoopに切り替えます。

echo noop > /sys/block/<blockdevice>/queue/scheduler

個人的には古いカーネルに行き詰まっていますが、最新のaacraidドライバーにアップグレードすることで問題を解決できると言われています-確認できません。それでも、noopに切り替えます。sysfsは永続的ではないため、スケジューラを設定する/etc/rc.localか、elevator=ブートパラメータを使用する必要がある場合があります。

Ubuntuの設定だけでなく他のカーネルパラメータにも注意を払うのが、最も一般的なハードウェアの妥当なデフォルトですが、ほとんどの場合、サーバーはディストリビューションに関係なく特別な注意を必要とします。


1

Adaptec RAIDコントローラに独自のファームウェア/ BIOSがある場合は、それを更新する必要がある場合があります。高I ​​/ O中に問題が発生し、「aacraid:Host adapter abort request」も取得しました。また、「高I / Oストレス中にファームウェアがハングする可能性がある問題を修正しました」という現在のファームウェアリリースよりも新しいファームウェアリリースが表示されました。http://download.adaptec.com/pdfs/readme/relnotes_arc_fw-b18937_asm-18837.pdf

上記のリリースノートには、次のAdaptecモデルがリストされています:2045、2405、2405Q、2805、5085、5405、5405Z、5445、5445Z、5805、5805Q、5805Z、5805ZQ、51245、51645、52445)。

次のようなログ行も取得しました。

sd 0:0:0:0: timing out command, waited 360s

そして

Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK

同様の問題を抱えている他の人々をオンラインで検索したところ、関連する可能性のあるファームウェアによって次の問題が修正されているカードの別のラインが見つかりました。

上記の2つは、Adaptecモデル7805、7805Q、78165、71605E、71605、71605Q、71685、72405、8805、8885、8885Q、および81605ZQに適用されます。


arcconf通常のNagios監視スクリプトの一部として、コマンドラインユーティリティを使用してアレイのステータスをクエリすると、コントローラーがハングアップすると思います。ファームウェアノートが示すように、を使用arcconfすると、コントローラーがハングする可能性があります。
Stefan Lasiewski、2014
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.