私のXenサーバーはopenSUSE 11.1で、iSCSI SANクラスターに対してopen-iscsiを使用しています。SANモジュールは、イニシエーターが接続する仮想IPの背後にあるIPフェイルオーバーグループにあります。
プライマリSANサーバーがダウンした場合、セカンダリはターゲットとして機能する役割を引き受けます。これはすべてLeftHand SAN / iQソフトウェアによって処理され、ほとんどの状況でうまく機能します。
私が抱えている問題は、Xen DomUの一部で、IPフェイルオーバー後にルートファイルシステムが読み取り専用になることがあるということです。これは一貫性がなく、フェイルオーバーが発生するたびに異なるサブセットに発生します。それらはすべて同じopenSUSE 11.1ソフトウェアイメージを実行しています。
各DomUのルートファイルシステムは、Dom0のopen-iscsiによってマウントされ、Xenは標準のブロックデバイスドライバーを使用してDomUに公開します。
正確な症状は、実行中のrootとしてtouch /test
「読み取り専用ファイルシステム」エラーを返すことです。ただし、の出力は、mount
読み取り/書き込みでマウントされていることを示しています。もちろん、domU上の他のすべてのI / Oもこの時点で失敗しているため、マシンは完全にダウンします。xm
iSCSIセッションを再接続することなくDom0から再起動するだけで、すべてが再び機能します。
Dom0側では、フェイルオーバー中のsyslogメッセージは次のようなものです。
kernel: connection1:0: iscsi: detected conn error (1011)
iscsid: Kernel reported iSCSI connection 1:0 error (1011) state (3)
iscsid: connection1:0 is operational after recovery (1 attempts)
この問題をデバッグするためにどのレイヤーを見つけるのに苦労しています、それはDomUカーネルの何かですか?またはDom0またはXenレベルで?何らかのタイムアウトを増やすために微調整が必要なパラメータがどこかにあると思いますが、どこを見ればよいかわかりません。
接続されたブロックデバイスがDom0から読み取りおよび書き込み可能であるという理由だけで、open-iscsiの問題であるとは本当に思いません。