これらのSATAエラーは危険ですか?


36

これらのエラーはランダムに発生しますが、その正常かどうかはわかりません。

[39441.061856] ata3.00: failed to read SCR 1 (Emask=0x40)
[39441.061866] ata3.01: failed to read SCR 1 (Emask=0x40)
[39441.061892] ata3.15: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6 frozen
[39441.061897] ata3.15: irq_stat 0x08000000, interface fatal error
[39441.061904] ata3.15: SError: { UnrecovData 10B8B BadCRC }
[39441.061910] ata3.00: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen
[39441.061917] ata3.01: exception Emask 0x100 SAct 0xe SErr 0x0 action 0x6 frozen
[39441.061923] ata3.01: failed command: READ FPDMA QUEUED
[39441.061933] ata3.01: cmd 60/a8:08:b0:48:62/00:00:00:00:00/40 tag 1 ncq 86016 in
[39441.061940] ata3.01: status: { DRDY }
[39441.061944] ata3.01: failed command: READ FPDMA QUEUED
[39441.061953] ata3.01: cmd 60/a8:10:b0:49:62/00:00:00:00:00/40 tag 2 ncq 86016 in
[39441.061959] ata3.01: status: { DRDY }
[39441.061963] ata3.01: failed command: READ FPDMA QUEUED
[39441.061972] ata3.01: cmd 60/58:18:58:4a:62/00:00:00:00:00/40 tag 3 ncq 45056 in
[39441.061978] ata3.01: status: { DRDY }
[39441.061987] ata3.15: hard resetting link
[39441.608302] ata3.15: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[39441.609090] ata3.00: hard resetting link
[39441.929246] ata3.00: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39441.929333] ata3.01: hard resetting link
[39442.249184] ata3.01: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39442.263242] ata3.00: configured for UDMA/133
[39442.277570] ata3.01: configured for UDMA/133
[39442.277725] ata3: EH complete

またsmartctl -asdasdbsdcも貼り付けています。

よろしくお願いします。

回答:


16

私はGeppettvs D'Constanzoの答えに本質的に同意しますが、あなたが試みるかもしれない最初のことのいくつかは

  1. SATAケーブルがマザーボードとハードドライブのソケットにしっかりと接続され、差し込まれていることを確認します。

  2. SATAケーブルを交換します。SATAケーブルは(比較的)安価であり、「悪い」ケーブルを入手することもあります。多くの場合、このような問題を診断して解決するには、ケーブルを単に交換することが最も簡単な方法です。

2本のケーブルが同時に両方とも悪いというのは予想外ですが、それでも確認するのは簡単なことです。

ドライブのSMARTデータを含むパスビンを見ました。ドライブsdbとの予期しないほど多くのCRCエラーに注意してくださいsdc。これらのドライブのケーブルと接続を確認することから始めることをお勧めします。

junior@mediacenter:/$ sudo  smartctl -a /dev/sda
...
Model Family:     SAMSUNG SpinPoint M7E (AFT)
Device Model:     SAMSUNG HM321HI
...
199 UDMA_CRC_Error_Count    0x0036   200   200   000   Old_age  Always -    0

junior@mediacenter:/$ sudo  smartctl -a /dev/sdb
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  -  57

junior@mediacenter:/$ sudo  smartctl -a /dev/sdc
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  - 398

OK。だから、latpopではありません。;-)
もちろん、これがラップトップで起こっている場合、上記のどれも当てはまらず、どのアドバイスを提供するのかわかりません。ハードドライブを取り外して再インストールすることもできますか?おそらく、接続を改善するためにソケットに装着しなおす必要があるのでしょうか?


sbdそして、sdc同じ外部電子SATAケーブル(ThermaltakeのデュオHDDドック)に接続されています。e-sataケーブルを交換します。

不良または低品質のケーブルが原因である可能性があります。また、ドライブの使用中にケーブルが何らかの方法で動かされたり、ぶつかったり、動かされたりする可能性もあります。


1
sbdそしてsdc両方とも同じ外部電子SATAケーブル(ThermaltakeのデュオHDDドック)に接続されています。e-sataケーブルを交換します。
マルコスジュニア

9

品質が悪い/破損したSATA電源/データケーブルがあるようです。悪いCRCを引き起こしている可能性があります。それらはまったく有害ではなく、一緒に暮らすことはできますが、すぐに多くのデータを失うことになります。

ハードディスクドライブのSMARTレポートは正常に見えるため、同じケース/電源に5台のハードディスクドライブを設定したときの経験に基づいて、電源の問題に取り組んでいます。2台のドライブに外部電源(475W)を使用し、GPU、光学ドライブ、ハードディスクドライブを含むすべてのケースにケースの600Wを使用しました。

とにかく、他のことをする前にフルバックアップを実行することをお勧めします。可能であれば、ハードディスクドライブのクローンを作成します。その後、ケーブルと電源電圧を確認する必要があります。


好奇心から、そのGPUは大きな、ホンキンのパワー飢えたGPUでしたか?
不合理なジョン

1
nVidia Quadro 4000、そんなに空腹ではない。
Geppettvs D'Constanzo

1
面白い。400wのAntec(Neo-Eco)PSU、5台のハードドライブ、2台の光学ドライブ、およびNVIDIA GeForce 9500 GTを所有していますが、電源関連の問題はないと思います。私が持っているドライブのCRCエラーを、私は、彼らは私がしばらく前に作られた愚かなユーザー・エラーからだと思います。(ケーブルのバンピングなど)カーネルメッセージに警告ログが表示されていません。それでも、私は安全のためだけにそれを注意深く監視する必要があると思います。
不合理なジョン

1
1xIDE DVD-RW、1xSATA DVD-RW、および1xSATA Blu-Ray ROMオプティカルドライブのこちら側。4 SATAと1 IDE HDD、GPUは142ワットの電力消費です。私はそれが電源の問題に関するものであることを絶対に確信しているとは言えませんが、新しい電源を追加すると問題はなくなりました。ところで、私のドライブは健全であるようです。しかし、私にそれを見せてくれてありがとう。あなたの意見はこの面で本当に高く評価されています。ありがとうございました!
Geppettvs D'Constanzo

1
ええと、GPUの142ワットは...何かです。私のシステム全体は(通常)それよりも少ないものを使用します。これを入力すると、デスクトップボックスが117ワットを引きます。(Kill-A-Wattによれば、まだプラグインされていることを忘れていました。;
不合理なJohn

4

一部のカーネルバージョンと一部のSATAコントローラーの間に問題があるようです。

私は最近、Scientific Linuxを実行しているWebサーバーで非常によく似た問題(同じかどうかはわかりません)に苦しみ始めました。

このような問題に関して私が見つけた最も正確で完全な情報は、このランチパッドのバグです。

つまり、NCQを無効にすることが、この問題を抱えているユーザーにとって最善の回避策のようです。


3
NCQを無効にすることは、バグのあるハードウェアの一般的な回避策です。カーネルのバグはないようです。
psusi

うまくいきました!すべてのエラーメッセージが消え、システムがクラッシュしなくなりました。カーネルバグではないことに完全に同意しません。古いカーネルバージョン(少なくとも2.6シリーズに戻るまで)をクラッシュなしで使用できるからです。これをもっと早く見つけられなかったなんて信じられない!
レキオド

1

これはほとんど常に不良ドライブであり、私は何千ものドライブを使用していますが、これらのエラーが原因でドライブが故障することはありませんが、ファイルシステムが破損します。ドライブのコントローラーボードの問題と関係があると思います。

この問題を解決するためにすべてを試しましたが、修正はドライブを交換することで、同じケーブルとコントローラーで動作します。

がんばろう


30年以上にわたってこれらの問題をトラブルシューティングして生計を立ててきましたが、私の経験では、これはほとんど常に危険なケーブルであると確信できます。そして、安いので最初に試してみてください。
オタク長老

0

私はこのスレッドが古いことを知っていますが、最近6つのsataスロットを備えた新しく購入したマシンで同じ問題に遭遇しました。cdromとhardriveを互いに近い2つのSATAスロットにインストールし、再起動するまでエラーなしでubuntuをインストールしました。その後、ata8:ハードリセットリンクエラーが表示されました。マシンはこの時点まで停止し、回復することはありません。数回再起動してみましたが、うまくいきませんでした。そして、私は4つの利用可能なスロットの1つでハードライブを交換しようとしましたが、手間をかけずにうまく機能しました。


ハードドライブが接続されているSATAポートを変更したということですね。または、ハードドライブ全体を別のものに交換するということですか?私はそれが前者だと思うが、ただダブルチェック
-Xen2050

前者です。
ウルトラジョン


0

このエラーは危険であり、HDを損傷する可能性があります。

解決するには:

  1. SATAケーブルを交換します。
  2. エラーが続く場合は、他のマザーボードソケットにSATAケーブルを差し込みます(現在のソケットが酸化する可能性があります)。
  3. エラーが続く場合は、電源ユニット(PSU)に問題があるはずです。

http://eliasoenal.com/2012/10/31/power-supply-failures-can-be-pretty-annoying-to-find/


0

同じ問題がありました。私はすべてを試しましたが、asus p5kのj-micronポートでのみ、エラーはありませんでした。

しかし、ドライブを他の電源に入れたとき、それは機能し、エラーはなくなりました。次に、ドライブを元の電源に戻しましたが、新しい電源コネクタを使用しましたが、これも機能しました。


0

私はこのスレッドが古いことを知っていますが、同じ問題にぶつかりました。Googleからここに来ました。

  • 取得ata3.01: failed command: READ FPDMA QUEUEDKubuntuの16.04のLiveCDを起動するには。
  • WINDOWS 7は不安定に動作し、しばらくは正常に動作しますが、youtubeを視聴するとフリーズします。

SATAケーブルを変更しても何も起こりませんでした。
PSUを交換すると、問題はなくなりました。


0

このエラーがハードドライブに損傷を与えることはほとんどありませんが、ファイルシステムが破損する可能性が非常に高くなります。どのドライブがエラーをスローしているかを判断することから始めます。これは通常、次のような多くのアプローチで簡単に決定できます。

1)コマンドdmesg | grep ata3を発行し、ハードドライブのメーカーとモデルを探します。(ata3は状況に応じてエラーをスローするポートであるため、適宜調整してください)これは次のような出力を提供します

dmesg | grep ata3
[    4.756081] ata3: SATA max UDMA/133 abar m2048@0xf7f26000 port 0xf7f26200 irq 135
[    5.071981] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[    5.077850] ata3.00: HPA detected: current 1953523055, native 1953525168
[    5.077959] ata3.00: ATA-8: SAMSUNG HD103SJ, 1AJ10001, max UDMA/133
[    5.077960] ata3.00: 1953523055 sectors, multi 16: LBA48 NCQ (depth 32), AA
[    5.084057] ata3.00: configured for UDMA/133

一目でわかるように、ata3に接続されているドライブはSAMSUNG HD103SJである

2)以下のコマンドを発行します。

find -L /sys/bus/pci/devices/*/ata*/host*/target* -maxdepth 3 -name "sd*" 2>/dev/null | egrep block |egrep --colour '(ata[0-9]*)|(sd.*)'

これにより、以下に示すように、同じ行で強調表示されたポートとデバイス名の両方が提供されます。

出力

ata3に接続されているデバイスにデバイス名sdbが割り当てられていることが簡単にわかります。

3)lsscsiをインストールしsudo apt install lsscsi、コマンドを発行しますlsscsi

$ lsscsi
[0:0:0:0]    cd/dvd  ATAPI    iHAS124   F      CL9M  /dev/sr0 
[1:0:0:0]    disk    ATA      WDC WD2003FZEX-0 1A01  /dev/sda 
[2:0:0:0]    disk    ATA      SAMSUNG HD103SJ  0001  /dev/sdb 
[3:0:0:0]    disk    ATA      ST6000VN0033-2EE SC60  /dev/sdc 

上記の各行の最初のエントリは、scsi_host、channel、target_number、およびLUNであることに注意してください。角かっこで囲まれ、各要素はコロンで区切られます。複数のSCSIデバイスがある場合、それらのエントリは昇順でソートされます。

出力の各行の最初の数に1を追加するだけで、ATAポートが得られます。詳細については、lsscsi こちらこちらをご覧ください。

あなたの場合、3.00と3.01の両方でエラーがスローされるので、同じATAポートに複数のドライブが接続されています。ata3.00とata3.01の両方への接続を注意深く確認する必要があります。これは、同じケーブルに接続されたマルチベイドライブエンクロージャである可能性があります。両方のドライブでエラーがスローされるため、ケーブルを前述のマルチドライブベイに交換すると、両方のドライブの問題が解消されます。これらのデバイスには通常、原因となる可能性があり交換が必要な外部電源がありますが、ケーブル(最も弱いリンク)が問題の根本原因である可能性がはるかに高いです。

ソース:

経験

https://linux.die.net/man/8/lsscsi

http://sg.danny.cz/scsi/lsscsi.html

https://serverfault.com/questions/244944/linux-ata-errors-translating-to-a-device-name/868943#868943

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.