btrfsとext4エラーが発生しました。RAMのテストを決定した後、で次のエラーが繰り返し発生しましたmemtester
。を少し実行した後、私は常に同様のエラーを受け取りmemtester
ます。通常は1時間ですが、一度に4〜5時間かかりました。
コンピュータのRAMがはんだ付けされています。追加の空のスロットを取得しました。BIOSには、オンボードRAMを無効にする設定はありません。
私は走った:
- Memtest86 + 8パス(〜8時間)
- 18パス(〜9時間)のMemTest86
memtester
そして、stressapptest
はFedora 27のデフォルトに、USBスティックにインストールされている(〜10時間)memtester
そしてstressapptest
Ubuntu 17.10 Liveのデフォルト(〜2時間)memtester
そしてstressapptest
Ubuntu 17.10ではUSBスティック(約8時間)# debsums --changed
変更された唯一のファイルはテーマの画像でした。
エラーは出力されませんでした。
デフォルトのカーネルでUbuntu 17.10(17.04からアップグレード)を使用しています。カーネルは汚染されていません。Intel Haswell i3を搭載したASUSラップトップです。
- Linux 4.14.13および4.15.0-rc3、rc4、mainlineでもテストされています。
- パージされたインテルマイクロコードパッケージでもテストされています。
エラーは、Nouveauが無効になっているか、有効になっているか、nvidiaバイナリドライバーが読み込まれていない場合に再現可能です。
次のモジュールをブラックリストに登録しました。 mtd
intel_spi_platform
intel_spi
これらはデフォルトのFedora 27インストールではロードされず、一部のLenovaラップトップが壊れているように見えるためです。エラーは停止していません。
uname -a
の出力
Linux hostname 4.13.0-19-generic #22-Ubuntu SMP Mon Dec 4 11:58:07 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux
# lsmod
の出力
https://paste.ubuntu.com/26222245/
Fedora 27の# lsmod
出力
https://paste.ubuntu.com/26226473/
現在の状況
私は自分のHDDを、私が良好であることがわかっているラップトップ(バックアップラップトップ)に入れ、そこでテストを実行しました。エラーが発生しました。これはソフトウェアの問題だと確信しています。私はラップトップでエラーを発生させることができませんでした。
私は何をすべきか?
エラーのサンプル:
Loop 6:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : ok
Bit Flip : testing 262
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94000.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94008.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94010.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94018.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94020.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94028.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94030.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94038.
Walking Ones : ok
Walking Zeroes : ok
8-bit Writes : ok
16-bit Writes : ok
両方のRAMスロットで同様のエラーが発生しました:
Loop 1:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : testing 4
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80000.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80008.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80010.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80018.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80020.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80028.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80030.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80038.
Bit Flip : setting 141
エラーstressapptest
:
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e000(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e008(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e010(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e018(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e020(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e028(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e030(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e038(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
どういうわけか、Ubuntuの構成と私のラップトップのハードウェアを組み合わせることが、これらのエラーのせいだと思います。ほぼ毎回8個入り。
以下の大まかな関連性の低い情報
btrfsエラーについて。17.04を使用していました。私はbtrfsのircで質問しました。ハードウェアエラーか、なんとかしてメモリ管理エラーの可能性があると言われました。私が今経験しているように、btrfsのメタデータページの一部がゼロでいっぱいになりました。memtesterをほんの数パス実行し、ext4に切り替えて、nvidiaバイナリドライバーのせいにしました。
私が使用するコマンドとそのパラメーター:
# stressapptest -M 10000 -s 1800
10000は私がテストできる利用可能なメモリです。経て、私はそれを得るfree -m
-s`は秒です。
# memtester 4096
ラップトップのCPUには2つのコアがあるため、通常は2つのインスタンスを起動します。4096は、現在使用可能なメモリの半分です。free -m
memtest86+
は、UbuntuインストールLiveCDから試してください。