[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:51468] Re: "Uhhuh. NMI received for unknown reason a0 on CPU 0." on Thinkpad T60



三浦です。

2008/12/15 Hideki Yamane <henrich@debian.or.jp>:
>
> 先日 Thinkpad T60 を購入しました。sid で利用しています。
>
> kernel: [92347.859466] Uhhuh. NMI received for unknown reason a0 on CPU 0.
> kernel: [92347.859466] You have some hardware problem, likely on the PCI bus.
> kernel: [92347.859466] Dazed and confused, but trying to continue
>
> というメッセージが時折コンソールに出てきてしまいます。

T60ユーザではないですが、 MessageMediaでは、
http://ossmpedia.org/messages/linux/2.6.9-34.EL/58910.ja
こんな風に説明されていますね。

----
以下のとおり、一連のメッセージの一つとして表示される。

Uhhuh. NMI received for unknown reason 20 on CPU 0.
Dazed and confused, but trying to continue
Do you have a strange power saving mode enabled?


実際の報告事例としては相性も含めてメモリカードの不具合が一番多い。メモリのパリティエラーは0x80として定義されているがそれ以外のエラーである。他はマザーボードの不具合、電源の不具合による不安定な電力供給が起因などがある。
BIOSで行うメモリテストなどでエラーが検知できることがある。また、デュアルチャネルのメモリカードをサポートしたマザーボードの場合で性能の異なるメモリカード(例:DDR
RAM 400MHzと533MHzを一枚ずつ挿入して使用。)をデュアルチャネル構成で挿入した場合に発生したという報告事例がある。また、このメッセージを出した後、OSはシステムを継続する。しかしながらハードウェアの不具合であるため、システム停止やハング(ストール)となる場合も報告されている。


----

Lenovoのwindowsのerrataで、起動時にNMIでブルースクリーンが発生することがある、というのも
目にしました。
http://www-06.ibm.com/jp/domino04/pc/support/Sylphd03.nsf/jtechinfo/MIGr-67654

Radeon のグラフィックカードとcompizの組み合わせで発生しているという報告も目にしています。
http://www.redhat.com/archives/rhl-devel-list/2008-March/msg01774.html

結局、原因はわかりませんが、Alan Coxがいうには、
どっちにせよNMIハードの問題だ、x86で
発生させるのはハードくらいしかないから、、ということらしい。
http://www.redhat.com/archives/rhl-devel-list/2008-March/msg00793.html

memtest86を走らせてみては?ということらしい。

-- 
HIroshi Miura
NTT DATA Corp. and IPA OSS center
(株)NTTデータ /(独)情報処理推進機構
三浦広志