状況
手元に不安定なWindows 10 PCがある。週に何度かブルースクリーンを吐く。
で、イベントビューアでCPUにかかわるエラーWHEA-Logger
が多発してることがわかったので、BIOS設定からCPU Load-Line Calibration
を調整したらブルースクリーン出なくなったっぽい。
で、イベントビューアのWHEAってなんじゃそりゃと気になったので調べた。
WHEA is 何
Windows Hardware Error Architecture
EFIファームウェアは、ハードウェアで検出したエラーをOSにCPER(Common Platform Error Record)というしくみで報告する。 メモリのECCエラーとか、PCI-Expressのエラーとか、CPUのキャッシュの不具合とか、そういうのが対象っぽいです。
Windowsが受け取ったCEPRは、イベントビューアに"WHEA-Logger
"または"Kernel-WHEA
"として記録される。発生状況によって両方に記録されたり片方にしか記録されなかったりする。違いが謎。
(Windowsで理解できる形式のCEPRはWHEA-Logger、理解できない(未知の)CEPRはKernel-WHEAで記録している?)
で、イベントビューアにはCPERの生データのバイナリが記録されている。コイツを解析すれば、ハードウェア不具合のより詳しい状況がわかるはずである。
イベントログIDの例
- WHEA-Logger, EventID:19 … CPU内部のエラーっぽい
- Cache Hierarchy Error
- Internal parity error