BSOD BCCode 101 in Windows 2008 R2 con ruolo Hyper-V
Posto la mia esperienza su un BSOD che si è verificato tempo fa su un Hyper-V, dal momento che è circa un mese che non si verifica più e quindi direi che il problema si è risolto.
I dettagli dell’errore che causava il riavvio del server Hyper-V con conseguente arresto delle VM erano i seguenti:
Errore
Firma problema:
Nome evento problema: BlueScreen
Versione SO: 6.1.7600.2.0.0.272.7
ID impostazioni locali: 1040
Ulteriori informazioni sul problema:
BCCode: 101
BCP1: 000000000000000D
BCP2: 0000000000000000
BCP3: FFFFF88001F46180
BCP4: 0000000000000004
OS Version: 6_1_7600
Service Pack: 0_0
Product: 272_3
Il problema si è presentato su un server HP ML350 G6 dopo l’aggiornamento del BIOS alla versione 2010.03.01 (si veda il post Hyper-V evento Microsoft-Windows-Kernel-Processor-Power).
Sebbene nelle Release Notes non fossero riportate Firmware Dependencies per risolvere il problema è stato necessario aggiornare:
- Il firmware del controller HP Smart Array P410i alla versione 6.20.0.64 che risolve i seguenti problemi:
- Added support for HP Smart Array P812 controller.
- Added support for handling logical drive failure more gracefully. This improves the system responsiveness after logical drive failure.
- Increased per I/O max transfer size from 512K to 1M.
- Il firmware del SAS Storage Disk alla versione HPDD 6 Apr 2010 che risolve i seguenti problemi:
- Implemented command timeout– Drive will report an aborted command if the active command has not been executed after 5 seconds.
Si noti che il BSOD può essere anche dovuto a processori Intel (Intel Xeon processor 5500 series e Intel Core-i processor series) utilizzati su computer con il ruolo Hyper-V installato come indicato nel seguente Stop error message on an Intel Xeon 5500 series processor-based computer that is running Windows Server 2008 R2 and that has the Hyper-V role installed: “0x00000101 – CLOCK_WATCHDOG_TIMEOUT”:
This problem occurs because spurious interrupts are generated on the computer that uses Intel code-named Nehalem processors. These interrupts are caused by a known erratum that is described in the following Intel documents. To view these Intel documents, click the following links:
Sempre nella KB 97553 è disponile una hotfix o in alternativa un workaround che però blocca il risparmio energetico del processore.