BSOD BCCode 101 in Windows 2008 R2 con ruolo Hyper-V

Posto la mia esperienza su un BSOD che si è verificato tempo fa su un Hyper-V, dal momento che è circa un mese che non si verifica più e quindi direi che il problema si è risolto.

I dettagli dell’errore che causava il riavvio del server Hyper-V con conseguente arresto delle VM erano i seguenti:

Errore
Firma problema:
  Nome evento problema: BlueScreen
  Versione SO: 6.1.7600.2.0.0.272.7
  ID impostazioni locali: 1040

Ulteriori informazioni sul problema:
  BCCode: 101
  BCP1: 000000000000000D
  BCP2: 0000000000000000
  BCP3: FFFFF88001F46180
  BCP4: 0000000000000004
  OS Version: 6_1_7600
  Service Pack: 0_0
  Product: 272_3

Il problema si è presentato su un server HP ML350 G6 dopo l’aggiornamento del BIOS alla versione 2010.03.01 (si veda il post Hyper-V evento Microsoft-Windows-Kernel-Processor-Power).

Sebbene nelle Release Notes non fossero riportate Firmware Dependencies per risolvere il problema è stato necessario aggiornare:

  • Il firmware del controller HP Smart Array P410i alla versione 6.20.0.64 che risolve i seguenti problemi:
    • Added support for HP Smart Array P812 controller.
    • Added support for handling logical drive failure more gracefully. This improves the system responsiveness after logical drive failure.
    • Increased per I/O max transfer size from 512K to 1M.
  • Il firmware del SAS Storage Disk alla versione HPDD 6 Apr 2010 che risolve i seguenti problemi:
    • Implemented command timeout– Drive will report an aborted command if the active command has not been executed after 5 seconds.

Si noti che il BSOD può essere anche dovuto a processori Intel (Intel Xeon processor 5500 series e Intel Core-i processor series) utilizzati su computer con il ruolo Hyper-V installato come indicato nel seguente Stop error message on an Intel Xeon 5500 series processor-based computer that is running Windows Server 2008 R2 and that has the Hyper-V role installed: “0x00000101 – CLOCK_WATCHDOG_TIMEOUT”:

This problem occurs because spurious interrupts are generated on the computer that uses Intel code-named Nehalem processors. These interrupts are caused by a known erratum that is described in the following Intel documents. To view these Intel documents, click the following links:

Sempre nella KB 97553 è disponile una hotfix o in alternativa un workaround che però blocca il risparmio energetico del processore.