Bei einem Kunden wurde ein neuer Supermicro-Server aufgestelt, nach gut einem Tag kam es allerdings vermehrt zu Fehlern bei der Überwachung der Hardware. Erst kam eine Alarmmeldung wegen einer zu niedirigen Spannung, dann ein paar Minuten später ein weiterer Alarm das alle Lüfter (gleichzeitig) weg wären, usw.

Witzigerweise war direkt im Web-Interface des BMC alles in Ordnung, alle Werte waren wie erwartet in Ordnung, im Log zudem keinerlei Fehler.

Scheinbar brachte die Abfragerei sowohl durch den lokal installierten SuperDoctor als auch dem Server-Eye Sensor den IPMI-Treiber durcheinander. Jedenfalls konnten diese fehlerhaften Werte bzw. Fehlalarme dadurch gelöst werden, das der Server-Eye Sensor nun direkt beim BMC (statt localhost) die Werte abfragt und der IPMI-Teil des BMC einmal neugestartet wurde.