Verwendung von Thermografie in Rechenzentren

Daten sind für den Betrieb vieler Firmen von großer Bedeutung und müssen daher erhalten und geschützt werden sowie jederzeit zugänglich sein. Regelmäßige Inspektionen von Rechenzentren sind äußerst wichtig, damit Zuverlässigkeit, Fortbestand und Nachhaltigkeit der Systeme gewährleistet sind, die sie beherbergen. Tatsache ist, dass solche Inspektionen nicht selten von benutzergegründeten Organisationen, wie z. B. das Uptime Institute, und/oder von Versicherungsträgern vorgeschrieben sind, da diese nicht für Schäden aufgrund von Datenverlust oder ausgefallenen Geräten aufkommen wollen.

Ein wichtiges Instrument bei der Inspektion von Rechenzentren ist die Wärmebild- bzw. Infrarotkamera. Es folgt eine Beschreibung der einzelnen Schritte bei der Verwendung einer Wärmebildkamera bei der Inspektion von Rechenzentren, angefangen bei der elektrischen Quelle – ein Transformator oder ein Umspannwerk – bis hin zu Serverschränken und das, was dazwischen liegt, inklusive der wichtigen Systeme für Heizung, Belüftung und Klimaanlage (HLK).

Warum Thermografie?

Eine Wärmebildkamera gibt zweidimensionale Bilder der Oberflächentemperatur von Objekten wieder bzw. speichert diese. Durch die Verwendung einer Wärmebildkamera können Temperatur-Anomalien elektrischer oder mechanischer Komponenten einfach festgestellt werden – Gegenstände also, die im Vergleich zu anderen Genständen in derselben Umgebung wärmer oder kälter sind. Überhitzte Komponenten deuten in der Regel auf ein mögliches Problem hin, das behoben werden sollte, bevor ein Ausfall stattfindet. In Rechenzentren, wo die Kühlung zum Schutz der Server vor Überhitzung dient, können vergleichsweise kühle Oberflächen auch auf ein Problem hindeuten, womöglich eine unregelmäßige Funktion des HLK-Systems, das korrigiert werden muss.

Zusätzlich zu Vergleichsmessungen bei der Oberflächentemperatur von ähnlichen Geräten können Wärmebildkameras auch die tatsächliche Oberflächentemperatur aufzeichnen. Hierdurch werden Situationen erkannt, wie z. B. ein heißlaufender Transformator, und es kann eine Reparatur oder ein Austausch vor einem Ausfall vorgenommen werden.

Wenn Wärmebilder auf potentielle Probleme hindeuten, dann zeichnen Sie diese auf der Wärmebildkamera auf und laden Sie die Bilder auf einen Computer hoch, auf dem eine Report- und Analysesoftware eingerichtet ist. Durch regelmäßige Geräteüberwachung und Temperatur-Verlaufsdatenerfassung für die Langzeitanalyse können Sie ungewöhnliche Werte und Trendabweichungen leichter erkennen. Zur Validität einer Vergleichsanalyse müssen Sie einer vorgegebenen Messstrecke folgen und die gleichen Objekte oder Bereiche jedes Mal von den gleichen Ausgangspunkten aus prüfen. Zusammen mit Reparaturnachweisen stellt die Temperatur-Trenddarstellung eine dokumentierte Datenaufzeichnung für Versicherungsträger, Management und all diejenigen dar, die eine Bestätigung für die ordnungsgemäße Funktion benötigen.

Was muss untersucht werden?

In einem Rechenzentrum kann man die Komponenten mit Dominosteinen vergleichen. Versagt eine Komponente, sind auch alle nachgeschalteten Komponenten betroffen. Deshalb ist es sinnvoll, am Anfang zu beginnen, bei dem, was der National Electric Code (US-Sicherheitsstandard) als „Quelle“ bezeichnet, in der Regel ein Transformator, vielleicht auch ein Umspannwerk. Bei einer aussagekräftigen Überprüfung muss das System sich in Betrieb befinden und so viel elektrische Last wie möglich beanspruchen. Wenn mehr Strom durch die Leitungen fließt, wird mehr Wärmeenergie produziert und dies ist, was eine Infrarotkamera „sieht“.

  • Transformatoren gehören in der Regel dem jeweiligen Versorgungsunternehmen, in Einzelfällen sind sie jedoch Eigentum des Besitzers des Rechenzentrums. Prüfen Sie bei Transformatoren die Sekundärwicklungen und Spulen. Untersuchen Sie die Endkontakte und Kabelschuhe (verschraubte Anschlüsse) im Innern des Gehäuses. Suchen Sie nach Temperatur-Anomalien, also Temperaturunterschieden – ∆Ts – von gleichen Komponenten. Suchen Sie außerdem nach physikalischen Schäden und Ablagerungen, die den Betrieb des Transformators stören könnten, und prüfen Sie auf ungleichmäßigen Lastverlauf. Letzteres wird durch ein ∆T zwischen den Stromkreis-Phasen gekennzeichnet.
  • Viele Rechenzentren verfügen über eine alternative Stromquelle (Redundanz). Bei der zweiten Quelle könnte es sich um einen zweiten Transformator des Versorgungsunternehmens in einem anderen Netz handeln oder um einen Notstromgenerator. Auch alternative Stromquellen müssen geprüft und untersucht werden und auch diese müssen in Betrieb und unter Last sein.
  • Notstromgeneratoren müssen im Betriebszustand geprüft werden und alle angeschlossenen Geräte müssen auch in Betrieb sein. Auch hier müssen die Kabelschuhe und Endkontakte geprüft und nach Schäden und Ablagerungen gesucht werden. Zur Fehlersuche in Kühl- oder Abgassystemen müssen die tatsächlichen Temperaturen aufgezeichnet werden, anstatt die ∆Ts zu beobachten.
  • Wenn ein Transferschalter ordnungsgemäß funktioniert, erfasst er die Stromquelle (Stromnetz oder Standby) und schaltet diese Quelle ein. Vergessen Sie diesen Schalter bei Ihrer Prüfung nicht, denn, wenn der Schalter ausfällt, ist es unwichtig, wie gut die nachgeschalteten Instandhaltungsverfahren sind. Prüfen Sie bei stromführendem Schalter auf Wärmeentwicklung, die auf lockere Anschlüsse hindeutet (z. B. ungenügendes Drehmoment oder Kompression an Kabelschuhen oder Endkontakten).
  • Bei der Hauptschalttafel handelt es sich um ein Gehäuse mit vielen Schaltern. Im Schaltschrank sind verschiedene Komponenten untergebracht, wie beispielsweise Sammelschienen, verschraubte Verbindungen und Sicherungsklemmen. Prüfen Sie auf Temperatur-Anomalien bei Anschlüssen (inklusive Bus-Anschlüsse), Endkontakte sowie Sicherungen und Sicherungsklemmen. Prüfen Sie außerdem auf Ungleichmäßigkeiten, Schäden und Ablagerungen.
  • Eine USV (unterbrechungsfreie Stromversorgung) ist der Schalttafel in der Regel direkt nachgeschaltet. Bei der Inspektion einer USV müssen die Eingangsanschlüsse, Klemmen und der Wechselrichter-Bereich geprüft werden, wo sich kleine Sicherungen und Kondensatoren befinden. Verwenden Sie die Wärmebildkamera, um den Akku unter Last zu prüfen. Untersuchen Sie die Batteriepole, Verkleidungen und Speiseleitungen. Eine beschädigte Zelle erhitzt sich sehr schnell unter Last. Prüfen Sie nach der Lastprüfung sofort die Akkus bei Nulllast. Beschädigte Zellen kühlen sich schnell ab, wenn die Last entfernt ist. Prüfen Sie schließlich ggf. den integrierten Transformator.
  • Unter Energieverteilungseinheiten (PDUs) versteht man Komponenten, die einer USV nachgeschaltet sind und sich in der Regel in der Nähe der Server befinden, die sie mit Strom versorgen. Normalerweise verfügt ein PDU über ein Leistungsschalterfeld und manchmal auch über einen Transformator. Untersuchen Sie bei der Prüfung von PDUs die Kabelschuhe und Endkontakte, auch die Leistungsschalteranschlüsse. Führen Sie eine Sichtprüfung auf Schäden und Ablagerungen durch und wenn es sich bei einer PDU um ein Modell handelt, das kein Durchgangsspannungsmodell ist, prüfen Sie den integrierten Transformator.
  • Serverschränke werden immer kompakter und schaffen damit mehr Raum für neue Server in bestehenden Rechenzentren, aber damit steigt auch der Bedarf an die Stromversorgung und Kühlungskapazitäten. Tatsächlich berichten erfahrene Thermografie-Experten, dass sie aufgrund der Wärme, die von den heutigen Blade-Servern generiert wird, nicht mehr viel Zeit auf die Temperaturmessung von Serverschränken verwenden. Die hohen Temperaturen erschweren die vergleichende Temperaturmessung. Eine Wärmebildkamera eignet sich dennoch zur Prüfung von in die Schränke eingebauten Steckerleisten und Stromversorgungen sowie von Kabelanschlüssen, Steckern usw. Achten Sie auf Überhitzung aufgrund von lockeren Anschlüssen oder verbogenen Steckern. Eine Prüfung mit einer Wärmebildkamera kann außerdem gebrochene Kabel und Leiter in Kabeln feststellen. Achten Sie zur Erkennung der zuletzt genannten Störung auf die sogenannte „Barber-Pole-Illusion“, bei der die Temperaturunterschiede bei den verdrillten Drähten sichtbar werden.

    Sie sollten auch auf die Bereiche achten, bei denen Luft durch eingebaute Gebläse in die Serverschränke angesaugt und wieder ausgeblasen wird. Bei der Überprüfung einer effektiven Luftkühlung eignen sich sowohl eine Wärmebildkamera als auch ein Temperaturmessmodul/Luftströmungsmessgerät. Allgemein gesagt können Sie 1) Kühlmuster beim Ein- und Austritt sowie um die Serverschränke herum aufzeichnen und 2) bestätigen, ob die Kühlung adäquat ist oder nicht. Prüfungen wie diese dienen als Entscheidungshilfe, ob perforierte Platten zur Verbesserung der Luftzirkulation oder Blindplatten eingebaut werden, damit verhindert wird, dass heiße Luft in nicht belegte Bereiche der Schränke eindringt. Strategien wie diese können den Verantwortlichen in Rechenzentren helfen, ihre Server kühl genug zu halten, damit die Garantiebestimmungen für die Server eingehalten werden.
  • HLK-Systeme sind ein integraler Bestandteil von Rechenzentren aufgrund der von den Servern, vor allem der Blade-Server der neuesten Generation, erzeugten Temperaturen. Die Klimatisierung eines Rechenzentrums wird in der Regel durch ein Split-System oder ein wassergekühltes System erreicht, wobei die Optimaltemperatur zwischen 18 °C und 22 °C liegt. Viele Server sind so konzipiert, dass sie automatisch und autonom das System herunterfahren, wenn ihre Temperatur 23 °C bzw. 24 °C überschreitet.

    Prüfen Sie die Sicherungen Ihrer Klimaanlage, die Endkontakte, Kabelschuhe und gecrimpten oder verschraubten Anschlüsse. Auch die mechanischen Komponenten müssen auf Überhitzung geprüft werden, die auf Versatz (in Antriebswellen), Unsymmetrien (in Gebläsen) oder Verschleiß (bei Motoren und Lagern) hindeuten. Außerdem zeigt ein Infrarotbild austretendes Kühlmittel an, wenn es gegen den Schrank geblasen wird.

    Split-Systeme und wassergekühlte Systeme mit Kühltürmen haben sowohl außen als auch innen liegende Komponenten. Beispiel: Die Verdampferschlange eines Split-Systems befindet sich in der Regel im Gebäudeinnern im Gegensatz zum außen liegenden Verflüssigungssatz. Überprüfen Sie die Verdampferschlange auf Eisbildung, die Klimaanlage muss jedoch im Innen- und Außenbereich geprüft werden. Sicherungen und Endkontakte (Kabelschuhe) sind in der Regel außen angebracht und wenn Kühltürme im System integriert sind, müssen Motoren geprüft werden. Verwenden Sie die Wärmebildkamera, um den Durchfluss und auf Leckagen in den Türmen zu prüfen.

Erste Schritte

Hinsichtlich der Schulung empfiehlt Fluke eine Trainingsperiode von zwei bis drei Tagen für Benutzer von hochwertigen Kameras. Der schwierigste Teil besteht nicht in der Handhabung der Hardware. Der wichtigste Aspekt der Thermografie besteht in der Fähigkeit, gute Diagnosen zu stellen. Der Schlüssel zum Erfolg besteht in der Sammlung von stabilen, zuverlässigen und wiederholbaren Daten, wobei diese danach von einer Person ausgewertet werden, die im Umgang mit elektrischen Anlagen versiert ist. Diese Strategie führt zu einer guten Einschätzung darüber, was, wenn überhaupt, für ein Fehler vorliegt und wie dieser korrigiert werden kann. Eine vernünftige Einschätzung der Prüfungen mit Wärmekameras in Rechenzentren setzt gutes Training, technisches Wissen und Arbeitspraxis voraus.

¹Der Großteil der Informationen in diesem Anwendungsbericht basiert auf einem Interview mit Paul Twite, einem Thermografie-Experten bei 24-7 Power aus Edina, Minnesota. Tel.: 952-944-8900; Fax: 952-746-1958; Gebührenfrei: 1-866-269-1767.

²Für nähere Informationen zum Thema „Emissionsgrad“ empfehlen wir: „Emissivity: Understanding the difference between apparent and actual infrared temperatures“, von L. Terry Clausing, P.E., ASNT Certified NDT Level III T/IR. Der Anwendungsbericht kann über www.fluke.com unter „Digital Library Fullfilment Center“ heruntergeladen werden.

Kostenlose Vorführung anfordern

Zugehörige Informationen

Das könnte Sie auch interessieren