데이터는 대부분의 조직 운영에 매우 중요하므로 항상 보존, 보호 및 액세스할 수 있어야 합니다. 데이터 센터의 주기적인 검사는 조직에서 수용하는 시스템의 신뢰성, 연속성 및 지속 가능성을 보장하는 데 있어 매우 중요합니다. 사실, 이러한 검사는 장비 고장으로 인한 데이터 손실에 대한 손해 배상을 원하지 않는 Uptime Institute와 같은 사용자 기반 조직 및/또는 보험 회사에 의해 의무적으로 수행되는 경우가 많습니다.
데이터 센터 검사를 수행하기 위한 중요한 도구 중 하나는 적외선(IR) 카메라라고도 하는 열화상 장비입니다. 다음 단계별 설명은 열화상 장비를 사용하여 전력 공급원(변압기 또는 변전소)에서부터 서버 랙까지, 그리고 중요한 냉난방 및 환기(HVAC) 시스템을 포함하는 그 사이의 모든 것에 이르기까지 데이터 센터 시스템을 검사하는 방법입니다.
열화상의 이점
열화상 장비는 물체의 표면 온도에 대한 2차원 이미지를 표시하고 저장할 수 있습니다. 열화상 장비를 사용하면 동일한 환경에서 유사한 물체보다 뜨겁거나 차가운 전기 또는 기계 구성요소의 온도 이상 현상을 쉽게 감지할 수 있습니다. 일반적으로 과열된 부품이나 구성 요소는 고장이 발생하기 전에 유지보수가 필요한 잠재적 문제를 나타냅니다. 서버 과열을 방지하기 위해 냉각이 중요한 데이터 센터에서는 평소와 달리 차가운 표면도 문제를 나타낼 수도 있으며, 이는 수정이 필요한 HVAC 시스템의 불균형 때문일 수 있습니다.
열화상 카메라는 장비 표면의 비교 온도를 쉽게 감지할 수 있을 뿐만 아니라 실제 표면 온도도 기록할 수 있습니다. 이를 통해 변압기 또는 모터 과열과 같은 상황을 감지하여 고장 전에 수리 또는 교체할 수 있습니다.
열화상 이미지가 잠재적인 문제를 나타낸다면, 열화상 장비에서 이를 캡처하여 보고 및 분석을 위한 소프트웨어를 실행하는 컴퓨터에 업로드합니다. 장비를 정기적으로 모니터링하고 장기간 비교를 위해 컴퓨터에 열의 "추적 기록"을 관리하면, 비정상적인 판독값과 트랜드 변화를 더 잘 감지할 수 있습니다. 나란히 비교하는 데 필요한 일관성을 보장하려면 미리 설정된 샘플링 경로를 따르고, 동일한 지점에서 매번 동일한 물체 또는 영역을 스캔하는 것이 유리합니다. 수리 기록과 함께 열 트랜드 정보는 보험 회사, 경영진 및 신뢰할 수 있는 작동에 대한 확인이 필요한 모든 사람을 위한 문서화된 데이터 추적 정보를 제공합니다.
스캔 대상
데이터 센터에서 구성요소는 일련의 도미노와 같습니다. 하나가 실패하면 다운스트림까지의 모든 것이 실패하게 됩니다. 미국 전기 규범에서 "전원"이라고 불리는 것(일반적으로 변압기, 아마도 변전소)에서 "처음부터 시작"하는 것이 타당합니다. 의미 있는 검사 세션을 위해서는 시스템이 작동 중이어야 하며 가능한 한 큰 전기 부하를 끌어당겨야 합니다. 와이어를 통해 흐르는 더 많은 전류는 더 많은 열 에너지를 생성하며, 이것이 바로 적외선 카메라가 "보는 것"입니다.
- 변압기는 일반적으로 전력 회사가 소유하지만, 때로는 데이터센터 소유자의 자산입니다. 변압기에서 이차 권선과 코일을 확인합니다. "판넬 내부"의 터미널 종단부와 러그(볼트 연결부)를 살펴보십시오. 열 이상 현상, 즉 유사한 구성요소의 온도 차이(ΔT)를 찾으십시오. 또한 변압기의 작동을 방해할 수 있는 물리적 손상과 이물질이 있는지 찾고, 부하 불균형을 스캔합니다. 후자는 회로 위상 사이의 ΔT로 표시됩니다.
- 많은 데이터 센터에는 비상시를 위한 대체 전원이 있습니다. 이 두 번째 전원은 다른 그리드의 다른 유틸리티 변압기 또는 예비 발전기일 수 있습니다. 대체 전원도 사용 중이거나 부하가 걸려 있는 동안 스캔하고 검사해야 합니다.
- 예비 발전기는 전원이 켜져 있는 동안 다운스트림의 모든 것이 실행(작동)되는 상태에서 검사해야 합니다. 여기에서도 러그와 종단을 점검하고 손상 및 이물질을 찾으십시오. 냉각 또는 배기 시스템의 문제를 감지하려면 ΔT를 관찰하는 대신 실제 온도를 기록해야 합니다.
- 전송 스위치가 올바르게 작동하면 전원이 어디에서 오는지(주 전원 또는 예비 전원) 감지하고 해당 전원으로 전환합니다. 검사하는 동안 해당 스위치를 간과하지 마십시오. 고장이 나면 다운스트림에 얼마나 좋은 유지보수 절차가 있는지는 중요하지 않습니다. 전송 스위치를 통해 전류가 흐르는 상태에서 스캔하고 느슨한 연결 상태(예: 러그 또는 종단의 불충분한 토크 또는 압축)를 나타낼 수 있는 가열 부위를 찾으십시오.
- 주 배전반은 많은 스위치가 있는 큰 외함입니다. 캐비닛 안에는 버스바, 볼트 연결부 및 퓨즈 클립을 포함한 다양한 구성요소가 있습니다. 연결부(버스 연결 포함), 종단, 퓨즈 및 퓨즈 클립에서 열 이상 현상을 찾으십시오. 또한 불균형, 손상 및 이물질을 찾으십시오.
- UPS(무정전 전원 공급장치)는 일반적으로 배전반 바로 다음에 있습니다. UPS를 검사할 때는 작은 퓨즈와 커패시터가 있는 입력 연결부, 터미널 및 인버터 섹션을 스캔하십시오. 부하가 걸린 상태에서 열화상 장비를 사용하여 배터리 섹션을 점검하십시오. 터미널 포스트, 케이싱 및 피더를 살펴보십시오. 불량 셀은 부하 상태에서 매우 빠르게 가열됩니다. 부하 스캔 후, 부하가 걸리지 않은 배터리를 즉시 스캔하십시오. 불량 셀은 부하가 제거되면 매우 빠르게 냉각됩니다. 마지막으로 온보드 변압기(있는 경우)를 점검합니다.
- 전력 분배 장치(PDU)는 UPS의 다운스트림에 있으며 일반적으로 전력을 분배하는 서버 근처에 있습니다. 일반적으로 PDU에는 회로 차단기 패널이 있으며 때로는 변압기가 있습니다. PDU를 스캔할 때 회로 차단기 터미널을 포함하여 러그와 터미널을 살펴보십시오. 손상과 이물질이 있는지 육안으로 점검하고 PDU가 직류 전압 모델이 아닌 경우 온보드 변압기를 스캔합니다.
- 서버 랙은 점점 더 소형화되어 더 많은 서버를 위한 공간을 기존 데이터 센터에 제공하지만, 센터의 전력 및 냉각 기능에 대한 수요도 증가시키고 있습니다. 사실, 여러 경험 많은 열화상 기술자들은 오늘날에는 블레이드 서버에서 발생하는 열로 인해 서버 랙을 스캔하는 데 더 이상 많은 시간이 소비되지는 않는다고 보고합니다. 높은 열은 비교 온도를 어렵게 만듭니다. 그러나 열화상 장비는 랙에 내장된 멀티탭 및 전원 공급장치는 물론 배선 연결부, 플러그 및 플러그 스트립을 모니터링하는 데 유용합니다. 느슨한 연결부와 느슨하거나 구부러진 플러그로 인한 과열을 찾으십시오. 열 스캔은 또한 끊어진 코드와 와이어의 끊어진 도체를 감지할 수 있습니다. 후자의 상태를 감지하려면 꼬여있는 가닥의 열적 차이를 관찰할 수 있는 이른바 "바버 폴 효과(the barber pole effect)"를 찾으십시오.
또한 서버 랙에서 내장 팬의 작동으로 공기가 유입되고 열이 배출되는 영역도 모니터링해야 합니다. 열화상 장비와 온도계/공기유량계는 모두 공기 냉각 효과를 모니터링하는 데 유용합니다. 일반적으로 1) 서버 랙 안팎으로 및 주변으로 냉각 패턴을 매핑하고 2) 냉각이 적절한지 여부를 확인할 수 있습니다. 이러한 모니터링은 채워지지 않은 랙의 빈 슬롯에 뜨거운 공기가 들어가지 않도록 순환 또는 블랭킹 플레이트를 개선하기 위해 구멍 뚫린 패널을 설치할 위치를 식별합니다. 이러한 전략은 많은 데이터 센터 사용자가 서버 보증을 유지하기에 충분할 정도로 서버를 냉각 상태로 유지하는 데 도움이 됩니다.
- HVAC 시스템은 서버, 특히 최신 세대의 블레이드 서버에서 발생하는 발열 때문에 데이터 센터에서 필수적입니다. 데이터 센터의 AC는 일반적으로 분할(split) 시스템 또는 냉각수 시스템에 의해 제공되며, 이상적으로는 18.3~22.2°C(65~72°F) 사이의 센터 온도를 유지합니다. 많은 서버는 온도가 23.9°C(75°F) 또는 24.4°C(76°F)를 초과하면 자동적 그리고 자율적으로 종료되도록 설계되었습니다.
AC 시스템의 퓨즈, 종단, 러그 및 압착 연결부 또는 볼트 연결부를 스캔하십시오. 또한 기계적 구성요소가 과열되어 오정렬(드라이브), 불균형(팬) 또는 성능 저하(모터 및 베어링) 신호가 나타나는지 점검하십시오. 적외선 이미지는 또한 캐비닛으로의 냉매 누출도 보여줍니다.
냉각탑이 있는 분할 시스템 및 냉각수 시스템에는 내부 구성요소뿐만 아니라 외부 구성요소도 있습니다. 예를 들어, 분할 시스템의 증발기 코일은 일반적으로 건물 내부에 있고 응축 장치는 외부에 있습니다. 증발기 코일에 결빙이 있는지 확인하지만, 외부에 나가지 않고 내부 AC 시스템을 확인하는 것은 의미가 없습니다. 일반적으로 외부에 퓨즈와 종단(러그)이 있으며, 냉각탑이 있으면 모터가 있습니다. 열화상 장비를 사용하여 유동(flow)을 확인하고 냉각탑에서 누출을 찾으십시오.
시작하기
교육과 관련하여, Fluke는 고급 카메라 사용자에게 2~3일간의 교육을 권장합니다. 하드웨어 작동은 어려운 부분이 아닙니다. 열화상의 어려운 측면은 훌륭한 진단을 내리는 것입니다. 성공의 열쇠는 훌륭하고 신뢰할 수 있고 반복 가능한 데이터를 수집한 다음, 전기 시스템에 대해 잘 알고 있는 사람의 눈을 통해 해당 데이터를 검토하는 것입니다. 이 전략을 통해 잘못된 것이 있다면 무엇을 어떻게 교정해야 하는지에 대한 좋은 판단을 내릴 수 있습니다. 데이터 센터의 열 스캔에 대한 올바른 판단에는 우수한 교육, 기술 지식 및 실제 현장 경험이 필요합니다.
¹본 응용 지침서에 있는 대부분의 정보는 열화상 기술자인 Paul Twite와의 인터뷰를 기반으로 합니다(주소: 24-7 Power, Edina, Minnesota. 전화: 952-944-8900. 팩스: 952-746-1958. 무료 전화: 1-866-269-1767).
²방사율에 대한 자세한 내용은 "Emissivity: Understanding the difference between apparent and actual infrared temperatures"를 참조하십시오(저자: L. Terry Clausing, P.E., ASNT Certified NDT Level III T/IR). 응용 지침서는 www.fluke.com에서 액세스할 수 있는 Fluke의 Digital Library Fulfillment Center에서 다운로드할 수 있습니다.