데이터센터 냉각 전쟁, 액침의 부상

Share

데이터센터 냉각 전쟁: 공랭식의 몰락과 액체 냉각의 부상, AI 시대 생존 전략

인공지능(AI) 기술의 급격한 발전은 데이터센터의 패러다임을 근본적으로 바꾸고 있습니다. 과거에는 상상하기 어려웠던 수준의 컴퓨팅 성능이 요구되면서, 데이터센터의 전력 소비량과 발열량이 폭발적으로 증가하고 있습니다. 이러한 변화는 기존의 공랭식 냉각 방식으로는 감당할 수 없는 수준에 이르렀으며, 데이터센터 업계는 액체 냉각이라는 새로운 냉각 기술로 눈을 돌리고 있습니다. 이 글에서는 AI 시대 데이터센터 냉각 기술의 변화와 미래에 대해 심층적으로 분석하고, 기업들이 생존을 위해 어떤 전략을 수립해야 하는지 제시합니다.

랙당 전력 밀도 폭증: 냉각 방식의 전환 불가피

지난 2년간 데이터센터의 랙당 평균 전력 밀도는 8kW에서 17kW로 두 배 이상 증가했습니다. 전문가들은 2027년에는 30kW에 이를 것으로 예측합니다. 특히 AI 모델 학습에 사용되는 서버는 랙당 80kW를 초과할 수 있으며, 엔비디아의 최신 GB200 칩을 탑재한 서버는 최대 120kW까지 필요할 수 있습니다. 이는 기존의 공랭식 냉각 방식으로는 더 이상 감당할 수 없는 수준입니다. 업타임 인스티튜트의 조사에 따르면, 대부분의 데이터센터 운영자는 랙당 전력 밀도가 20kW를 넘으면 공랭 기술만으로는 냉각이 불가능하다고 판단하고 있습니다.

액체 냉각 도입 현황과 미래 전망

액체 냉각 기술은 데이터센터의 냉각 문제를 해결할 수 있는 가장 현실적인 대안으로 떠오르고 있습니다. 업타임 인스티튜트의 조사에 따르면, 2024년 초 기준 22%의 데이터센터 운영자가 직접 액체 냉각 기술을 사용하고 있습니다. 하지만 대부분은 전체 랙 중 10% 이하에만 수랭 방식을 적용하는 하이브리드 방식을 채택하고 있습니다. AI 워크로드 확산 속도가 워낙 빠르기 때문에 액체 냉각 도입 속도도 가파르게 증가할 것으로 예상됩니다. 델오로 그룹은 데이터센터 수랭 시장 전망치를 상향 조정하며, 전체 데이터센터 물리 인프라 시장 규모가 매년 14%씩 성장해 2029년에는 610억 달러에 이를 것으로 전망했습니다.

다양한 액체 냉각 기술: 선택은 기업의 몫

액체 냉각 기술은 다양한 방식으로 구현될 수 있습니다. 랙당 20kW까지는 공랭 방식이 효율적이지만, 이를 초과하면 후면 도어 열 교환 방식이 효과적입니다. 100kW 수준에서는 칩 직접 냉각(DLC)이, 175kW를 넘으면 액침 냉각이 가장 적절한 대안으로 꼽힙니다. 신규 데이터센터 건설에서는 수랭 인프라가 기본 옵션으로 자리 잡고 있지만, 기존 데이터센터의 경우 하이브리드 방식으로 업그레이드하는 것이 현실적인 대안이 될 수 있습니다. 기업은 자체적인 환경과 요구사항을 고려하여 최적의 액체 냉각 기술을 선택해야 합니다.

공랭식 데이터센터의 하이브리드 업그레이드 전략

기존 공랭식 데이터센터를 수랭식으로 개조하는 작업은 쉽지 않지만, 신규 공간이 마련되기를 기다리는 것보다는 낫고, 환경적으로도 더 유리할 수 있습니다. 공랭식 데이터센터를 하이브리드 방식으로 업그레이드하면 전체 에너지 소비가 줄고 전기 요금도 낮아지는 효과를 얻을 수 있습니다. 또한 운영 온도도 더 낮고 일정하게 유지되어 IT 장비의 마모를 줄일 수 있습니다. 하지만 하이브리드 시스템 구축 비용과 운영 유지보수에 필요한 전문 역량이 진입 장벽으로 작용할 수 있다는 점을 고려해야 합니다.

기존 설비에 액체 냉각 접목 방안

데이터센터 운영자는 기존 설비에도 액체 냉각을 접목할 수 있는 다양한 방안을 고려할 수 있습니다. 서버 내부의 팬을 액체 루프로 바꿔 GPU 상단의 냉각판에서 랙 도어까지 연결하는 L2A(Liquid to Air) 방식은 업계에서 정착된 용어입니다. 또한 배관이나 배수 설비 없이도 GPU의 열을 공기로 배출할 수 있는 자급식 액체 냉각 솔루션도 유용한 대안이 될 수 있습니다. 이미 AI 서버를 공랭식으로 운영하고 있다면, 후면 도어 열 교환기를 추가해 서버에서 나오는 뜨거운 공기를 물로 냉각하는 방식을 택할 수도 있습니다.

칩 직접 냉각(DLC)과 2상 냉각의 미래

가장 이상적인 방식은 액체를 랙의 후면이 아닌, 서버 내부의 GPU 근처까지 직접 전달하는 DLC 방식입니다. 이 방식은 서버 내부에 액체를 순환시키는 자립형 냉각 시스템과 데이터센터 물을 랙 뒤까지 공급하는 설비형 시스템의 장점을 모두 얻을 수 있습니다. 오늘날 가장 일반적인 방식은 단상 액체를 사용하는 것이지만, 2상 냉각은 증발을 통해 열을 방출하는 매우 효과적인 방식으로, 곧 상용화될 전망입니다. 젠슨 황은 2027년 하반기 출시 예정인 루빈 울트라 NVL576이 랙당 전력 밀도 600kW를 지원할 것이라고 밝히며, 2상 냉각 기술의 중요성을 강조했습니다.

액침 냉각: 잠재력과 과제

액침 냉각은 서버 전체를 액체에 담가 냉각하는 방식으로, 고효율 냉각 방식 중 하나입니다. 캐스트롤의 조사에 따르면, 데이터센터 업계 리더 600명 중 90%가 2030년까지 액침 냉각 도입을 고려 중입니다. 하지만 누수 가능성, 구현 시간, 유지보수의 어려움 등이 단점으로 꼽힙니다. 또한 액침 냉각에 사용하는 액체의 종류 자체도 고민거리입니다. 에퀴닉스는 강력한 지속가능성 전략을 추구하고 있는데, PFAS(과불화화합물) 계열 화학물질이 액침 냉각뿐만 아니라 2상 냉각 기술에도 사용되고 있다는 점을 우려하고 있습니다.

결론: AI 시대, 냉각 기술 혁신은 선택이 아닌 필수

AI 시대 데이터센터의 냉각 문제는 더 이상 간과할 수 없는 핵심 과제입니다. 기업들은 급증하는 전력 소비량과 발열량을 감당하기 위해 액체 냉각 기술 도입을 적극적으로 검토해야 합니다. 기존 데이터센터의 하이브리드 업그레이드, 칩 직접 냉각, 액침 냉각 등 다양한 옵션을 비교 분석하고, 자체적인 환경과 요구사항에 맞는 최적의 냉각 솔루션을 선택해야 합니다. 냉각 기술 혁신은 AI 시대 데이터센터의 생존과 지속가능성을 위한 필수적인 선택입니다.

이것도 좋아하실 수 있습니다...