산업 산업

1960년대의 수냉식 메인프레임, 열 관리를 예술로 승화시킨 오버클러킹 문화, 오늘날의 AI 슈퍼컴퓨터를 가능하게 하는 정밀 냉각판에 이르기까지 성능에 대한 추구는 항상 냉각 혁신을 주도해 왔습니다.

칩 전력이 디바이스당 500W를 넘어서고 랙 밀도가 80kW를 초과함에 따라 공랭식 냉각으로는 더 이상 이를 따라잡을 수 없게 되었습니다. 냉각판을 사용한 DTC(Direct-to-Chip) 액체 냉각은 AI 가속기, CPU 및 고밀도 컴퓨팅 모듈의 새로운 표준이 되었습니다.

이 규모에서 가장 중요한 엔지니어링은 냉각판 자체에서 이루어집니다. 이 글에서는 성능 트레이드오프, 생산 확장성 및 향후 적응성을 고려하여 AI 시대의 냉각판 엔지니어링을 위한 실용적인 선택 사항을 살펴봅니다.

 

프론티어 AI 모델을 훈련하는 데 필요한 전력은 매년 두 배로 증가하고 있습니다. 출처: https://epoch.ai/data-insights/power-usage-trend

 

지금 냉각판이 중요한 이유: 열 제거를 위한 핵심 인터페이스

콜드 플레이트 는 열 현실과 컴퓨팅의 야망이 만나는 인터페이스입니다. 정밀 열 교환기 역할을 하는 이 제품은 칩의 열을 순환하는 냉각수로 추출하여 부하가 높거나 일시적인 부하가 발생하는 동안에도 안정적인 접합부 온도를 유지합니다.

균일한 열 제거는 매우 중요합니다. 흐름이 고르지 않으면 핫스팟, 스로틀링 및 장기적인 재료 피로로 이어집니다. 기하학적 구조와 유량 분포는 장치가 최고 성능을 유지하는지 또는 압력 하에서 성능이 저하되는지를 결정합니다.

효과적인 냉각판 설계는 건축가에게 설계 헤드룸을 제공하여 더 높은 전력 인클로저, 더 높은 밀도, 더 긴 하드웨어 수명을 가능하게 하고 총소유비용을 낮춥니다.

 

85°C까지는 일반적으로 지속적인 스트레스가 없는 한 GPU 성능이 최대로 유지됩니다. 90-95°C 사이에서는 열 스로틀링이 시작되어 클럭 속도가 감소하고 점진적인 성능 손실(≈5-20%)이 발생합니다. 95°C 이상에서는 성능 저하가 훨씬 더 뚜렷해지며 심한 경우(100°C 근처) 최대 50%까지 성능이 저하되고 하드웨어 고장 위험이 급격히 증가할 수 있습니다: 다양한 고성능 컴퓨팅 작업에서 널리 인용되는 관찰된 장애/스로틀 임계값에 따라 구조화된 정션 온도가 증가함에 따른 GPU 성능 저하를 보여주는 업계 데이터(ServerMania의 2025 GPU 온도 가이드)를 기반으로 합니다.

 

냉각판 설계의 기본 사항

냉각판 성능 최적화는 형상, 흐름 관리 및 제조 가능성 간의 균형을 맞추는 것입니다. 모든 설계 선택은 냉각판이 열을 통과하는 방식, 냉각수가 얼마나 고르게 분배되는지, 부하가 걸린 상태에서 시스템이 얼마나 안정적으로 작동하는지에 영향을 미칩니다.

냉각판의 내부 형상: 채널, 매니폴드 및 표면

내부 형상은 유체가 칩 전체에 퍼지는 방식과 열이 효과적으로 제거되는 방식을 결정합니다.

  • 채널: 직선 평행 채널은 가공이 쉽고 예측 가능한 압력 강하를 제공하지만 잘 설계된 매니폴드가 없으면 잘못된 분배가 발생할 위험이 있습니다.
  • 고급 토폴로지: 다각화된 병렬 흐름, 교차 흐름 경로 또는 국소화된 핀 핀 영역은 균일성을 향상하고 고유량 영역을 대상으로 합니다.
  • 표면 기능: 마이크로핀 또는 터뷸레이터는 경계층을 깨고 대류를 증가시키지만 미립자에 대한 민감도를 높입니다.
  • 매니폴드: 균형 잡힌 입구와 출구 설계로 정체 구역과 고르지 않은 흐름을 방지하여 일관된 열 성능을 유지합니다.

 

콜드 플레이트의 핫스팟 및 과도 현상 관리

AI 가속기, GPU, CPU는 정상 상태에서 작동하는 경우가 거의 없으며 워크로드는 밀리초 단위로 변동합니다. 냉각판은 시스템 수준의 제어에만 의존하지 않고 이러한 일시적인 열 부하를 흡수해야 합니다.

  • 분산된 흐름 경로, 적절한 내부 부피, 잘 구조화된 채널은 온도 상승을 원활하게 하고 워크로드가 폭증하는 동안 안정성을 유지하는 데 도움이 됩니다.
  • 접합부 온도를 약 85°C 이하로 유지하는 것은 업계 모범 사례에서 신뢰성을 위해 널리 인정되고 있으며 다음과 같은 기준에 부합합니다. JEDEC 장기적인 기기 상태를 검증하기 위한 방법론을 따릅니다. 그러나 제조업체는 JEDEC 표준에 따라 더 높은 최대 작동 접합 온도를 지정할 수 있으며, 이러한 공개된 한계에서 내구성을 검증해야 합니다.

이러한 동적 대응은 제조업체 및 업계 가이드라인 내에서 작동하여 단기적인 열 안정성과 장기적인 부품 상태를 모두 보호하는 데 핵심적인 역할을 합니다.

 

냉각판의 열전달과 압력 강하 균형 맞추기

더 큰 열 전달은 종종 더 높은 압력 강하의 대가를 치릅니다. 표면적이나 복잡한 유로를 추가하면 냉각 효과는 향상되지만 펌프와 씰에 대한 수요가 증가합니다.

목표는 내열성, 기계적 강도, 유압 성능 사이의 적절한 균형을 찾는 것입니다.

  • 공격적인 지오메트리는 속도가 빠른 영역이나 얇은 핀에서 침식을 일으킬 수 있습니다.
  • 압력 관리는 시간이 지남에 따라 씰의 응력과 누출을 방지합니다. 압력이 높을수록 기계적 응력 변형 문제, 즉 접시의 ‘감자 칩’ 현상이 나타날 수 있습니다.
  • 균형 잡힌 설계로 강력한 열 성능을 유지하면서 재료를 안전한 기계적 한계 내에서 유지합니다.

이러한 기하학적 및 유압적 기본 사항은 재료 선택과 장기적인 신뢰성을 구축하는 토대를 형성합니다.

 

여러 구조의 파라메트릭 모델링을 기반으로 한 냉각판 성능 향상. 그림 7은 세 가지 냉각판 설계에서 온도, 압력 강하, 출구 온도 및 온도 균일성을 비교한 것입니다. 결과는 지오메트리가 성능에 큰 영향을 미친다는 것을 보여줍니다. 출처: https://www.frontiersin.org/journals/energy-research/articles/10.3389/fenrg.2022.1087682/full

 

단상 및 2상 냉각판 솔루션

냉각판은 일반적으로 단상 또는 2상 냉각의 두 가지 열 체계 중 하나로 작동합니다. 각각 고유한 설계, 제어 및 통합 고려 사항이 있습니다.

단상 냉각 (1P라고도 함)는 물, 물-글리콜 또는 유전체 유체와 같이 한 상태로 유지되는 액체를 사용합니다. 유체가 따뜻해지면 감지 가열을 통해 열이 제거됩니다. 이 시스템은 기계적으로 간단하고 관리가 쉬우며 표준 펌프 및 여과 장치와 잘 통합됩니다.

2상 냉각 (펌핑 2상 또는 P2P라고도 함)은 냉각판 내에서 제어된 비등을 도입합니다. 유체가 기화하면서 기화 잠열을 통해 열을 흡수하여 단위 질량당 더 많은 에너지를 전달합니다. 이를 통해 보다 엄격한 온도 제어가 가능하지만 압력, 증기 품질 및 흐름 안정성에 대한 정밀한 관리가 필요합니다.

실제로 단상 또는 2상 중 하나를 선택하는 것은 경쟁이 아니라 절충안입니다. 단상 시스템은 견고성과 간단한 통합을 제공하는 반면, 2상 설계는 시스템 복잡성을 정당화할 수 있는 경우 더 높은 열유속 용량과 우수한 온도 균일성을 제공합니다. 대부분의 단기 배포의 경우 단상이 여전히 주류 솔루션으로 남아 있으며, 전력 수요가 계속 증가함에 따라 2상 솔루션이 주목을 받고 있습니다.

 

냉각판 설계에서 적층 가공의 역할

적층 제조(AM)는 특히 복잡한 내부 피처나 통합 매니폴드가 필요한 경우 냉각판의 설계 및 생산 방식을 재편하고 있습니다. 냉각판을 모놀리식 구성 요소로 제작하면 용접, 개스킷, 브레이징 조인트가 제거되어 많은 누출 경로와 공차 누적이 제거됩니다.

AM도 지원합니다:

  • 불규칙한 레이아웃과 일치하는 컨포멀 지오메트리.
  • 통합 포트와 마운팅 기능으로 부품 수를 줄입니다.
  • 균일한 성능과 균형 잡힌 압력을 위해 흐름 경로를 정밀하게 제어합니다.
  • 뛰어난 기계적 강도와 접촉 표면의 평탄도.

기존의 기계 가공 및 납땜 어셈블리는 레이아웃이 단순하거나 비용과 처리량이 주요 동인인 경우에 여전히 효과적입니다. 최상의 결과는 기하학적 복잡성, 공차 및 생산 규모에 따라 제조 방법을 조정하여 기술적 성능과 상업적 실행 가능성을 모두 보장합니다.

 

반으로 잘라낸 3D 프린팅 냉각판. 내부 핀을 다양하게 변경하여 냉각수 흐름 경로를 제어하여 핫스팟을 제거할 수 있습니다. 출처: Conflux 기술

 

AI 미래 준비는 반복을 위한 냉각판 설계입니다.

최신 냉각판 프로그램은 반복을 위해 구축되고 있습니다. 하드웨어가 발전하는 만큼 빠르게 적응할 수 있는 냉각 아키텍처;

  • 표준화된 인터페이스를 갖춘 모듈식 설계로 칩 레이아웃 및 전력 인클로저의 변화에 따라 플레이트가 진화할 수 있습니다.
  • 적층 가공은 이러한 적응성을 가속화하여 형상 개선과 매니폴드 업데이트를 낮은 툴링 비용으로 신속하게 구현할 수 있습니다.

이러한 변화는 정적 최적화에서 냉각 하드웨어가 실리콘과 병행하여 발전하는 지속적인 진화에 초점을 맞추는 광범위한 사고방식의 변화를 반영합니다.

결국 냉각판은 액체 냉각 혁명의 조용한 핵심으로 남아 있습니다. 냉각판의 형상, 재질 및 정밀도는 세계에서 가장 강력한 기계가 얼마나 효율적으로 작동하는지를 결정합니다. 미래를 대비한 설계는 단순히 열을 관리하는 데 그치지 않고 확장 가능하고 서비스 가능하며 업그레이드 가능한 컴퓨팅의 다음 시대를 가능하게 할 것입니다.