産業 インダストリアル

1960年代の水冷メインフレームから、熱管理を芸術に変えたオーバークロック文化、そして今日のAIスーパーコンピューターを可能にする精密コールドプレートまで、性能の追求は常に冷却技術革新の原動力となってきた。.

チップの消費電力がデバイスあたり500Wを超え、ラック密度が80kWを超えると、空冷ではもはや追いつかなくなります。コールドプレートを使用したDTC(Direct to Chip)液冷は、AIアクセラレーター、CPU、高密度コンピュート・モジュールの新しい標準となっています。.

この規模では、最も重要なエンジニアリングはコールドプレート自体で行われる。この記事では、性能のトレードオフ、生産の拡張性、将来的な適応性に注目しながら、AI時代のコールドプレートのエンジニアリングにおける実践的な選択肢を探る。.

 

フロンティアAIモデルのトレーニングに必要なパワーは毎年倍増している。出典:https://epoch.ai/data-insights/power-usage-trend

 

なぜ今、コールドプレートが重要なのか:熱除去の鍵となるインターフェース

コールドプレート は、熱の現実と計算の野望が出会うインターフェースです。精密な熱交換器として機能し、チップから循環冷却液に熱を取り出し、高負荷時や過渡負荷時に安定したジャンクション温度を維持します。.

均一な熱除去は非常に重要です。不均一な流れはホットスポット、スロットリング、長期的な材料疲労につながります。形状および流量分布は、装置がピーク性能を維持するか、圧力下で減衰するかを決定します。.

効果的なコールドプレート設計により、アーキテクトは設計のヘッドルームを確保し、より高い電力エンベロープ、高密度、より長いハードウェア寿命を実現し、総所有コストを削減することができます。.

 

90~95°C の間でサーマルスロットリングが始まり、クロック速度が低下し、性能が徐々に低下します(≈5-20%)。 95°C を超えると、性能低下がより顕著になり、重度の場合(100°C 近く)には性能が最大 50% 低下し、ハードウェア故障のリスクが急激に高まります。 出典:業界データ(ServerMania の 2025 GPU 温度ガイド)に基づく:業界データ(ServerManiaの2025 GPU温度ガイド)に基づき、ジャンクション温度が上昇するにつれてGPU性能が低下することを示し、さまざまな高性能コンピューティング業務で広く引用されている、観測された故障/スロットルのしきい値に従って構成されています。.

 

コールドプレート設計の基本

コールドプレートの性能を最適化することは、形状、流量管理、製造性のバランスをとることです。あらゆる設計上の選択が、プレート内の熱の移動、冷却水の均一な分配、負荷時のシステムの信頼性に影響します。.

コールドプレートの内部形状:チャンネル、マニホールド、サーフェス

内部形状は、流体がチップ全体にどのように広がり、熱がどの程度効果的に除去されるかを支配する。.

  • チャンネル 直線的な平行流路は加工が容易で、予測可能な圧力降下が得られるが、うまく設計されたマニホールドがないと偏流の危険がある。.
  • 高度なトポロジー: マニホールドされたパラレルフロー、クロスフローパス、または局所的なピンフィン領域は、均一性を高め、高フラックス領域をターゲットにします。.
  • 表面の特徴: マイクロフィンやタービュレーターは境界層を破壊し、対流を増加させるが、微粒子に対する感度は高くなる。.
  • マニホールド: 注入口と排出口のバランス設計により、滞留ゾーンや不均一な流れを防ぎ、一貫した熱性能を維持。.

 

コールドプレートのホットスポットと過渡現象の管理

AIアクセラレーター、GPU、CPUが定常状態で動作することはほとんどなく、作業負荷はミリ秒単位で変動する。コールドプレートは、システムレベルの制御のみに依存することなく、このような過渡的な熱負荷を吸収しなければなりません。.

  • 分散された流路、適切な内部容積、十分に構造化された流路は、温度上昇をスムーズにし、バースト負荷時の安定性を維持します。.
  • ジャンクション温度を約85 °C以下に維持することは、信頼性のための業界のベストプラクティスとして広く認知されており、次のような指針に合致しています。 JEDEC 長期的なデバイスの健全性を検証するための方法論。しかし、製造業者は JEDEC 規格に従ってより高い最大動作ジャンクション温度を指定することができ、耐久性 はこれらの公表された限界値で検証されなければならない。.

この動的応答は、メーカーと業界のガイドラインの範囲内で動作させることにより、短期的な熱安定性と長期的なコンポーネントの健全性の両方を保護するための鍵となります。.

 

コールドプレートにおける熱伝達と圧力損失のバランス

熱伝達が大きくなると、圧力損失が高くなることがよくあります。表面積を増やしたり、複雑な流路を作ったりすると、冷却効果は高まりますが、ポンプやシールへの負担が増えます。.

その目的は、耐熱性、機械的強度、油圧性能の適切な均衡を見つけることである。.

  • アグレッシブな形状は、高速ゾーンや薄いフィンでの侵食を引き起こす可能性がある。.
  • 圧力管理は、シールの応力と経時的な漏れを防ぎます。圧力が高くなると、機械的な応力による変形、つまりプレートの恐ろしい「ポテト・チッピング」の問題が生じ始めます。.
  • バランスの取れた設計は、材料を安全な機械的限界内に保ちながら、強力な熱性能を維持する。.

これらの幾何学的および水理学的基礎が一体となって、材料選択と長期的信頼性の基礎となる。.

 

複数の構造のパラメトリックモデリングに基づくコールドプレートの性能向上。図 7 は、3 つのコールドプレート設計の温度、圧力損失、出口温度、温度均一性を比較したものである。この結果は、形状が性能に大きな影響を与えることを示しています。出典:https://www.frontiersin.org/journals/energy-research/articles/10.3389/fenrg.2022.1087682/full

 

単相と二相のコールドプレート・ソリューション

コールドプレートは通常、単相冷却または二相冷却の2つの熱レジームのいずれかで動作します。それぞれに、設計、制御、および統合に関する明確な考慮事項があります。.

単相冷却 (1Pとしても知られる)は、水、水-グリコール、誘電性流体など、1つの状態に留まる液体を使用する。液体が温まると、顕熱によって熱が除去される。これらのシステムは機械的にシンプルで管理が容易であり、標準的なポンプやろ過装置とうまく統合できる。.

二相冷却 (ポンプ式2相またはP2Pとも呼ばれる)は、コールドプレート内で制御された沸騰を導入する。流体が気化する際、気化潜熱によって熱を吸収し、単位質量あたりにより多くのエネルギーを伝達します。これにより、より厳密な温度制御が可能になりますが、圧力、蒸気の質、流れの安定性を正確に管理する必要があります。.

実際には、単相か二相かの選択は、競争ではなくトレードオフである。単相システムは堅牢で統合が容易である一方、二相設計は、システムの複雑さが正当化できる場合には、より高い熱流束容量と優れた温度均一性を提供する。ほとんどの短期的な導入では、単相が主流のソリューションであり続け、電力需要が増加し続けるにつれて二相ソリューションが牽引力を増している。.

 

コールドプレート設計における積層造形の役割

積層造形(AM)は、特に複雑な内部形状や統合されたマニホールドが必要な場合に、コールドプレートの設計と製造方法を再構築しています。プレートをモノリシック部品として製造することで、溶接、ガスケット、ろう付け接合部がなくなり、多くのリーク経路や公差の積み重ねがなくなります。.

AMも可能だ:

  • 不規則なレイアウトにマッチするコンフォーマル形状。.
  • 統合されたポートと取り付け機能により、部品点数を削減。.
  • 流路を正確に制御し、均一な性能とバランスのとれた圧力を実現。.
  • 優れた機械的強度と接触面の平坦性。.

従来の機械加工とろう付けアセンブリは、より単純なレイアウトや、コストとスループットが主な原動力となる場合に有効です。最良の結果は、製造方法を形状の複雑さ、公差、生産規模に合わせることで、技術的性能と商業的実行可能性の両方を確保することができます。.

 

3Dプリントされたコールドプレートを半分にカット。内部のフィンを変化させて冷却水の流路を制御し、ホットスポットをなくすことができる。出典コンフラックス・テクノロジー

 

AIのフューチャーレディネスとは、反復のためのコールドプレートの設計である

最新のコールドプレート・プログラムは、反復のために構築されている。ハードウェアの進化と同じ速さで適応できる冷却アーキテクチャー;;

  • 標準化されたインターフェイスを備えたモジュール設計により、チップレイアウトや電源エンベロープの変化に合わせてプレートを進化させることができます。
  • 積層造形はこの適応性を加速させ、形状の改良やマニホールドの更新を迅速かつ低工具費で実施できるようにする。.

このシフトは、静的最適化から継続的進化(冷却ハードウェアがシリコンと並行して開発される)へのフォーカスへの、より広範な考え方の変化を反映している。.

結局のところ、コールドプレートは液冷革命の静かな核であり続けている。その形状、素材、精度は、世界で最もパワフルなマシンがいかに効率的に動作するかを決定づけます。未来に対応した設計は、単に熱を管理するだけでなく、スケーラブルでサービス可能かつアップグレード可能なコンピューティングの次の時代を実現する。.