Termal yönetim blogu

Isı dağılımı teknolojisi alanında termal yönetim hayati önem taşır. Walmate termal blogu bir platform görevi görür. Burada, yenilikçi ısı emicilerden akıllı soğutma sistemlerine kadar gelişmiş termal yönetim çözümlerini paylaşarak, bir adım önde olmanızı sağlıyoruz.

NVIDIA H200 GPU Sunucusu İçin Daldırma Yağı Soğutma Çözümü

NVIDIA H200 GPU Sunucusu İçin Daldırma Yağı Soğutma Çözümü

NVIDIA H200, benzersiz bellek bant genişliği ve işlem hızıyla yapay zeka devrimini yönlendiren bir hesaplama gücü merkezidir. Ancak bu performans, yüksek bir termal maliyetle birlikte gelir. 1000'den fazla Termal Tasarım Gücü (TDP) ile GPU başına 700W ve raf güç yoğunlukları aşıldı 50kWGeleneksel hava soğutması artık sadece verimsiz değil, aynı zamanda kritik bir performans darboğazı. Bu yüksek yoğunluklu kümelerin tüm potansiyelinden yararlanmak için veri merkezlerinin daha etkili bir termal yönetim paradigmasına geçiş yapması gerekiyor.

Daldırma yağ soğutması Tüm H200 sunucu altyapısının termal olarak iletken, dielektrik bir sıvıya batırılmasını içerir. Bu yöntem, havanın termal direncini ortadan kaldırarak Güç Kullanım Etkinliği (PUE) derecelendirmelerinin şu kadar düşük olmasını sağlar: 1.03, raf yoğunluğunu artırarak kadar 100% etmekve termal kısıtlama riski olmadan tutarlı en yüksek saat hızlarının sağlanması.

Bu kılavuz, HGX H200 kümeleri için daldırma soğutma sisteminin dağıtımına dair kapsamlı bir mühendislik analizi sunmaktadır. Tek fazlı yağın termodinamiğini inceleyecek, optimum dielektrik sıvıları seçecek, gerekli sistem mimarisini tanımlayacak ve geleceğe dönük, yüksek yoğunluklu bir yapay zeka veri merkezi oluşturmak için malzeme uyumluluğu zorluklarını çözeceğiz.

NVIDIA H200 Kümeleri için Hava Soğutma Neden Eskidi?

NVIDIA H200'e geçiş, yüksek performanslı bilgi işlem için hava soğutma çağının kesin sonunu işaret ediyor. Geleneksel zorunlu hava soğutmasının termal sınırının genellikle yaklaşık olarak Raf başına 30-40 kWAncak, yüksek yoğunluklu H200 kümeleri kolayca aşılabilir Raf başına 100 kWBu da havanın aşırı gürültü, titreşim ve sürdürülemez enerji maliyetlerine yol açmadan fiziksel olarak gideremeyeceği bir termal yük oluşturur. Bu sistemleri hava ile soğutmaya çalışmak, anında termal daralmaya ve hesaplama verimliliğinde ciddi bir düşüşe neden olur.

Arıza Termodinamiği: H200 Özellikleri

Havanın neden başarısız olduğunu anlamak için donanımın ham termal verilerine bakmalıyız. NVIDIA H200 sadece bir çip değil; fiziğin sınırlarını zorlayan bir termal meydan okumadır:

  • Aşırı TDP: Tek bir H200 (SXM5) GPU'nun Termal Tasarım Gücü (TDP) şu değere sahiptir: 700W, tepe geçici yükleri genellikle bunu aşar. Tek başına 8 GPU'lu bir HGX anakart, 5.6 kW 4U veya 6U kasadaki ısı.
  • Yüksek Bağlantı Sıcaklıkları: En yüksek hızlanma saatlerini korumak için GPU bağlantı sıcaklığı (Tj) maksimum sınırının oldukça altında tutulmalıdır (genellikle ~90°C ila 95°C). Hava soğutması, bu kadar yüksek ısı akışlarında bu delta T'yi korumakta zorlanır.
  • Raf Yoğunluğu Patlaması: H200 sunucularla dolu standart bir raf, güç yoğunluklarına ulaşabilir 50 kW ila 100 kWHavanın bunu soğutması için büyük hacimsel akış hızına (CFM) ihtiyaç vardır ve bu da imkansız hız gereksinimlerine yol açar.

Havaya Tutunmanın Sonuçları

H200 dağıtımlarında hava soğutmanın kullanılmaya devam edilmesi ciddi operasyonel cezalara yol açar:

  • Parazitik Güç Kaybı: 100 kW'lık bir rafı hava ile soğutmak için sunucu fanlarının maksimum RPM'de (10,000+) çalışması gerekir. Bu parazitik yük, 15% 25% için Toplam veri merkezi gücünün önemli ölçüde artırılması, PUE'nin (Güç Kullanım Etkinliği) artırılması.
  • Akustik Titreşim: Yüksek hızlı fanlar, gürültü seviyelerini aşan gürültü seviyeleri üretir 100 dBABu akustik enerji, Sabit Disk Sürücüsü (HDD) performansını düşürebilen ve zamanla konektörlerin gevşemesine neden olabilen mikro titreşimlere neden olur.
  • Termal Kısıtlama: Hava, eşit olmayan akış dağılımı nedeniyle "sıcak noktalar" oluşturur. Bir GPU termal tavanına ulaştığında, otomatik olarak hızını düşürür; bu da H200 performansı için ödeme yaparken H100 (veya daha düşük) hızlar elde ettiğiniz anlamına gelir.
Özellikler NVIDIA H200 (SXM5) Gereksinimi Hava Soğutma Limiti Sonuç
GPU başına TDP 700 Watt ~350-400 Watt (Verimli) Termal azaltma
Raf Güç Yoğunluğu > 50 kW – 100 kW ~30 kW – 40 kW Düşük Yoğunluklu Dağıtım Gerektirir (Boşa Harcanan Alan)
Delta T (Çipten Soğutma Sıvısına) Düşük Isıl Direnç Gerektirir Yüksek Direnç (Hava bir yalıtkandır) Yüksek Kavşak Sıcaklıkları
Fan Güç Tüketimi Yok (Yağda Fansız) BT Yükünün %20'si Yüksek PUE (>1.5)

Daldırma Soğutma Nedir? Tek Fazlı ve İki Fazlı

Daldırma soğutma iki ayrı teknolojiye ayrılır: Tek aşama ve İki Fazlı. içinde Tek Fazlı DaldırmaSunucular, aktif pompalı konveksiyon yoluyla ısıyı uzaklaştıran, sıvı halde kalan dielektrik bir sıvıya (tipik olarak bir hidrokarbon yağı) daldırılır. İki Fazlı Daldırma, özel olarak tasarlanmış bir akışkan, doğrudan bileşen yüzeyinde kaynar ve buharlaşmanın gizli ısısını kullanarak ısıyı uzaklaştırır ve ardından tekrar sıvıya dönüşür. İki Fazlı sistemler daha yüksek teorik ısı transfer oranları sunarken, Tek Fazlı Yağ, uzun vadeli operasyonel istikrar ve Toplam Sahip Olma Maliyeti (TCO) açısından genellikle üstün bir seçenek olarak kabul edilir.

Tek Fazlı Daldırma Soğutma (Endüstri Standardı)

Tek fazlı sistemler, yüksek kaynama noktasına sahip bir dielektrik sıvı kullanır (genellikle > 150 ° C) böylece çalışma sırasında asla durum değiştirmez. Sıvı, H200 GPU'larından ısıyı emer ve ısı atımı için bir pompa aracılığıyla Soğutucu Dağıtım Ünitesi'ne (CDU) dolaştırılır.

  • Mekanizması: güvenir zorlanmış konveksiyonPompalar, yağı tank ve sunucu şasesi boyunca dolaştırır.
  • Isı Transfer Verimliliği: Tipik ısı transfer katsayısı (h) şu aralıklardadır: 1,200 ila 1,500 W/m²KKaynama noktasından düşük olsa da, bu değer 700W H200 GPU'yu mütevazı bir akış hızıyla soğutmak için yeterlidir.
  • Sıvı Maliyeti: Yaklaşık maliyet etkin olan hidrokarbon bazlı sıvılar (mineral yağlar veya sentetik PAO'lar) kullanır. Litre başına 5 - 15 dolar).
  • Bakım: Açık banyo tasarımları kolay erişim sağlar. Sıvı hızla buharlaşmaz, bu da DIMM veya GPU değişimi gibi bakım prosedürlerini ("daldır ve sil") kolaylaştırır.

İki Fazlı Daldırma Soğutma (Yüksek Performanslı Niş)

İki fazlı sistemler, düşük sıcaklıklarda kaynamak üzere tasarlanmış florokarbon bazlı sıvılar kullanır (örn. 50 ° C). Kaynama işlemi, çip yüzeyinde buhar kabarcıkları oluşturur ve bunlar, kapalı tankın üst kısmındaki bir yoğuşma bobinine yükselir.

  • Mekanizması: güvenir çekirdek kaynaması ve faz değişimi (Buharlaşmanın Gizli Isısı).
  • Isı Transfer Verimliliği: Son derece yüksek, katsayıları aşıyor 10,000 W/m²KBu, mümkün olan en düşük bağlantı sıcaklıklarını sağlar.
  • Sıvı Maliyeti: Son derece pahalı mühendislik sıvıları (örneğin Novec), genellikle maliyeti Litre başına 150 - 300 dolar +.
  • Çevresel Riskler: Birçok iki fazlı akışkan şu şekilde sınıflandırılır: PFAS (“sonsuza dek kimyasallar”)AB ve ABD'de yaklaşan düzenleyici yasaklarla karşı karşıya.
  • Operasyonel risk: Tankın hava geçirmez şekilde kapatılması gerekir. En ufak bir sızıntı bile, buharın kaçmasıyla binlerce dolarlık sıvının hızla kaybolmasına neden olur.

Mühendislik İçgörüsü: Çoğu hiper ölçekli dağıtım için Walmate Thermal şunları öneriyor: Tek Fazlı Yağİki Fazlı sistemler biraz daha iyi termal ölçümler sunsa da, astronomik akışkan maliyeti, yüksek bakım karmaşıklığı (hermetik sızdırmazlık) ve PFAS ile ilgili yasal belirsizlik, 10 yıllık bir veri merkezi yaşam döngüsü için onu riskli bir yatırım haline getiriyor. Tek fazlı sistemler sağlam, sürdürülebilir ve fazlasıyla yeterli soğutma kapasitesi (maksimum 1000 mAh) sağlıyor. Tank başına 200 kW+) mevcut ve gelecekteki H200 kümeleri için.

Özellikler Tek Fazlı (Yağlı) İki Fazlı (Mühendislik Akışkanı)
Isı transfer katsayısı ~1,200 – 1,500 W/m²K > 10,000 W/m²K
Sıvı Maliyeti (Yaklaşık) Düşük (5 – 15 $ / L) Çok Yüksek (150 – 300$+ / L)
Bakım Karmaşıklığı Düşük (Açık erişim) Yüksek (Kapalı kap gerektirir)
Sıvı Kaybı Riski Önemsiz (Uçucu Olmayan) Yüksek (Mühür kırılırsa hızlı buharlaşma)
PUE Potansiyeli 1.03 - 1.05 1.02 - 1.03
Düzenleyici statü Güvenli, Biyolojik olarak parçalanabilir seçenekler PFAS yasaklarının riski

Doğru Dielektrik Sıvının (Yağ) Seçilmesi

Dielektrik sıvı, bir daldırma sisteminin can damarıdır. Hem soğutucu hem de elektrik yalıtkanı görevi görür. Yüksek yoğunluklu H200 kümeleri için, sıvının sıkı gereklilikleri karşılaması gerekir: dielektrik dayanımı 40 kV'u aşan kısa devreleri önlemek için, GPU başına 700W ısı yükünü taşımak için yüksek termal iletkenlik ve titiz malzeme uyumluluğuRafine mineral yağlar yaygın olsa da, modern veri merkezleri şu yöne doğru kayıyor: sentetik PAO (Polialfaolefin) yağları üstün oksidasyon kararlılığı ve tutarlı viskozitesi nedeniyle 10 + yıl ömür.

Temel Özellikler: Akışkanın Fiziği

Bir akışkanın seçimi sadece fiyatla ilgili değildir; akışkan dinamiği ve güvenlik özellikleriyle de ilgilidir:

  • Viskozite (cSt): Bu, pompanın ne kadar zor çalışması gerektiğini belirler. Isı transferi için daha düşük viskozite daha iyidir. İdeal sıvıların kinematik viskozitesi 40°C'de < 10 cStYüksek viskoziteli sıvılar GPU kalıbında durgun sınır tabakaları oluşturarak bağlantı sıcaklıklarını artırır.
  • Parlama Noktası ve Yangın Güvenliği: Sıvı, normal çalışma koşullarında yanıcı olmamalıdır. Bir parlama noktası > 150°C sunucunun ~50-60°C olan çalışma sıcaklığının çok üzerinde olan standart güvenlik marjıdır.
  • Akma Noktası: Soğuk çalıştırmalar için kritik öneme sahiptir. Sıvı, düşük sıcaklıklarda, ideal olarak, sıvı kalmalıdır. <-40 ° CKışın tesiste elektrik kesintisi yaşandıktan sonra pompaların sıvıyı hemen dolaştırabilmesini sağlamak için.

Gizli Risk: Malzeme Uyumluluğu

İlk daldırma uygulamalarında en sık karşılaşılan arıza türü termal değil, kimyasaldı. Hidrokarbon yağlar çözücü görevi görebilir.

  • Kablo Sertleştirme: Yağlar, standart PVC kablo yalıtımından plastikleştiricileri sızdırarak kabloların kırılganlaşmasına ve çatlamaya meyilli hale gelmesine neden olabilir. Daldırmaya hazır kablolar (örneğin, Teflon/PTFE) zorunludur.
  • TIM Yıkaması: Standart termal macunlar yağda çözünebilir veya "dışarı pompalanabilir", bu da sıvıyı kirletebilir ve GPU kalıbının termal temasını zayıflatabilir. İndiyum folyo veya özel daldırma sınıfı TIM'ler gereklidir.
Varlığınızı Sentetik PAO Rafine Mineral Yağı Standart Trafo Yağı H200 için İdeal Hedef
Dielektrik gücü > 50kV > 40kV > 30kV > 45kV
Viskozite @ 40°C 6 - 8 cSt 10 - 15 cSt > 20 cSt (Çok kalın) < 10 cSt
Alevlenme noktası > 160°C > 140°C ~ 135 ° C > 150°C
Göreceli maliyet $$ $ $ Denge Performansı/Maliyet

Sistem Mimarisi: Tanklar, CDU'lar ve Manifoldlar

Daldırma soğutma sistemini devreye almak, bir küveti yağla doldurmak kadar basit değildir. Büyük miktarda termal enerjiyi hassas bir şekilde hareket ettirecek şekilde tasarlanmış, gelişmiş, kapalı devre bir hidrolik mimari gerektirir. NVIDIA H200 kümeleri için eksiksiz bir daldırma ekosistemi, görev açısından kritik üç alt sistemden oluşur: Daldırma Tankı (birincil gemi), Soğutma Sıvısı Dağıtım Ünitesi (CDU) (termal yönetim motoru) ve Isı Atma Sistemi (kuru soğutucular veya soğutucular). Her bileşen, dielektrik sıvıların özel akış dinamiklerini ve malzeme uyumluluğu gereksinimlerini karşılayacak şekilde tasarlanmalıdır.

NVIDIA H200 kümeleri için eksiksiz bir daldırma soğutma sistemi, uyum içinde çalışan üç entegre alt sisteme dayanır. İlk olarak, Daldırma Tankı sunucu donanımını barındırır ve birincil ısı yakalama kabı olarak hizmet eder. İkincisi, Soğutma Sıvısı Dağıtım Ünitesi (CDU) Sistemin kalbi olarak görev yapar ve sıvı-sıvı ısı değiştiricisi aracılığıyla akışkan akışını, filtrelemeyi ve sıcaklık düzenlemesini yönetir. Son olarak, harici bir Kuru Soğutucu veya Soğutucu Yakalanan ısıyı atmosfere vererek termal döngüyü tamamlar.

Daldırma Tankı: Sadece Bir Konteynerden Daha Fazlası

Tank, BT donanımı ile akışkan arasındaki arayüzdür. Yüksek yoğunluklu H200 rafları için tank tasarımının çeşitli mekanik zorlukları çözmesi gerekir:

  • Malzeme Yapısı: Tanklar genellikle şu şekilde üretilir: Paslanmaz Çelik (304 veya 316) dielektrik sıvı ile sıfır etkileşimi sağlamak ve ağır sıvı yükü için yapısal sağlamlık sağlamak (genellikle > 1,000 kg (tank başına yağ miktarı).
  • Kablo Yönetimi ve Fitilleme: Yağ, kılcal etki ("fitilleme") yoluyla kablolar boyunca hareket edebilir. Tanklarda, yağın zemine damlamasını veya suya daldırılamayan bölgelere ulaşmasını önlemek için özel kablo tepsileri ve contalar bulunmalıdır.
  • Bara Güç Dağıtımı: Teslim 100 kW Bir tanka güç sağlamak için standart kablolar yerine sert baralar gerekir. Bu baralar, dielektrik sıvıyla uyumlu olmalı ve voltaj düşüşünü en aza indirecek şekilde tasarlanmalıdır.

CDU: Sistemin Kalbi

Soğutucu Dağıtım Ünitesi (CDU), tanktaki pahalı dielektrik sıvıyı tesis su devresinden izole ederek ikincil devreyi oluşturur. Akış hızı kontrolü, filtreleme ve sıcaklık stabilitesinden sorumludur.

  • Isı Eşanjörleri: Bu, temel bileşendir. Yüksek verimlilik Lehimli Plakalı Eşanjörler (BPHE) Yağdan tesis suyuna ısı transferi için kullanılır. Walmate Thermal, bu kritik bileşenlerin üretiminde uzmanlaşmış olup, plaka geometrisini, suya kıyasla yağın daha yüksek viskozitesini karşılayacak şekilde optimize etmektedir.
  • Yedeklilik Stratejisi: Güvenilirlik pazarlık konusu değildir. H200 kümeleri için CDU'lar genellikle N+1 pompa konfigürasyonuBir pompa arızalanırsa, termal kaçakları önlemek için yedek pompa hemen devreye girer; bu durum <30 saniye bu güç yoğunluklarında.
  • filtrasyon: CDU, temas noktalarını birbirine bağlayabilecek partikül maddeleri (kalıntı, lehim akısı) gidermek için yağı sürekli olarak filtrelemelidir. < 10 mikron hassas GPU bileşenlerini korumak için standarttır.

Manifoldlar ve Akış Dağıtımı

Sadece tanka yağ pompalamak yeterli değildir. Akış, sıcak bileşenlere tam olarak yönlendirilmelidir. Bu, özel olarak tasarlanmış manifoldlar aracılığıyla sağlanır.

  • Akış Hızı Gereksinimleri: 700W'lık bir GPU'yu tek fazlı yağ ile etkili bir şekilde soğutmak için yaklaşık olarak yerelleştirilmiş bir akış hızı gereklidir. Dakikada 10-15 Litre (LPM) düğüm başına sıklıkla gereklidir.
  • Tekdüzelik: Manifold tasarımı, tüm sunucu yuvalarında eşit basınç düşüşü sağlamalıdır. Kötü bir manifold tasarımı, tankın en ucundaki sunucuların "aç kalmasına" ve diğerlerinin soğuk kalmasına neden olarak aşırı ısınmalarına yol açar.
  • Walmate'in Uzmanlığı: Özel paslanmaz çelik akışkan dağıtım manifoldlarını tasarlıyor ve üretiyoruz CFD simülasyonu tüm tank hacmi boyunca düzgün hız profillerinin garanti altına alınması.
Bileşen Anahtar işlevi Kritik Spesifikasyon (Veri)
Daldırma Tankı BT ekipmanlarını ve sıvılarını barındırır Kapasite: 42U – 52U; Güç: 100 kW+
CDU (Isı Eşanjörü) Isıyı tesis suyuna aktarır Yaklaşım Sıcaklığı: 3 ° C - 5 ° C; Tip: Lehimli Plaka
Sirkülasyon Pompaları Dielektrik sıvıyı hareket ettirir Akış hızı: > 300 LPM (100kW tank başına); Yedeklilik: N + 1
Filtrasyon sistemi Partikülleri temizler Değerlendirme: 5 – 10 Mikron; Çalışırken değiştirilebilir
Kuru soğutucu Atmosfere ısıyı reddeder Dönüş Suyu Sıcaklığı: 35 ° C - 45 ° C (Serbest soğutmaya izin verir)

Daldırma Yatırım Getirisi: PUE, Yoğunluk ve TCO

Daldırma soğutmaya geçiş, tanklar ve akışkanlar için daha yüksek bir ilk sermaye harcaması (CapEx) gerektirir, ancak Yatırım Getirisi (ROI) hızlı ve önemlidir. Daldırma soğutmanın finansal gerekçesi üç temel üzerine kuruludur: enerji tüketiminde (OpEx) önemli düşüşler, işlem yoğunluğunda büyük artışlar (yer tasarrufu) ve donanım ömrünün uzaması. Yüksek yoğunluklu bir NVIDIA H200 kümesi için, daldırma soğutma genellikle sürdürülebilir bir Toplam Sahip Olma Maliyeti (TCO) elde etmenin tek yoludur.

Daldırma soğutma, veri merkezi verimsizliğinin temel nedenlerine saldırarak işletme giderlerini (OpEx) önemli ölçüde azaltır. Sunucu fanlarını ve güç tüketen CRAC ünitelerini ortadan kaldırarak toplam enerji tüketimini şu şekilde düşürür: 30-50%, Güç Kullanım Etkinliği (PUE) derecelendirmelerinin en düşük seviyede olmasını sağlar 1.03 Hava soğutmalı tesislerde tipik olan 1.5+ ile karşılaştırıldığında. Ayrıca, donanım yoğunluğunun şu kadar artmasına olanak tanır: 2-3x, pahalı zemin alanından ve inşaat maliyetlerinden tasarruf sağlar.

Enerji Tasarruflarının Dağılımı

Enerji tasarrufu, iki büyük parazitik yükün ortadan kaldırılmasıyla sağlanır:

  • Sunucu Fanlarının Elenmesi: Hava soğutmalı bir H200 sunucusunda fanlar tüketebilir 15-20% Yoğun soğutuculardan havayı itmek için toplam BT gücünün %20'si kullanılır. Daldırma modunda ise fanlar tamamen çıkarılır. Bu, aynı işlem gücü için BT yükünü anında %20'ye kadar azaltır.
  • Kompresörsüz Soğutma: Hava soğutması, soğutucuların soğuk hava üretmesini gerektirir (genellikle 15-20°C). Daldırma yağı daha yüksek sıcaklıklarda (40-50°C) çalışır, bu da serbest soğutma hemen hemen her iklimde yalnızca dış mekan kuru soğutucuları kullanarak, enerji yoğun mekanik soğutma (kompresör) ihtiyacını ortadan kaldırır.

Donanım Ömrü ve Güvenilirliği

Daldırma, donanımı sadece soğutmakla kalmaz, aynı zamanda korur. Bu, Arızalar Arası Ortalama Süreyi (MTBF) uzatır:

  • Termal kararlılık: Yağın yüksek termal kütlesi, lehim eklemi yorgunluğuna neden olan hızlı sıcaklık artışlarını (termal döngü) ortadan kaldırır.
  • Kirletici Koruması: Suya batırılan bileşenler, hava soğutmalı elektronik cihazların başlıca sorunları olan toz, nem, kükürt ve oksidasyona karşı dayanıklıdır.
  • Titreşim Giderme: Yüksek hızlı fanlar olmadığında akustik titreşim ortadan kalkar ve HDD dizileri ve konnektörleri korunur.
metrik Legacy Hava Soğutma Daldırma Yağ Soğutması Tasarruf/Kazanç
PUE (Güç Kullanım Etkinliği) 1.4 - 1.6 1.03 - 1.05 ~%30 Daha Düşük Toplam Güç
Raf Güç Yoğunluğu (kW) 15 - 30 kW 100 kW – 200 kW+ 3x – 6x Yoğunluk
Sunucu Fan Gücü BT Yükünün %15 - %20'si 0% (Kaldırıldı) Anında Verimlilik Kazanımı
Arıza Oranı (MTBF) Temel Genişletilmiş (Kararlı Sıcaklık) Daha Düşük Bakım Maliyeti
Zemin Alanı Gerekli Yüksek (Sıcak/Soğuk Koridorlar) Düşük (Kompakt Tanklar) ~%60 Yer Tasarrufu

Tasarım ve Uygulama Zorlukları (Ve Çözümleri)

H200 kümeleri için daldırma soğutmanın uygulanması, termodinamiğin ötesinde belirli mühendislik engellerinin aşılmasını gerektirir. Bu geçiş, benzersiz fiziksel zorluklar ortaya çıkarır: Malzeme Uyumluluğu hidrokarbonların kablolardan plastikleştiricileri soyabileceği sorunlar; Kablo Fitiliyağın kılcal etki yoluyla tel yalıtımından yukarı doğru daldırma olmayan bölgelere doğru hareket ettiği yer; ve Servis Yağlı donanımların işlenmesi için yeni protokoller gerektiren kısıtlamalar. Bu riskleri başarıyla azaltmak, sağlam tesis tasarımının yanı sıra PTFE kablolama ve İndiyum folyo TIM'ler gibi hassas malzeme seçimini de içerir.

Malzeme Uyumluluğu: Sessiz Katil

Standart sunucu bileşenleri yağ için değil, hava için tasarlanmıştır. Hidrokarbon sıvılarına uzun süreli maruz kalma, belirli malzemelerde kimyasal bozulmaya ve sistem arızasına yol açabilir.

  • Kablolama İzolasyonu: Standart PVC (Polivinil Klorür) Kablolar, zamanla yağa sızabilen plastikleştiriciler içerir. Bu da kabloları kırılgan hale getirir ve çatlamaya meyilli hale getirirken dielektrik sıvıyı kirletir. Çözüm: Tüm su altı kabloları değiştirilmelidir. PTFE (Teflon) or FEP Yağda kimyasal olarak inert olan yalıtım.
  • Contalar ve Contalar: EPDM gibi yaygın kauçuk contalar şişebilir veya çözünebilir. Çözüm: Kullanım Viton (FKM) or Nitril (Buna-N) hidrokarbon ortamlarında uzun vadeli kararlılığı kanıtlanmış contalar.
  • Etiketleme: Kağıt etiketler ve standart yapıştırıcılar filtrelerden ayrılıp tıkanmaya neden olur. Çözüm: Lazer kazıma veya yağa dayanıklı polyester etiketler kullanın.

Fitilleme (Kılcal Etki) Olayı

Yağın yüzey gerilimi çok düşüktür ve bu da onun kablonun içindeki telli bakırdan yukarı tırmanarak tanktan Güç Dağıtım Ünitesi'ne (PDU) veya şebeke anahtarına metrelerce uzağa gitmesini sağlar.

  • Risk: Yağın daldırılmayan zemin döşemelerine damlaması veya ağ ekipmanı bağlantı noktalarına girmesi.
  • Azaltma: kurmak hermetik kablo rakorları veya tank çıkışına "fitil blokları" yerleştirin. Alternatif olarak, kablo yoluna çıkış noktasının altına inen ve bir yerçekimi tuzağı oluşturan bir "servis döngüsü" ekleyin.

Daldırma için H200 Sunucularının Modifikasyonu

Standart bir HGX H200 süpürgeliğini yağa atamazsınız; düzgün çalışması için belirli değişikliklere ihtiyaç duyar:

  • Fan Çıkarma ve Sahtekarlık: Sıvı akışını sağlamak için fiziksel fanların çıkarılması gerekir. Ancak, BMC (Ana Kart Yönetim Denetleyicisi) bir fan arızası tespit edecek ve önyüklemeyi engelleyecektir. Çözüm: kurmak hayran taklitçileri (küçük adaptörler) anakarta sahte "her şey yolunda" takometre sinyali gönderiyor.
  • TIM Değişimi: Standart termal gres zamanla yağda yıkanabilir veya bozulabilir. Çözüm: Gresi şu şekilde değiştirin: İndiyum Folyo veya katı Faz Değişim Malzemesi (PCM) pedler. İndiyum folyo mükemmel iletkenlik sağlar (86 W / m · K) ve kimyasal yıkamaya karşı dayanıklıdır.
Risk faktörü Potansiyel etki Azaltma Stratejisi (Mühendislik Çözümü)
Sıvı Kirliliği Azaltılmış dielektrik dayanımı; filtre tıkanması Tüm kağıt etiketleri çıkarın; PVC içermeyen kablolar kullanın; Sürekli 10µm filtrasyon.
Kablo Fitili Tankın dışında yağ sızıntısı (Güvenlik tehlikesi) Mümkünse katı çekirdekli tel kullanın; Kurulum sıkıştırma conta blokları tank çıkışında.
TIM Yıkama Boşluk oluşumu nedeniyle GPU'nun aşırı ısınması Yapıştır'ı şununla değiştirin: İndiyum Folyo veya Grafit pedler (dikey sabit).
Mühür Arızası Büyük sıvı kaybı (Çevresel sorun) Kullanım Viton/FKM O-ringler; Çift cidarlı muhafaza tankları tasarlayın.

Sıkça Sorulan Sorular (SSS)

1. Daldırma soğutma NVIDIA garantisini geçersiz kılar mı?

Standart bir hava soğutmalı HGX H200 anakartını fan ve soğutucuları çıkararak değiştirmek, standart garantiyi geçersiz kılar. Ancak NVIDIA, Supermicro, Gigabyte, QCT gibi sertifikalı sistem entegratörleriyle çalışır. "daldırmaya hazır" Sıvı daldırmaya karşı tam garantili SKU'lar. Destek kapsamını garantilemek için standart üniteleri sonradan takmak yerine, daima sıvı daldırma sertifikalı donanım satın alın.

2. Dielektrik yağın ne sıklıkla değiştirilmesi gerekir?

Yüksek kaliteli sentetik PAO dielektrik sıvıları inanılmaz derecede kararlıdır. DLC devrelerindeki su glikolünün 3-5 yılda bir bakıma ihtiyacı olabileceği gibi, tek fazlı daldırma yağının kullanım ömrü genellikle 1000 yılı aşar. 10 15 yılSıvı, partikülleri gidermek için sürekli olarak filtrelenir ve oksidasyon veya nem girişini kontrol etmek için periyodik laboratuvar analizi önerilir, ancak sunucunun yaşam döngüsü boyunca nadiren tam değiştirme gerekir.

3. Mevcut H200 hava soğutmalı sunucularımı daldırma için sonradan donatabilir miyim?

Teknik olarak evet, ancak mühendislik açısından yoğun bir işlemdir. Tüm fanları çıkarmanız, TIM'i İndiyum folyo veya grafit pedlerle değiştirmeniz (macun yıkandıkça), fan sahtecileri takmanız ve muhtemelen BIOS'u değiştirmeniz gerekir. Kavram kanıtları için mümkün olsa da, garanti riskleri ve işçilik maliyetleri nedeniyle üretim kümeleri için önerilmez. Özel olarak tasarlanmış daldırma sunucuları daha iyi bir seçimdir.

4. Dalgıç tankında pompa arızalanırsa ne olur?

Daldırma, soğuk plakalara kıyasla önemli bir güvenlik tamponu sunar. Çünkü tank, 1000'den fazla su içerir. 1,000 litre Sıvının muazzam bir termal kütlesi vardır. Sirkülasyon durursa, sıvı sıcaklığı yavaşça yükselir ve operatörlere Birkaç dakika T_junction sınırlarına ulaşılmadan önce tepki vermek için. Ayrıca, sağlam sistem tasarımları N+1 yedekli pompalar, bu nedenle tek bir pompa arızası sirkülasyonu durdurmaz veya soğutma performansını etkilemez.

5. Mineral yağ yanıcı mıdır?

Dielektrik sıvılar yanıcıdır ancak tutuşması zordur. Standart daldırma sıvıları yüksek bir parlama noktasına sahiptir, genellikle >150°C (302°F)Yağın çalışma sıcaklığı 40°C ile 50°C arasında tutulduğundan, 100°C'nin üzerinde muazzam bir güvenlik marjı mevcuttur. Yangın söndürme sistemleri veri merkezlerinde standarttır, ancak hava soğutmalı raflardaki elektrik yangını risklerine kıyasla kendiliğinden tutuşma riski son derece düşüktür.

6. Daldırma soğutma ne kadar yerden tasarruf sağlar?

Daldırma soğutma, alan verimliliğini önemli ölçüde artırır. Standart bir hava soğutmalı raf şunları destekleyebilir: 30 kWSıcak/soğuk koridorlar için önemli boşluklar gerektirir. Bir daldırma tankı şunları karşılayabilir: 100 kW ila 200 kW benzer bir ayak izine sahip ve koridorlara ihtiyaç duymayan bir yapı. Bu genellikle şu şekilde sonuçlanır: %60 ila %75 indirim Aynı miktardaki işlem gücü için gereken beyaz alanda.

7. Walmate özel daldırma tankları veya CDU'lar tasarlayabilir mi?

Evet. Walmate Thermal, daldırma ekosistemindeki kritik termal bileşenler konusunda uzman bir üreticidir. Yüksek verimli, yüksek performanslı termal bileşenler tasarlıyor ve üretiyoruz. lehimli plakalı ısı değiştiriciler CDU'lar ve özel paslanmaz çelik akışkan manifoldları Tanklar içinde homojen akış dağılımı sağlamak için. Yüksek yoğunluklu H200 dağıtımları için gereken özel termal donanımı sağlamak üzere sistem entegratörleriyle ortaklık kuruyoruz.

Sonuç

NVIDIA H200, termal paradigmada bir değişim gerektiriyor. Raf yoğunlukları 50 kW'ın üzerine çıktıkça, hava soğutmanın fiziği bir dezavantaj haline geldi, performansı sınırladı ve işletme maliyetlerini artırdı. Daldırma yağ soğutması yalnızca bir alternatif değil; yapay zeka altyapısının tüm potansiyelini ortaya çıkarmak için kanıtlanmış bir mühendislik yoludur. Termal direnci ve parazit fan yüklerini ortadan kaldırarak, enerji tüketimini azaltırken gerçek anlamda en yüksek performansı sağlar.

Bu teknolojinin başarılı bir şekilde uygulanması için sadece bir tanka ihtiyaç duyulmuyor; aynı zamanda büyük ısı akışlarını mutlak güvenilirlikle yönetebilen sağlam, entegre bir hidrolik mimariye ihtiyaç duyuluyor.

Yüksek yoğunluklu soğutma uzmanlarıyla ortak olun.
Walmate Thermal, daldırma sistemlerine güç sağlayan kritik donanımların üretiminde uzmanlaşmıştır. Yüksek verimlilikten lehimli plakalı ısı değiştiriciler CDU'larınız için özel paslanmaz çelik sıvı dağıtım manifoldları Tank geometrinize özel olarak tasarlanmış, yeni nesil veri merkezleri için termal omurga sağlıyoruz. 100kW+ rafları kolaylıkla.

Danışmanlık için bugün termal mühendislerimizle iletişime geçin. Yapay zeka için daha serin ve daha hızlı bir gelecek inşa edelim.

 

Son Blog

Walmate Blog'da Arama Yapın

Walmate Thermal teknik sorularınızı yanıtlayabilir:

Birçok teorik makalemiz ve teknik paylaşımımız olmasına rağmen, radyatörler, sıvı soğutmalı plakalar veya gerçek termal tasarım sürecindeki yeni malzemeler hakkında birçok soru ve endişeniz varsa, bize e-posta gönderebilirsiniz; mühendislerimiz bunları sizin için yanıtlayabilir.

Bize e-posta gönderebilirsiniz:

İçindekiler

İletişim