Els servidors d'IA refrigerats per líquid s'enfronten a colls d'ampolla

Sep 30, 2024

Deixa un missatge

 

 

 

Amb l'augment dels enviaments de xips Blackwell, també augmentarà la voluntat dels clients d'adoptar la refrigeració líquida.

Els experts de la indústria informen que el subministrament de dispositius universals de desconnexió ràpida (UQD) per a solucions de refrigeració líquida s'està restringint, cosa que pot convertir-se en un coll d'ampolla important per al creixement de la refrigeració líquida del servidor d'IA.

 

Els fabricants de servidors ODM indiquen que els xips Blackwell AI de Nvidia, inclosos els B100 i B200, començaran a enviar-se aquest any, mentre que la solució GB200 no entrarà en producció en massa fins a finals de 2024 o 2025. La majoria dels clients de B100 i B200 encara utilitzen dissenys de refrigeració per aire. , però els fabricants d'ODM informen d'un augment continuat de la penetració de refrigeració líquida, anticipant que la voluntat dels clients d'adoptar refrigeració líquida també augmentarà amb l'augment dels enviaments de xips Blackwell.

 

Liquid-Cooled AI Servers

▲ Servidors d'IA refrigerats per líquid

 

 

I Ampliació de la capacitat per satisfer la demanda creixent de refrigeració líquida

 

Les empreses rellevants estan ampliant la producció per donar la benvinguda a la nova era de refrigeració líquida. El fabricant de mòduls tèrmics Amlogic té previst augmentar la seva capacitat de producció mensual de plaques de refrigeració d'aigua de 30,000 a 300,000 unitats.

 

Auras ha establert una nova fàbrica a Tailàndia per atendre les preocupacions i demandes geopolítiques dels clients. Es preveu que aquesta fàbrica comenci la producció en massa el tercer trimestre. A més d'ampliar la capacitat de producció local de plaques de refrigeració, Auras també té previst produir unitats de distribució de refrigeració (CDU) i col·lectors de distribució de fluids de refrigeració (CDM) localment, amb una capacitat mensual prevista d'aproximadament 2,000-3,{{2 }} conjunts.

 

El fabricant de mòduls tèrmics AVC va declarar en la seva recent trucada de guanys que la seva capacitat de producció mensual de mòduls de placa de refrigeració a la Xina i Vietnam és d'unes 115,000 unitats, la qual cosa es tradueix en una producció mensual d'unes 420,000 unitats quan es calcula mitjançant plaques de refrigeració.

 

AVC té previst ampliar la seva capacitat en un 50% a finals d'any. AVC també té previst augmentar la seva capacitat de producció mensual de CDU a 1,000 unitats i de CDM a 30,000 conjunts. AVC va destacar que aquesta capacitat planificada es pot ajustar de manera flexible en funció de les demandes de comandes dels clients.

 

Thermo Technology Company Goli Thermal Processing està ampliant la seva capacitat a la planta de Zhongli a Taiwan a causa de l'augment de la demanda dels clients de refrigeració líquida. A finals del tercer trimestre, s'espera que la capacitat mensual dels CDM passi d'1,000 unitats a 2,000 unitats, i a finals d'any a 4,{{5} } unitats, amb la que s'espera que la producció anual de CDU també arribi a les 2,000 unitats a finals d'any.

 

Aquests fabricants tenen grans expectatives de demanda de refrigeració líquida, principalment a causa de l'eficiència computacional i els estàndards PUE del centre de dades a la Xina i la UE, però el factor més important és que Nvidia aixequi les restriccions autoimposades a les especificacions tèrmiques per als fabricants de xips.

 

 

II El ràpid creixement de la refrigeració líquida condueix a l'escassetat d'UQD

 

Com que la indústria anticipa amb impaciència l'arribada de l'era de refrigeració líquida, UQD s'ha convertit en el coll d'ampolla més gran per al creixement. Els fabricants de mòduls tèrmics han assenyalat que el subministrament d'UQD s'ha reduït recentment. Tot i que la quota de mercat actual de refrigeració líquida només és d'un dígit, si s'eleva a dos dígits en el futur, els UQD poden ser difícils d'obtenir.

 

Els proveïdors d'UQD provenen principalment d'Europa i dels Estats Units, com les principals companyies nord-americanes Parker Hannifin i CPC, Staubli International de Suïssa, Danfoss de Dinamarca i Cejn de Suècia. El gegant taiwanès de components de connectors Lotes també està entrant activament al mercat i ha començat a lliurar mostres.

 

El president d'Anbo Technology, Liang Zhijian, va assenyalar que, com que la refrigeració líquida té com a objectiu principal evitar fuites, i els UQD són els components més propensos a les fuites, el subministrament d'UQD és el més restringit entre els components de refrigeració líquida. Això no és només una qüestió tècnica; els fabricants rellevants també tenen proteccions de patents i Anbo Technology està investigant maneres de trencar aquestes barreres de patents.

 

Els experts de la indústria han assenyalat que, tot i que els fabricants d'UQD tenen proteccions de patents, també han de passar per múltiples validacions, inclosa la certificació OCP i les validacions dels clients, que requereixen temps i molta mà d'obra. A més, els fabricants europeus i americans existents no tenen cap intenció d'ampliar la capacitat, la qual cosa es convertirà en un coll d'ampolla important per al ràpid desenvolupament de la refrigeració líquida.

 

Supermicro és un dels fabricants de refrigeració líquida de més ràpid creixement. El fundador i director general Liang Jianhou va assenyalar que la refrigeració líquida ha representat només l'1% del mercat de servidors durant els darrers 30 anys, però estima que el 2025, la taxa de penetració augmentarà al 30%.

 

 

III Refrigeració líquida com a solució potencial; El boom de la IA posa pressió a la xarxa

 

El ràpid desenvolupament de la intel·ligència artificial generativa ha impulsat una expansió sense precedents als centres de dades, despertant preocupacions sobre el seu impacte a la xarxa elèctrica. Aquestes instal·lacions amb un consum intensiu d'energia podrien provocar apagues i un augment dels costos energètics. Segons estimacions de l'Institut d'Investigació d'Energia Elèctrica, per al 2030, els centres de dades podrien consumir el 9% de l'electricitat dels Estats Units, duplicant la xifra actual. El consum d'electricitat d'un gran centre de dades és equivalent al de centenars de milers de llars.

 

La creixent demanda d'energia de la intel·ligència artificial és especialment preocupant. Els primers models d'IA consumien deu vegades l'energia d'una cerca de Google, mentre que els xips més nous requereixen encara més potència. Els experts adverteixen que el desenvolupament futur de la intel·ligència artificial pot estar limitat per la nostra capacitat de generar energia suficient.

 

Alguns països s'enfronten a grans reptes. Per exemple, el 2026, Irlanda podria tenir el 30% de la seva electricitat dedicada als centres de dades. Als EUA, el consum d'electricitat del centre de dades es concentra a 15 estats, amb Texas i Virgínia els més alts. Califòrnia es troba en una situació crítica, amb nous centres de dades que s'espera que generin demandes d'electricitat superiors a les de les centrals nuclears.

 

 

IV Data Centers: enorme consum d'energia i augment de la refrigeració líquida

 

Les demandes computacionals de la intel·ligència artificial estan augmentant les temperatures dels servidors i les emissions de carboni, donant lloc a un augment significatiu de la demanda de sistemes de refrigeració. Els sistemes de refrigeració representen el 40% del consum total d'energia d'un centre de dades, cosa que els converteix en la segona font de consum d'energia després dels propis servidors. Es preveu que el mercat global de refrigeració de servidors creixi de 20.000 milions de dòlars el 2024 a 90.000 milions de dòlars el 2027. Es preveu que el mercat de sistemes de refrigeració líquida en centres de dades augmenti de l'1% al 22%, amb el valor de mercat previst que creixi de 317 milions de dòlars a 7.800 milions de dòlars en els propers tres anys.

 

Les solucions de refrigeració líquida, que utilitzen aigua o refrigerants per refredar els servidors, són cada cop més populars. Les noves tecnologies inclouen la refrigeració per immersió (immersió de bastidors de servidors sencers en líquids no conductors) i la refrigeració líquida directa (circulació d'aigua al voltant dels servidors). Encara que actualment és més car que els sistemes de refrigeració per aire, la refrigeració líquida pot reduir el consum d'energia d'un centre de dades en un 10% o més.

 

La firma d'investigació Global Market Insights prediu que el mercat global de refrigeració líquida per als centres de dades passarà de 2.100 milions de dòlars el 2022 a 12.200 milions de dòlars el 2032. Una enquesta de l'Institut Uptime va trobar que el 16% dels gestors de centres de dades creuen que el refredament líquid es convertirà en la refrigeració principal. mètode en 1-3 anys, mentre que el 41% creu que trigarà 4-6 anys. Per tant, és més probable que els mètodes de refrigeració híbrids sorgeixin a curt termini.

 

Upsite Technologies, líder en la gestió de sistemes de refrigeració per aire per a centres de dades, va assenyalar que, tot i que la tecnologia avança contínuament, és poc probable aconseguir centres de dades 100% refrigerats per líquid a curt termini, ja que els equips de refrigeració líquida encara requereixen refrigeració per aire per a la dissipació de la calor. . Tot i que la refrigeració líquida és més eficient, és difícil d'implementar a gran escala i requereix una inversió inicial important. La refrigeració per aire és menys costosa però també menys eficient. Així, les instal·lacions de refrigeració híbrida són cada cop més populars per maximitzar els beneficis de la refrigeració líquida i per aire.

 

 

V La crisi energètica del centre de dades demana una acció urgent

 

A causa del seu impacte ambiental, els centres de dades reben un escrutini creixent. Els governs de tot el món estan implementant regulacions per controlar el seu consum d'energia i la seva petjada de carboni. Les directrius de "Green Data Center" de la Xina i iniciatives similars a Alemanya, Singapur i Japó il·lustren aquesta tendència. Els experts del sector com Schneider Electric subratllen la necessitat de mètriques ambientals integrals per avaluar la sostenibilitat dels centres de dades, inclosos factors més enllà de l'ús d'energia, com ara els recursos hídrics i la generació de residus.

 

El govern dels Estats Units està pressionant les grans empreses tecnològiques perquè inverteixin en energia neta i reconeguin l'impacte significatiu que la creixent demanda d'energia de la intel·ligència artificial té en el medi ambient.

 

 

VI Trobar fonts d'energia adequades: centres de dades i reptes energètics

 

Els centres de dades necessiten una combinació energètica diversificada per equilibrar la fiabilitat i la sostenibilitat alhora que satisfan les demandes creixents. Les fonts d'energia renovables com la solar i l'eòlica són atractives a causa de la seva baixa petjada de carboni. Tanmateix, la seva dependència de les condicions meteorològiques pot provocar una sortida inestable, cosa que els fa inadequats com a única font d'energia per als centres de dades. La construcció d'instal·lacions redundants per compensar aquesta incoherència pot ser necessària però costosa.

 

L'energia nuclear ha sorgit com una solució potencial. Les centrals nuclears tradicionals proporcionen una potència de càrrega base fiable, generant electricitat estable, crucial per a les operacions del centre de dades. A més, s'espera que el mercat mundial de l'energia nuclear assoleixi un creixement constant durant la propera dècada.

 

Les innovacions en el sector nuclear ofereixen possibilitats més prometedores. S'estan desenvolupant petits reactors modulars (SMR) com a alternatives més petites, més segures i més escalables a les centrals nuclears tradicionals. Tot i que encara estan en fase d'investigació i desenvolupament, els SMR tenen el potencial de desplegar-se directament als centres de dades, proporcionant energia neta dedicada.

 

Global liquid cooling market (US$b)

▲ Mercat global de refrigeració líquida (b$ US)

 

 

Tanmateix, l'adopció generalitzada dels SMR s'enfronta a importants obstacles. Els reptes reguladors i de fabricació podrien retardar el seu desplegament comercial diversos anys. El govern dels EUA està explorant activament solucions, incloses associacions amb gegants tecnològics per reduir costos i racionalitzar els processos.

 

Una altra manera de reduir la demanda d'energia del centre de dades és optimitzar les càrregues de treball d'intel·ligència artificial. Si canvieu algunes tasques d'IA del núvol a dispositius locals amb models d'IA més petits i que consumeixen menys recursos, es pot reduir el consum global d'energia.

 

El desenvolupament futur dels centres de dades requereix un enfocament polifacètic. És essencial l'adopció d'una combinació energètica diversificada, que inclogui fonts d'energia fiables com l'energia nuclear, alhora que es busquen activament solucions renovables i innovadores com els SMR. A més, l'optimització de les càrregues de treball d'IA als dispositius locals pot promoure encara més la sostenibilitat dels centres de dades.

 

 

 

Enviar la consulta