TL:DR
- Las cargas de trabajo de IA aumentan la densidad de potencia de 5-10 kW/rack a 100 kW/rack, lo que requiere sistemas de refrigeración líquida para gestionar el calor de las GPU de hasta 1,2 kW cada una.
- Centrada en la sostenibilidad, la implementación de fuentes de energía renovables en los data centers globales se ajusta a altos estándares de eficiencia operativa, lo que establece un punto de referencia para las prácticas energéticas de toda la industria.
- Los data centers modernos están diseñados específicamente teniendo en cuenta la IA, lo que permite una interconexión perfecta entre los mercados globales y proporciona un rendimiento eficiente y de baja latencia para diversas cargas de trabajo.
Los líderes empresariales están trabajando para implementar estrategias de IA que ayuden a sus organizaciones a operar de manera más inteligente y eficiente. Pero incluso las personas encargadas de capturar el valor comercial de la IA no siempre comprenden los elementos técnicos que lo generan.
Por muy impresionantes que sean los algoritmos de aprendizaje automático actuales, no son mágicos. Están construidos sobre hardware real que se ejecuta en data centers. De hecho, muchas organizaciones se enfrentan a un desajuste de infraestructura: los data centers que les han prestado un buen servicio en el pasado no han sabido adaptarse a las exigencias de las nuevas cargas de trabajo de IA.
Las empresas necesitan data centers de alto rendimiento diseñados con la IA en mente. Veamos los factores que diferencian a los data centers preparados para la IA de los data centers convencionales.
Los data centers están evolucionando hacia una mayor densidad de potencia.
La adopción generalizada de la IA está impulsando una mayor densidad de potencia en los data centers. La densidad de potencia es una medida de la potencia que se utiliza en un espacio determinado. Las GPU no solo consumen más energía que el hardware tradicional en términos unitarios, sino que también deben estar más juntas entre sí para minimizar la latencia. Por lo tanto, los operadores de data centers consumen mucha más energía dentro del mismo espacio físico del rack para dar soporte a las GPU.
Es sorprendente lo rápido que ha aumentado la densidad de potencia por rack en los data centers. Hasta hace unos años, lo habitual era entre 5 y 10 kW por rack. Ahora, es habitual encontrar densidades de hasta 100 kW/rack. Este rápido cambio ha afectado a muchos de los elementos de infraestructura que se encuentran en los data centers, empezando por los sistemas de refrigeración.
Refrigeración por líquido
Esta nueva tendencia de 100 kW/rack está impulsada por el desarrollo de generaciones de GPU cada vez más densas. Ahora vemos GPU de hasta 1,2 kW cada una, lo que significa que un solo procesador representa aproximadamente una cuarta parte de la densidad de un rack heredado. Además, se están incorporando más GPU en un solo rack para aumentar su capacidad de establecer conexiones y ejecutar modelos más complejos. Este tipo de densidad, concentrada en un solo rack , produce mucho más calor que los racks tradicionales. Por lo tanto, estos racks requieren una solución de refrigeración más potente. Aquí es donde entra en juego la refrigeración líquida.
Dado que los líquidos son mucho más eficientes que el aire para transferir calor, los nuevos métodos de refrigeración que utilizan soluciones acuosas o refrigerantes permiten una densidad de potencia mucho mayor que la de los métodos tradicionales de refrigeración por aire. La implementación de la refrigeración líquida en los data centers será una parte esencial para dar soporte a las cargas de trabajo de GPU de vanguardia y para permitir aplicaciones emergentes que aprovechen la IA.
Sin embargo, la refrigeración líquida no es la solución definitiva para los desafíos de densidad a los que se enfrentan las empresas y no sustituirá por completo a la refrigeración por aire. Hoy en día, incluso los racks muy densos siguen incluyendo un componente refrigerado por aire. Esto se debe a que las empresas deben dar soporte a varios componentes dentro de su pila de IA, y cada uno de esos componentes tendrá diferentes requisitos de refrigeración.
Por ejemplo, los actuales racks de GPU se refrigeran principalmente con líquido, pero siguen utilizando un pequeño porcentaje de refrigeración por aire. Los sistemas de 100 kW/rack mencionados anteriormente pueden tener una distribución 80/20 entre refrigeración líquida y refrigeración por aire. En este caso, solo el componente refrigerado por aire consumiría 20 kW de potencia, varias veces más de lo que habría consumido todo el bastidor hace solo unos años. Por otro lado, los racks de almacenamiento y redes que complementan las cargas de trabajo de computación de la GPU siguen siendo (por el momento) 100 % refrigerados por aire. Las organizaciones deben pensar en cómo integrar la refrigeración líquida sin dejar de tener en cuenta las cargas refrigeradas por aire de alta densidad.
Como proveedor global de servicios de colocación, Equinix comprende la creciente demanda de refrigeración líquida, por lo que estamos diseñando nuestros data centers de alto rendimiento teniendo en cuenta específicamente la infraestructura de refrigeración líquida. Esto permite a nuestros clientes implementar el hardware de IA con facilidad, algo que tradicionalmente habría sido bastante complicado en sus propios data centers locales.
Energía y sustentabilidad
Con el aumento de las demandas de energía y de refrigeración de la IA, muchos líderes empresariales deben considerar cómo pueden soportar estas cargas de trabajo de alta densidad energética sin perder el progreso que han logrado en sus objetivos de sostenibilidad.
El primer punto de partida es garantizar que la energía de las instalaciones provenga de fuentes renovables siempre que sea posible. De hecho, esta ha sido una prioridad fundamental para Equinix en nuestro esfuerzo por brindar soporte a las cargas de trabajo de alta densidad de nuestros clientes. En el 2024, logramos una cobertura de energía renovable del 96 % en toda nuestra cartera de data centers globales. Seguimos trabajando para alcanzar nuestro objetivo de cobertura del 100 % para el año 2030. Para lograrlo, estamos utilizando una estrategia multifacética de energías renovables que incluye la firma de acuerdos de compra de energía (PPA) para apoyar nuevos proyectos eólicos y solares.
También nos hemos fijado el objetivo de reducir nuestras emisiones de gases de efecto invernadero de alcance 1, 2 y 3 en un 90 % para el año 2040, y hemos verificado nuestros objetivos con la Iniciativa de Objetivos Basados en la Ciencia (SBTi). Esta iniciativa permite a los clientes que aprovechan el ecosistema y la infraestructura de Equinix tener la certeza de que sus cargas de trabajo de IA se alinean con sus iniciativas de sostenibilidad, en lugar de obstaculizarlas.
Pero el enfoque en las prácticas sostenibles no se detiene ahí. Los data centers preparados para la IA también deben dar prioridad a la mejora de la eficiencia operativa, lo que puede tener implicaciones a largo plazo en materia de sostenibilidad. En Equinix, estamos trabajando para lograrlo mediante la implementación gradual de las normas ASHRAE A1 Allowable en toda nuestra cartera de data centers. Esta práctica nos permite seguir operando nuestras instalaciones dentro del rango recomendado A1, pero a una temperatura de funcionamiento ligeramente superior a la estándar dentro de ese rango. Esto podría ayudarnos a ahorrar cantidades significativas de energía operativa en toda nuestra huella global a largo plazo.
Además, las cargas de trabajo de la GPU pueden incluso acelerar estos esfuerzos de eficiencia al aprovechar los beneficios inherentes de la refrigeración líquida. Gracias a su mejorada capacidad de conductividad térmica, la refrigeración líquida puede funcionar a temperaturas más altas para enfriar cargas de trabajo de alta densidad energética en comparación con los sistemas refrigerados por aire. A medida que las instalaciones experimentan un aumento del porcentaje total de cargas de trabajo refrigeradas por líquido, esto podría permitirles funcionar de manera más eficiente. Mientras los estándares de temperatura de los chips sigan siendo altos, la tecnología de IA podría permitir que se generalicen prácticas operativas más eficientes, incluida la forma en que se disipa el calor en las instalaciones.
Agua
El impacto de la adopción de la IA en el consumo de agua es otro aspecto importante de la sostenibilidad de los data centers. Aunque las cargas de trabajo de IA utilizan refrigeración “líquida” para enfriar los servidores, esta tecnología no provoca un aumento significativo del consumo de agua. Esto se debe a que utilizan un circuito cerrado conectado a un intercambiador de calor o a una unidad de distribución de refrigerante (CDU).
Sin embargo, el calor aún tiene que ir a algún lugar. Después de pasar por la CDU, el calor se transfiere a un sistema de refrigeración a nivel del edificio, que luego lo elimina por completo de las instalaciones. A nivel de edificio, los operadores de data centers eligen entre dos opciones de refrigeración:
- El enfriamiento por evaporación libera el calor del data center en forma de vapor de agua.
- La refrigeración por aire, también conocida como refrigeración seca, libera el aire caliente del data center.
Figura 1: Sistema de refrigeración a nivel de edificio
La refrigeración por evaporación genera un mayor consumo de agua que la refrigeración por aire, pero también consume mucha menos energía. Un operador global de data centers como Equinix debe sopesar, caso por caso, las ventajas y desventajas del consumo de energía y agua. Por ejemplo, evitamos utilizar el enfriamiento por evaporación en zonas con escasez de agua, para garantizar que haya más agua disponible para el uso de la comunidad.
Como se mencionó anteriormente, dado que la refrigeración líquida en el servidor es más eficiente, una mayor adopción de cargas de trabajo de IA podría permitirnos operar a temperaturas más altas. Esto podría reducir la necesidad de agua en los sistemas de enfriamiento por evaporación y abrir la puerta al uso del enfriamiento seco en más mercados. Además, esto puede brindarnos más oportunidades para participar en proyectos de exportación de calor de data centers, en los que capturamos el calor residual de nuestras instalaciones y lo ponemos a disposición para calentar hogares y empresas en las comunidades locales donde operamos.
Los data centers preparados para la IA son data centers interconectados.
Los líderes empresariales reconocen cada vez más que la IA es mucho más que grandes data centers centrales con alta capacidad de GPU. Existen diferentes tipos de data centers preparados para la IA que se utilizan para distintos propósitos. La IA distribuida se ha convertido en la norma, y las empresas necesitan capturar datos de muchas fuentes diferentes y respaldar la inferencia cerca de los usuarios en el edge. También necesitarán conectarse con un ecosistema de socios para obtener los datos, los modelos y la infraestructura que necesitan para impulsar el éxito de la IA.
Por todas estas razones, la conectividad es una parte esencial de lo que hace que los data centers estén preparados para la IA. Los data centers de alto rendimiento están ubicados estratégicamente cerca de centros de población donde es probable que se encuentren los usuarios finales y las fuentes de datos, lo que permite la conectividad de baja latencia que exigen las cargas de trabajo de inferencia. Además, estos data centers se han convertido en hubs digitales donde los socios del ecosistema se reúnen e interconectan. Esto significa que las empresas no tienen que elegir entre tener data centers en las ubicaciones adecuadas para dar soporte a sus diferentes cargas de trabajo de IA y tener un fácil acceso a sus socios del ecosistema de IA. El proveedor adecuado de colocación puede ayudarles a satisfacer ambas necesidades.
Por último, un data center preparado para la IA debe ofrecer capacidades de red avanzadas para que el hardware de IA funcione a pleno rendimiento. Por ejemplo, las GPU son muy sensibles a la latencia y, por lo tanto, están diseñadas para conectarse punto a punto. La cantidad de ancho de banda de interconexión física necesaria para que esto sea posible es astronómica. Solo las instalaciones diseñadas con espacio dedicado en el techo o bajo el piso podrán soportar el gran volumen de fibra que requieren los clústeres de IA.
Los data centers de colocación IBX® de Equinix están ubicados en 76 mercados de todo el mundo, por lo que puede instalar su infraestructura de IA dondequiera que la necesite. Además, Equinix cuenta con más de 10,000 clientes, entre los que se incluyen desde proveedores de nube consolidados hasta especialistas emergentes en IA. Cuando se comparte ubicación con tantos proveedores de servicios diferentes, es fácil encontrar los socios adecuados para su estrategia de IA e interconectarse con ellos para intercambiar datos de forma rápida y segura.
En Equinix, creemos que las GPU y otros componentes de hardware avanzados son los motores que impulsan el avance de la IA. Los data centers de alto rendimiento son salas de máquinas donde el hardware puede operar a pleno rendimiento. Sin el hardware adecuado y los data centers que le brinden soporte, la IA se queda estancada.
Descubra cómo los data centers de alto rendimiento están impulsando el avance de la IA: Lee el informe técnico El motor de la IA que impulsa la innovación a gran escala.
