TL:DR
- Las cargas de trabajo de IA aumentan la densidad de potencia de 5-10 kW/rack a 100 kW/rack, lo que requiere sistemas de refrigeración líquida para gestionar el calor de GPUs de hasta 1,2 kW cada una.
- Centrada en la sostenibilidad, la implementación de fuentes de energía renovables en los data centers globales se ajusta a altos estándares de eficiencia operativa, y establece un punto de referencia para las prácticas energéticas de todo el sector.
- Los data centers actuales están diseñados específicamente con la IA en mente, lo que ofrece una interconexión perfecta entre los mercados globales para proporcionar rendimiento eficiente y de baja latencia para diversas cargas de trabajo.
Los líderes empresariales están trabajando para implementar estrategias de IA que ayuden a sus organizaciones a operar de forma más inteligente y eficiente. Sin embargo, incluso las personas encargadas de capturar el valor comercial de la IA no siempre conocen los elementos técnicos que posibilitan ese valor.
Por impresionantes que sean los algoritmos de aprendizaje automático actuales, no son mágicos. Se han creado sobre la base del hardware que albergan los data centers. De hecho, muchas organizaciones se enfrentan a un desajuste de infraestructura: los data centers que funcionaron bien en el pasado no han podido satisfacer las demandas de las nuevas cargas de trabajo de la IA.
Las empresas necesitan data centers de alto rendimiento diseñados con la IA en mente. Analicemos los factores que diferencian a los data centers preparados para IA de los data centers convencionales.
Los data centers están evolucionando hacia una mayor densidad de energía
La adopción más amplia de la IA está impulsando una mayor densidad de energía en los data centers. La densidad de potencia es una unidad de medida que refleja cuánta energía se utiliza en un espacio determinado. Las GPU no solo consumen más energía por unidad que el hardware tradicional, sino que también es necesario situarlas más próximas unas de otras para minimizar la latencia. Por lo tanto, los operadores de data centers utilizan mucha más energía para que funcionen las GPU en el mismo espacio de rack.
Es sorprendente la rapidez con la que ha aumentado la densidad de potencia por rack en los data centers. Hasta hace unos años, el estándar se situaba entorno a 5-10 kW/rack. Actualmente, es habitual que la densidad sea muy alta; por ejemplo, 100 kW/rack. Este rápido cambio ha afectado a muchos de los elementos de la infraestructura de los data centers, empezando por los sistemas de refrigeración.
Refrigeración líquida
Esta nueva tendencia de 100 kW/rack está impulsada por el desarrollo de generaciones de GPU cada vez más densas. Actualmente, vemos GPUs de hasta 1,2 kW cada una, lo que significa que un solo procesador representa aproximadamente una cuarta parte de la densidad de un rack tradicional. Además, se están incorporando mayores cantidades de GPU en un único rack para acelerar la capacidad de realizar conexiones y ejecutar modelos más complejos. Esta cantidad de densidad en un solo rack produce mucho más calor que los racks tradicionales. Por lo tanto, estos racks necesitan una solución de refrigeración más potente. Aquí es donde entra en juego la refrigeración líquida.
Dado que el líquido es mucho más eficiente que el aire para disipar el calor, los nuevos métodos de enfriamiento que utilizan soluciones con agua o refrigerantes permiten una densidad de potencia mucho mayor que los métodos tradicionales de enfriamiento por aire. La implementación de refrigeración líquida en los data centers será una parte esencial para sustentar cargas de trabajo de GPU de última generación y habilitar aplicaciones emergentes que aprovechen la IA.
Sin embargo, la refrigeración líquida no es la panacea si tenemos en cuenta los retos de densidad a los que se enfrentan las empresas, y no reemplazará por completo la refrigeración por aire. Hoy en día, incluso los racks más densos aún incluyen un componente refrigerado por aire. Esto se debe a que las empresas deben disponer de varios componentes dentro de su pila de IA, y cada uno de esos componentes tiene diferentes requisitos de refrigeración.
Por ejemplo, la mayoría de los racks de GPU actuales se refrigeran con líquido, pero siguen utilizan un pequeño porcentaje de refrigeración por aire. La proporción de refrigeración con líquido y refrigeración por aire de los sistemas de 100 kW/rack mencionados anteriormente puede ser 80/20. En este caso, el componente refrigerado por aire consumiría solo 20 kW de energía, varias veces más de lo que habría consumido todo el rack hace apenas unos años. Por otro lado, los racks de almacenamiento y redes que complementan las cargas de trabajo de computación de GPU aún se refrigeran con aire al 100 % (al menos, por el momento). Las organizaciones deben pensar en cómo integrar la refrigeración líquida sin olvidarse de las cargas refrigeradas por aire de alta densidad.
Como proveedor global de servicios de colocation, Equinix está al tanto de la creciente demanda de refrigeración líquida y diseña sus data centers de alto rendimiento teniendo en mente la infraestructura de refrigeración líquida. Esto permite a nuestros clientes implementar hardware de IA con facilidad, algo que tradicionalmente ha sido bastante difícil en los data centers locales.
Energía y sostenibilidad
Con las crecientes demandas de energía y refrigeración de la IA, muchos líderes empresariales deben considerar cómo sustentar estas cargas de trabajo que consumen mucha energía sin eliminar el progreso que han logrado con respecto a sus objetivos de sostenibilidad.
El primer paso es garantizar que la energía de las instalaciones esté sustentada por fuentes de energía renovables siempre que sea posible. De hecho, esta ha sido una prioridad máxima para Equinix, ya que trabaja para sustentar las cargas de trabajo de alta densidad de sus clientes. En 2024, logramos una cobertura de energía renovable del 96 % en nuestra red global de data centers. Seguimos trabajando para alcanzar nuestro objetivo de cobertura del 100 % en el año 2030. Para lograrlo, utilizamos una estrategia multidimensional de energía renovable que incluye la firma de acuerdos de compra de energía (PPA, por sus siglas en inglés) para apoyar nuevos proyectos de energía eólica y solar.
También nos hemos fijado el objetivo de reducir nuestras emisiones de gases de efecto invernadero de alcance 1, 2 y 3 en un 90% en 2040, y hemos verificado nuestros objetivos con la Science Based Targets Initiative (SBTi). Esta acción permite a los clientes que aprovechan el ecosistema y la infraestructura de Equinix tener la seguridad de que sus cargas de trabajo de IA se ajustan a sus iniciativas de sostenibilidad en lugar de obstaculizarlas.
Sin embargo, la relevancia de las prácticas sostenibles va más allá. Los data centers preparados para IA también deberían priorizar la mejora de la eficiencia operativa, lo que puede tener implicaciones de sostenibilidad a largo plazo. En Equinix, queremos lograrlo mediante la implementación gradual de los estándares ASHRAE A1 Allowable en nuestra red de data centers. Esta práctica nos permite seguir gestionando nuestras instalaciones dentro del rango recomendado A1, pero a una temperatura de funcionamiento ligeramente más alta que la estándar (dentro de ese rango). A largo plazo, esto podría ayudarnos a ahorrar cantidades significativas de energía operativa en toda nuestra área de influencia global.
Además, las cargas de trabajo de GPU pueden incluso acelerar estas iniciativas de eficiencia aprovechando las ventajas de la refrigeración líquida. Gracias a sus capacidades mejoradas de conductividad térmica, el enfriamiento líquido puede funcionar con temperaturas más altas que las de los sistemas enfriados por aire para refrigerar cargas de trabajo con alta densidad de energía. Ahora que las instalaciones registran un crecimiento del porcentaje general de cargas de trabajo refrigeradas por líquido, esto podría permitirles operar de manera más eficiente. Mientras los estándares de temperatura de los chips se mantengan altos, la IA podría permitir que prácticas operativas más eficientes pasen a ser comunes, incluida la forma en que se disipa el calor de las instalaciones.
Agua
El impacto de la adopción de la IA en el consumo de agua es otro aspecto importante de la sostenibilidad del data center. Si bien las cargas de trabajo de la IA aprovechan el enfriamiento líquido para refrigerar los servidores, la tecnología no aumenta significativamente el consumo de agua. Esto se debe a que utilizan un circuito cerrado que está conectado a un intercambiador de calor o unidad de distribución de refrigerante (CDU, por sus siglas en inglés).
De todas formas, el calor tiene que ir a algún sitio. Después de pasar por la CDU, el calor se transfiere a un sistema de enfriamiento a nivel de edificio que luego elimina el calor de la instalación por completo. A nivel de edificio, los operadores de data centers eligen entre dos opciones de refrigeración:
- El enfriamiento por evaporación libera calor del data center en forma de vapor de agua.
- El enfriamiento por aire, también conocido como enfriamiento en seco, libera aire caliente del data center.
Figura 1: Sistema de refrigeración a nivel de edificio
El enfriamiento por evaporación genera mayor consumo de agua que el enfriamiento por aire, pero consume mucha menos energía. Un operador global de data centers como Equinix debe evaluar las ventajas y desventajas del consumo de energía y agua caso por caso. Por ejemplo, evitamos utilizar enfriamiento por evaporación en áreas con estrés hídrico para garantizar que haya más agua disponible para la comunidad local.
Como se ha mencionado anteriormente, debido a que la refrigeración líquida a nivel de servidor es más eficiente, una mayor adopción de cargas de trabajo de IA puede permitirnos operar a temperaturas más altas. Esto podría reducir la necesidad de consumo de agua en los sistemas de enfriamiento por evaporación y abrir la puerta al uso de enfriamiento en seco en más mercados. Además, esto puede ofrecernos más oportunidades de participar en proyectos de exportación de calor de data centers, que consisten en capturar el calor residual de nuestras instalaciones para que esté disponible para calentar hogares y empresas en las comunidades en las que operamos.
Los data centers preparados para IA son data centers interconectados
Los líderes empresariales reconocen cada vez más que la IA implica mucho más que grandes data centers con alta capacidad de GPU. Existen varios tipos de data centers preparados para la IA, y se utilizan con distintos propósitos. La IA distribuida se ha convertido en la norma, y las empresas necesitan capturar datos de muchas fuentes y sustentar la inferencia cerca de los usuarios, en el edge. También requerirán conectarse a un ecosistema de partners para obtener los datos, los modelos y la infraestructura que necesitan para impulsar el éxito de la IA.
Por todas estas razones, la conectividad es esencial para que los data centers estén preparados para la IA. Los data centers de alto rendimiento están ubicados estratégicamente cerca de centros de población donde es probable que se encuentren los usuarios finales y las fuentes de datos, lo que ofrece la conectividad de baja latencia que exigen las cargas de trabajo de inferencia. Además, estos data centers se han convertido en nodos digitales donde los partners del ecosistema se reúnen y se interconectan entre sí. Esto significa que las empresas no tienen que elegir entre tener data centers en las ubicaciones adecuadas para sustentar distintas cargas de trabajo de IA o disponer de fácil acceso a sus partners de ecosistema de IA. El proveedor de servicios de colocation adecuado puede ayudarles a satisfacer ambas necesidades.
Por último, un data center preparado para IA debe proporcionar funciones de red avanzadas para mantener el hardware de IA funcionando a su máxima potencia. Por ejemplo, las GPU son muy sensibles a la latencia y, por lo tanto, están diseñadas para conectarse punto a punto. La cantidad de ancho de banda de interconexión necesaria para que esto suceda es gigantesca. Solo las instalaciones diseñadas con espacios superiores o debajo del suelo podrán sustentar el gran volumen de fibra que demandan los clústeres de IA.
Los data centers de colocation IBX® de Equinix están ubicados en 76 mercados en todo el mundo, por lo que puede instalar su infraestructura de IA allí donde la necesite. Además, Equinix cuenta con más de 10.000 clientes, desde proveedores de nube establecidos hasta especialistas en IA emergentes. Cuando se trabaja con tantos proveedores de servicios, es fácil encontrar los partners adecuados para la estrategia de IA e interconectarse con ellos para intercambiar datos de forma rápida y segura.
En Equinix, creemos que las GPU y otros dispositivos avanzados de hardware son los motores que impulsan la IA. Los data centers de alto rendimiento son las salas de máquinas donde el hardware puede funcionar a su máxima potencia. Sin el hardware y los data centers adecuados para sustentar ese hardware, la IA se quedaría estancada.
Descubra cómo los data centers de alto rendimiento impulsan la IA: lea el informe técnico El motor de la IA que impulsa la innovación a gran escala.
