TL:DR
- As cargas de trabalho de IA elevam a densidade de potência de 5–10 kW por rack para até 100 kW por rack, exigindo sistemas de resfriamento líquido para dissipar o calor de GPUs que podem atingir até 1,2 kW cada.
- Com foco em sustentabilidade, a implementação de fontes de energia renovável em data centers globais está alinhada a elevados padrões de eficiência operacional, estabelecendo uma referência para as práticas energéticas em todo o setor.
- Data centers modernos são projetados desde a origem com foco em IA, viabilizando interconexão fluida entre mercados globais para oferecer desempenho eficiente e de baixa latência a diferentes cargas de trabalho.
Os líderes empresariais estão implementando estratégias de IA para tornar suas organizações mais inteligentes e eficientes. Mas mesmo os responsáveis por capturar o valor de negócio da IA nem sempre compreendem os elementos técnicos que viabilizam esse valor.
Por mais impressionantes que sejam os algoritmos de aprendizagem de máquina atuais, eles não são mágicos. Eles se apoiam em uma infraestrutura física concreta, rodando em hardware real dentro de data centers. Na prática, muitas organizações estão enfrentando um descompasso de infraestrutura: Os data centers que as atenderam bem no passado não acompanharam as exigências das novas cargas de trabalho de IA.
As empresas precisam de data centers de alto desempenho, projetados desde a origem para atender às demandas de IA. Vamos analisar os fatores que diferenciam data centers preparados para IA dos data centers convencionais.
Os data centers estão evoluindo para uma maior densidade de energia
A adoção mais ampla de IA está impulsionando maior densidade de potência nos data centers. Densidade de potência é a medida de quanta energia é utilizada em um determinado espaço. Não apenas as GPUs consomem mais energia do que o hardware tradicional por unidade, como também precisam ser instaladas mais próximas umas das outras para minimizar a latência. Portanto, os operadores de data centers utilizam muito mais energia dentro do mesmo espaço físico de rack para suportar GPUs.
É impressionante como a densidade de energia por rack aumentou rapidamente nos data centers. Até poucos anos atrás, o padrão era 5–10 kW/rack. Agora, vemos densidades de até 100 kW/rack com regularidade. Essa mudança acelerada impactou diversos elementos de infraestrutura presentes nos data centers, começando pelos sistemas de resfriamento
Resfriamento a líquido
Essa nova tendência de 100 kW por rack é impulsionada pelo desenvolvimento de gerações de GPUs cada vez mais densas. Atualmente, estamos vendo GPUs de até 1,2 kW cada, o que significa que um único processador pode representar aproximadamente um quarto da densidade de um rack legado inteiro. Além disso, quantidades maiores de GPUs estão sendo integradas em um único footprint de rack para acelerar sua capacidade de estabelecer conexões e executar modelos mais complexos. Esse nível de densidade concentrado em um único rack gera muito mais calor do que os racks legados. Portanto, esses racks precisam de uma solução de resfriamento mais potente. É aqui que o resfriamento a líquido entra em cena.
Como o líquido é muito mais eficiente na transferência de calor do que o ar, novos métodos de resfriamento que utilizam soluções à base de água ou refrigerantes permitem densidades de potência muito mais elevadas do que os métodos tradicionais de resfriamento a ar. A implementação do resfriamento líquido em data centers será uma parte essencial para suportar workloads avançados de GPU e viabilizar aplicações emergentes que utilizam IA.
No entanto, o resfriamento a líquido não é uma solução completa para os desafios de densidade enfrentados pelas empresas e não substituirá totalmente o resfriamento a ar. Hoje, até racks muito densos ainda incluem um componente resfriado a ar.
Isso ocorre porque as empresas precisam dar suporte a diversos componentes dentro de sua pilha de IA, e cada um desses componentes terá requisitos de resfriamento diferentes. Os sistemas de 100 kW por rack mencionados anteriormente podem ter uma proporção de 80/20 entre resfriamento líquido e resfriamento a ar. Nesse caso, apenas o componente resfriado a ar consumiria 20 kW de energia — várias vezes mais do que o rack inteiro consumiria há apenas alguns anos. Por outro lado, os racks de armazenamento e de rede que complementam os workloads de GPU ainda são (por enquanto) 100% resfriados a ar. As organizações precisam considerar como integrar o resfriamento líquido, mantendo ao mesmo tempo a capacidade de lidar com cargas de alta densidade resfriadas a ar.
Como provedor global de colocation, a Equinix entende a crescente demanda por resfriamento líquido e está projetando seus data centers de alto desempenho especificamente com infraestrutura de resfriamento líquido em mente. Como provedor global de colocation, a Equinix entende a crescente demanda por resfriamento líquido e está projetando seus data centers de alto desempenho especificamente com infraestrutura de resfriamento líquido em mente.
Energia e sustentabilidade
Com a crescente demanda de energia e resfriamento por parte da IA, muitos líderes corporativos precisam considerar como podem suportar essas cargas de trabalho densas em energia sem apagar o progresso que fizeram em direção às suas metas de sustentabilidade.
O ponto principal para começar é garantir que a energia da instalação seja proveniente de fontes renováveis sempre que possível. Na verdade, essa tem sido uma prioridade máxima para a Equinix enquanto trabalhamos para dar suporte aos workloads de alta densidade de nossos clientes. Em 2024, alcançamos 96% de cobertura por energia renovável em todo o nosso portfólio global de data centers. Continuamos trabalhando para alcançar nossa meta de 100% de cobertura até o ano de 2030. Para atingir esse objetivo, estamos adotando uma estratégia multifacetada de energia renovável, que inclui a assinatura de contratos de compra de energia (PPAs) para apoiar novos projetos de energia solar e eólica.
Também estabelecemos a meta de reduzir nossas emissões de gases de efeito estufa de Escopo 1, 2 e 3 em 90% até 2040, e tivemos nossas metas verificadas pela Science Based Targets Initiative (SBTi). Esse esforço permite que os clientes que utilizam o ecossistema e a infraestrutura da Equinix tenham a confiança de que seus workloads de IA estão alinhados com suas iniciativas de sustentabilidade, em vez de prejudicá-las.
Mas o foco em práticas sustentáveis não para por aí. Data centers prontos para IA também devem priorizar a melhoria da eficiência operacional, o que pode ter implicações de sustentabilidade a longo prazo. Na Equinix, estamos buscando isso ao implementar gradualmente as normas ASHRAE A1 Permitido em nosso portfólio de data centers. Essa prática nos permite continuar operando nossas instalações dentro da faixa recomendada A1, mas com uma temperatura de funcionamento ligeiramente mais alta dentro dessa faixa do que o padrão. Isso pode nos ajudar a economizar quantidades significativas de energia operacional em toda a nossa presença global a longo prazo.
Além disso, cargas de trabalho em GPU podem até acelerar esses esforços de eficiência ao aproveitar os benefícios inerentes do resfriamento a líquido. Devido às suas capacidades aprimoradas de condutividade térmica, o resfriamento líquido pode operar com temperaturas mais altas para resfriar workloads de alta densidade de energia do que os sistemas resfriados a ar. À medida que as instalações observam um aumento na porcentagem geral de workloads resfriados a líquido, isso pode permitir que operem de forma mais eficiente. Contanto que os padrões de temperatura dos chips continuem altos, a tecnologia de IA pode possibilitar que práticas operacionais mais eficientes se tornem usuais, inclusive na maneira como o calor é rejeitado da instalação.
Água
O impacto da adoção de IA no consumo de água é outro aspecto importante da sustentabilidade dos data centers. Embora os workloads de IA utilizem resfriamento “líquido” para refrigerar os servidores, a tecnologia não provoca aumentos significativos no consumo de água. Isso ocorre porque eles utilizam um circuito fechado conectado a um trocador de calor ou a uma unidade de distribuição de refrigerante (CDU).
No entanto, o calor ainda precisa ir para algum lugar. Após passar pela CDU, o calor é transferido para um sistema de resfriamento no nível do edifício, que então remove o calor da instalação completamente. No nível do próprio, os operadores de data centers escolhem entre duas opções de resfriamento:
- O resfriamento evaporativo libera o calor do data center na forma de vapor de água.
- O resfriamento a ar, também conhecido como resfriamento seco, libera ar quente do data center.
Figura 1: Sistema de Resfriamento no Nível do Prédio
O resfriamento por evaporação gera um consumo maior de água do que o resfriamento a ar, mas também consome muito menos energia. Um operador global de data center como a Equinix deve pesar os tradeoffs entre consumo de energia e água caso a caso. O resfriamento evaporativo libera o calor do data center na forma de vapor de água.
Como mencionado anteriormente, devido à maior eficiência do resfriamento líquido no nível do servidor, a adoção crescente de workloads de IA pode nos permitir operar com temperaturas mais elevadas. Isso pode reduzir a necessidade de consumo de água nos sistemas de resfriamento evaporativo e possibilitar o uso de resfriamento seco em mais mercados. Além disso, isso pode nos oferecer mais oportunidades de participar de projetos de aproveitamento do calor dos data centers, nos quais capturamos o calor residual de nossas instalações e o disponibilizamos para aquecer residências e empresas nas comunidades locais em que operamos.
Data centers prontos para IA são data centers interconectados.
Os líderes empresariais reconhecem cada vez mais que a IA vai além de grandes data centers centrais com alta capacidade de GPU. Existem diversos tipos de data centers prontos para IA, usados para diferentes propósitos. A IA distribuída tornou-se a norma, e as empresas precisam capturar dados de diversas fontes e dar suporte à inferência próxima aos usuários, na edge. Elas também precisarão se conectar a um ecossistema de parceiros para obter os dados, modelos e a infraestrutura necessários para impulsionar o sucesso da IA.
Por todas essas razões, a conectividade é uma parte essencial do que torna os data centers prontos para IA. Data centers de alto desempenho estão estrategicamente localizados próximos a centros populacionais, onde usuários finais e fontes de dados costumam estar, permitindo assim a conectividade de baixa latência que as cargas de trabalho de inferência exigem. Além disso, esses data centers se tornaram hubs digitais onde os parceiros do ecossistema se reúnem e se interconectam entre si. Isso significa que as empresas não precisam escolher entre ter data centers nos locais certos para suportar suas diferentes cargas de trabalho de IA e ter fácil acesso aos seus parceiros do ecossistema de IA. O provedor de colocation adequado pode ajudá-las a atender a ambas as necessidades.
Por fim, um data center pronto para IA precisa oferecer recursos avançados de rede para manter o hardware de IA funcionando em seu pleno potencial. Por exemplo, as GPUs são altamente sensíveis à latência e, por isso, são projetadas para serem conectadas ponto a ponto. A quantidade de largura de banda de interconexão física necessária para que isso aconteça é astronômica. Apenas instalações projetadas com espaço dedicado acima ou abaixo do piso poderão suportar o enorme volume de fibras exigido pelos clusters de IA.
Os data centers de colocation Equinix IBX® estão localizados em 76 mercados ao redor do mundo, permitindo que você implemente sua infraestrutura de IA onde for necessário. Além disso, a Equinix abriga mais de 10.000 clientes, que vão desde provedores de nuvem consolidados até especialistas em IA em ascensão. Quando você está em colocation com tantos provedores de serviços diferentes, é fácil encontrar os parceiros certos para sua estratégia de IA e se interconectar com eles para trocar dados de forma rápida e segura.
Na Equinix, acreditamos que GPUs e outros hardwares avançados são os motores que impulsionam a IA. Data centers de alto desempenho são as casas de força onde o hardware pode operar em seu pleno potencial. Sem o hardware adequado e os data centers certos para suportá-lo, a IA não vai para lugar nenhum.
Descubra como os data centers de alto desempenho estão impulsionando a IA: Leia o white paper The engine of AI powering innovation at scale.
