O rápido avanço da IA está transformando diversos setores da economia. As empresas de hoje precisam de rapidez na tomada de decisões, resiliência operacional e experiências personalizadas para manter a vantagem competitiva. Elas também precisam atender às expectativas em constante mudança dos consumidores e das empresas em relação ao desempenho aceitável.
A infraestrutura de IA baseada em proximidade ao edge é essencial para atender a essas normas cada vez mais exigentes. O cenário da IA está evoluindo, passando do treinamento de modelos de IA em locais centralizados para um paradigma mais distribuído que inclui inferência de carga de trabalho no edge. Isso se deve, em parte, ao surgimento da inferência de IA agêntica, que toma decisões no edge e depende de baixa latência.
Os modelos de IA mais recentes são mais especializados e menores, tornando possível o treinamento no edge. As empresas estão usando esses modelos especializados específicos para cada domínio porque eles são mais adequados para uso em setores, funções e conjuntos de dados proprietários específicos.
Todos esses fatores tornam o edge um local de computação mais estratégico, dada sua proximidade com o local onde os dados são gerados, armazenados e processados.
Onde está seu edge principal?
Os negócios precisam repensar a localização do seu edge. Na verdade, existem vários edges onde uma empresa pode optar por realizar inferências de IA. O metro edge está ganhando força como um local crucial para cargas de trabalho de inferência de IA, pois oferece o melhor equilíbrio entre baixa latência, privacidade de dados e eficiência de custos.
A escolha do metro edge envolve a transferência dos dados de inferência para uma instalação diferente, como um data center de colocation, dentro da mesma área geográfica concentrada que as fontes de dados. Essa abordagem agrega cargas de trabalho de inferência em um único local com uma latência típica inferior a 10 milissegundos e elimina a necessidade de as empresas operarem infraestruturas privadas dentro de suas próprias instalações.
Os tipos de aplicativos também influenciam a identificação dos locais de edge primários, pois a tolerância à latência varia. As aplicações voltadas para máquinas normalmente exigem alta velocidade e baixa latência. Com aplicativos voltados para o ser humano, alguns milissegundos extras de atraso nem seriam percebidos. Um radiologista que procura registros médicos não precisa de uma resposta imediata, diferentemente de um carro autônomo que tenta evitar pedestres.
Requisitos específicos do setor, como onde os dados são gerados e processados e como as fontes de dados são acessadas, também determinam a localização do(s) edge(s) de uma empresa. As empresas podem precisar atender aos requisitos de latência de edge para uma variedade de funções:
- Empresas de logística: Acompanhar as entregas, gerenciar as rotas de entrega, otimizar as operações do armazém e monitorar e garantir a segurança da carga.
- Distribuidoras de conteúdo: Fornecer recomendações personalizadas em tempo real e garantir streaming de baixa latência, jogos sem atrasos e experiências imersivas de RA/RV.
- Cidades inteligentes: Use análise de vídeo em tempo real e processamento de dados de sensores para gerenciamento de tráfego, detecção de crimes e resposta a emergências.
- Organizações de saúde: Garanta monitoramento contínuo, cirurgias robóticas remotas sem interrupções e análise rápida de dados para diagnósticos mais rápidos e tratamentos personalizados.
Os casos de uso no edge continuarão a evoluir e crescer, exigindo que as empresas criem projetos para o presente e para o futuro.
Até 2029, 50% das empresas estarão usando computação edge, contra 20% em 2024.[1]”Gartner® Predicts 2025: As plataformas de computação de edge irão acelerar a IA de edge
As opções de posicionamento de dados afetam o custo e a conformidade
O local onde as empresas optam por executar cargas de trabalho de IA e armazenar dados afeta as taxas de saída e as estruturas de custos (OPEX versus CAPEX). Também impacta o desempenho, a latência e os requisitos de infraestrutura de rede.
O volume de dados gerados diariamente no edge pode aumentar rapidamente. Por exemplo,
- Fábrica inteligente: 1 petabyte
- Avião: 4 terabytes
- Carro autônomo: 3 terabytes
Mover esses dados para um local centralizado para inferência de IA afeta significativamente a latência, o custo e a largura de banda, tornando o edge a escolha óbvia.
Além disso, leis de proteção de dados e privacidade estão agora em vigor em 144 países, com mais a caminho.[2] Algumas regulamentações são complexas e exigem uma análise cuidadosa sobre onde armazenar os dados. Por exemplo, você não pode armazenar dados coletados na Alemanha em uma nuvem AWS nos EUA; eles devem permanecer na Alemanha. É uma das razões pelas quais você precisa de uma infraestrutura distribuída para IA.
Elevando o nível da inovação em IA no edge
Vamos explorar dois exemplos de empresas que estão inovando com IA no edge e implantando infraestrutura de IA para colaboração em tempo real e conectividade de alta velocidade com clientes e parceiros.
A Nanyang Biologics, uma startup de biotecnologia especializada na descoberta de medicamentos impulsionada por IA, aproveitou a interconexão definida por software Equinix Fabric® para computação edge, a fim de permitir a colaboração em tempo real com parceiros de pesquisa. Isso aumentou a velocidade e a precisão a um custo menor.
Assista a este breve estudo de caso em vídeo da Nanyang Biologics para saber mais sobre como a infraestrutura de IA escalável no edge oferece suporte ao treinamento de modelos de IA e acelera a descoberta de medicamentos.
A Alembic é uma empresa de inteligência de marketing SaaS que fornece aos clientes insights baseados em dados sobre suas atividades de marketing, permitindo-lhes otimizar gastos e melhorar o movimento do funil de vendas. Eles posicionaram uma pilha de infraestrutura de IA mais próxima dos clientes para permitir inferência de alto desempenho no edge. A Alembic também aproveitou o ecossistema de provedores de serviços de rede (NSPs) da Equinix e o Equinix Fabric para obter conectividade de alta velocidade com seus clientes e parceiros, oferecendo, assim, um produto de melhor desempenho.
Assista a este breve vídeo de estudo de caso da Alembic para descobrir como eles estão possibilitando o marketing baseado em dados por meio da análise de dados com inteligência artificial.
Outras indústrias que estão inovando com IA no edge incluem:
- Serviços financeiros para estratégia de trading e detecção de fraudes.
- Mídia e entretenimento para criação de conteúdo digital e desenvolvimento de jogos.
- Veículos autônomos para detecção de pedestres e sinais de trânsito e monitoramento de faixas.
- Robótica para manufatura, construção e navegação.
Quatro etapas para priorizar a proximidade no edge
A transição para uma estratégia de infraestrutura que prioriza a proximidade requer uma abordagem deliberada e integrada. Recomendamos que você siga estas etapas para criar seu roteiro.
- Primeiro, faça uma auditoria da sua infraestrutura atual de IA. É importante mapear os fluxos de dados e identificar os gargalos de desempenho causados pela latência.
- Em seguida, defina seus requisitos de edge: Avalie as demandas das aplicações em tempo real, incluindo latência, largura de banda e conformidade. Você também vai querer revisar os requisitos da sua empresa para conectividade, computação e armazenamento de dados de alto desempenho.
- Agora você está pronto para criar uma estratégia de dados flexível, multicloud e multiprovedor que permite distribuir cargas de trabalho de maneira inteligente para criar o equilíbrio certo entre infraestruturas edge e centralizadas e implantar infraestruturas específicas para cada país ou região para fins de conformidade.
- Por fim, aproveite o ecossistema de parceiros de IA neutro e interconectado para acessar a vasta gama de parceiros necessários para dar suporte às cargas de trabalho de IA.
Implemente sua infraestrutura de IA no edge
A infraestrutura distribuída ajuda as empresas a acelerar a inovação em IA e a preparar suas estratégias de IA para o futuro. Embora tenhamos nos concentrado no edge neste blog, sua estratégia de infraestrutura de IA precisa incluir uma combinação de infraestrutura em cloud e edge e uma rede robusta para conectar com segurança todos os seus recursos.
Os data centers de IA da Equinix estão estrategicamente localizados nos mercados mais conectados do mundo para ajudar as empresas a preparar suas operações para o futuro. Nossa presença global abrange mais de 270 data centers de colocation interconectados em 76 metrópoles em todo o mundo, garantindo acesso a todos os principais provedores de cloud por meio de nosso portfólio líder do setor com mais de 220 rampas de acesso à cloud e proximidade a várias fontes de dados.
Milhares de provedores de dados, cloud, rede, tecnologia de IA e GPU como serviço fazem parte do robusto ecossistema digital da Equinix. As empresas podem usar o Equinix Fabric para criar conexões sob demanda, escaláveis com parceiros do ecossistema e entre sua própria infraestrutura de IA em diferentes locais.
Para saber mais sobre a importância da proximidade, leia nosso white paper sobre o paradoxo da proximidade.
[1] “Gartner Predicts 2025: Edge Computing Platforms Will Accelerate Edge AI,” Gartner®, November 28, 2024.
GARTNER is a registered trademark and service mark of Gartner, Inc. and/or its affiliates in the U.S. and internationally and is used herein with permission. All rights reserved.
[2] “Data protection and privacy laws now in effect in 144 countries,” IAPP, January 28, 2025.