O advento do ChatGPT tornou a IA generativa popular. Muitas organizações estão se concentrando em acelerar suas iniciativas de IA para melhor atender clientes, colaboradores e parceiros. Todas as funções organizacionais (incluindo vendas, marketing, finanças, suporte, operações, TI e desenvolvimento de produtos) buscam usar a IA para simplificar e aprimorar seus fluxos de trabalho internos.
A questão é: essas organizações terão as habilidades, os sistemas e a infraestrutura necessários para lidar com a enorme disrupção que a IA gerará em seus modelos operacionais? A criação de soluções de IA escaláveis exige que as empresas acomodem o consumo, o compartilhamento, o armazenamento e o processamento de conjuntos de dados enormes e diversificados, ao mesmo tempo em que mantêm a sustentabilidade em mente. Nós nos referimos a isso como uma IA de nível de produção.
Na pesquisa Equinix 2023 Global Tech Trends Survey (GTTS), aprendemos que 42% dos líderes de TI acreditam que sua infraestrutura de TI existente não está totalmente preparada para acomodar a crescente adoção de IA. Além disso, 41% duvidam da capacidade de sua equipe de implementar a tecnologia. Participar de ecossistemas digitais e escolher os parceiros de tecnologia certos pode ser fundamental para ajudar as organizações a implantar a infraestrutura correta nos lugares adequados, quando mais precisam. Efetivamente, seu ecossistema se torna sua infraestrutura.
Equinix 2023 Global Tech Trends Survey
Os benefícios e desafios das novas tecnologias digitais e estratégias de preparação para o futuro
Baixe agora (em inglês)A implantação de IA de nível de produção introduz novos desafios
As equipes de TI estão começando a auxiliar quanto ao uso de tecnologias de IA em suas organizações. Estão enfrentando um conjunto totalmente novo de desafios em torno de custo, desempenho, compartilhamento de dados, lacunas de habilidades e sustentabilidade.
Modelos de custos previsíveis
As organizações têm as seguintes preocupações relacionadas a custo no que tange à IA:
até meados desta década, a maioria dos dados será gerada fora do data center. O custo para fazer backhaul de dados gerados na edge e enviados para o núcleo pode ser proibitivo. Se os dados são gerados na cloud, faz sentido processar os dados na cloud. No entanto, se os dados forem gerados na edge, devem ser armazenados e processados na edge. Assim, as arquiteturas centralizadas de IA não serão dimensionadas em relação ao custo e ao desempenho.
As empresas também querem um modelo de custo fixo previsível para sua infraestrutura de IA. Com um modelo de custo fixo, sabe-se antecipadamente quanto custará sua infraestrutura de IA a cada trimestre fiscal. Ou seja, o custo não varia de acordo com o número de desenvolvedores ou o número de cargas de trabalho ou tarefas. Além disso, as clouds têm custos variáveis, como custo de acesso a dados e de saída. Há uma cobrança por cada solicitação de dados para o armazenamento e para mover dados para fora (saída) da cloud. Dependendo da carga de trabalho, esses custos variáveis podem se tornar uma porcentagem maior do custo geral de armazenamento.
Otimizando o desempenho da IA
As organizações estão encontrando barreiras ao alto desempenho pelos seguintes motivos:
- Acesso à tecnologia mais recente de GPU: Os trabalhos de treinamento de IA se dão mais rapidamente com a tecnologia de GPU mais recente, mas está ficando cada vez mais difícil acessá-la na cloud. Trabalhar com uma geração mais antiga de tecnologia de IA aumenta o custo das execuções de treinamento de IA do cliente.
- Latência/taxa de transferência de inferência: Quando os dados são gerados na edge, mover esses dados para um local centralizado para inferência de IA aumenta a latência de resposta.
- Variância no sistema e na arquitetura de implantação: Mesmo que os fornecedores de GPUs, OEMs e clouds usem o mesmo tipo de GPUs, haverá uma diferença no desempenho geral dessas implantações devido à arquitetura de interconexão de GPU para redes, armazenamento e outras GPUs no cluster. Essa diferença de desempenho se aplica se o sistema de IA é implantado em infraestrutura dedicada ou infraestrutura compartilhada e se há uma camada de virtualização ou se o sistema está sendo executado em bare metal.
Desafios do compartilhamento de dados
Em muitos casos, as organizações precisam aproveitar dados externos (por exemplo, dados meteorológicos, dados de tráfego etc.) para melhorar a precisão de seus modelos de IA. Para a maioria dos projetos de IA, não se constrói um modelo do zero. Em vez disso, usa-se um modelo de IA externo como ponto de partida e, posteriormente, personaliza-se esse modelo com seus dados privados. Assim, as organizações precisam saber sobre a linhagem dos dados externos e modelos que estão usando para garantir que não estejam violando quaisquer regulamentos de conformidade e para se proteger de dados corrompidos que agentes mal-intencionados manipularam. Isso será especialmente verdadeiro quando as pessoas começarem a aproveitar modelos de fundação baseados em open source.
Da mesma forma, muitas organizações também desejam monetizar seus dados com terceiros. No entanto, esses provedores de dados desejam ter controle sobre os dados que planejam compartilhar, para casos de uso não autorizados ou encaminhar esses dados para agentes não pagantes. A menos que esses desafios de compartilhamento de dados sejam superados, isso inibirá o uso de IA em ambientes corporativos.
Escassez de qualificação
A maioria das organizações está encontrando dificuldades para encontrar profissionais qualificados de IA. Do total de líderes de TI, 45% relataram que seu maior desafio em termos de competências é a velocidade com que o setor de tecnologia está se transformando. As empresas precisam de arquitetos corporativos com conhecimento sobre arquiteturas emergentes de hardware e software de IA, cientistas de dados, engenheiros de dados e curadores de dados para trabalhar em projetos de IA.
As soluções de IA generativa estão, em muitos casos, ajudando a trazer a tecnologia de IA para os especialistas no assunto e os usuários finais de maneira integrada. Além disso, muitas empresas de Software as a Service fornecem às empresas soluções que já incorporam recursos de IA.
Viabilizando a sustentabilidade/IA verde
As organizações reconhecem a necessidade de utilizar a IA de forma sustentável e querem fazer sua parte. Cada vez mais, as organizações devem divulgar a pegada de carbono de sua infraestrutura de TI — para clientes, colaboradores e parceiros. A GTTS constatou que menos da metade dos tomadores de decisão de TI (47%) estão confiantes de que seus negócios podem atender à demanda dos clientes por práticas mais sustentáveis.
Os racks de treinamento de IA consomem >30kVA por rack e o resfriamento a ar torna-se ineficiente; kVAs mais altos por rack requerem refrigeração líquida. A maioria dos data centers privados (internos) não está equipada para lidar com esses racks de IA que consomem muita energia.
A crescente demanda por transparência pelas partes interessadas também levantou preocupações das organizações sobre a eficácia do uso da água (WUE) e a eficácia do uso de energia (PUE) dos data centers que hospedam sua infraestrutura de TI. As partes interessadas, provavelmente, também vão querer saber qual parte da infraestrutura de TI é alimentada por fontes renováveis.
Sua infraestrutura está pronta para a IA?
Executar infraestrutura de IA distribuída de alto desempenho na Plataforma Equinix ajuda as equipes de infraestrutura de TI a superar a complexidade da IA e gerenciar grandes volumes de dados, liberando as unidades de negócios para começar a perceber o tremendo valor das soluções de IA. Participar de ecossistemas digitais dá acesso a novos parceiros de tecnologia com soluções inovadoras que ajudarão a resolver problemas de IA de nível de produção e acelerar as estratégias de IA de sua empresa para obter vantagem competitiva.
Leia a pesquisa Equinix 2023 Global Tech Trends Survey para saber mais sobre como os líderes de TI estão avançando no ritmo da inovação e preparando suas estratégias de negócio para o futuro em 2023 e além.
Amanhã, publicaremos um post complementar, discutindo quatro casos de uso de implantação distribuída de IA.
Você também pode ter interesse:
Leia outros post sobre IA da Equinix para saber como as organizações estão enfrentando outros desafios na área.