Agora que a IA generativa se tornou popular, as empresas estão investindo fortemente em IA e desenvolvendo estratégias de IA. Na verdade, a IDC prevê que os gastos anuais com IA, incluindo IA generativa, passarão de US$ 175,9 bilhões em 2023 para US$ 509,1 bilhões em 2027, uma taxa composta de crescimento anual (CAGR) de 30,4%.[1] À medida que o setor de IA generativa se expande, as organizações estão usando cada vez mais modelos de IA criados por terceiros em vez de construir modelos próprios de IA do zero. Muitos dos principais players no setor desenvolveram modelos de linguagem grandes (LLMs) (tanto comerciais como open source) que estão disponíveis para as empresas. Alguns são gerais, enquanto outros são projetados para setores ou casos de uso específicos.
Aproveitar os modelos de IA existentes ajuda as empresas a impulsionar as suas iniciativas de IA. Atualmente, muitas organizações estão começando com modelos de base, ou seja, modelos treinados em uma ampla gama de dados generalizados e não rotulados, e personalizando-os de modo que atendam às suas necessidades. Destacamos a seguir três maneiras comuns pelas quais as empresas estão construindo ou personalizando modelos existentes:
- Ajuste: o ajuste envolve o retreinamento de um modelo existente usando os dados da própria organização.
- Geração aumentada de recuperação (RAG): a abordagem da RAG pode ser usada para criar melhores prompts de entrada para aprimorar a precisão dos resultados de consultas de IA generativa. Com essa abordagem, em vez de treinar novamente o modelo, são fornecidos dados de contexto mais relevantes como parte do prompt de entrada.
- Agentes de IA: um agente de IA é um software que monitora o temperamento do usuário final e, de forma dinâmica, ajuda a criar prompts de IA generativa. Por exemplo, muitos sistemas de GPS já sabem qual é o destino de trajeto provável de um usuário em determinados horários do dia com base no histórico de viagens anteriores.
À medida que as organizações investigam oportunidades para lançar novas iniciativas de IA, elas precisam pensar em conceber a infraestrutura certa que seja compatível. As empresas que planejam usar modelos de IA existentes podem transferir dados privados para local em que o modelo de IA está (na cloud pública) ou transferir o modelo de IA para o local em que que os dados estão (em uma cloud privada). Essas duas abordagens oferecem vantagens, mas não há um método que seja adequado a todos os casos. Uma pesquisa recente da Enterprise Technology Research mostrou que 32% das empresas usam apenas uma abordagem de cloud pública, 32% usam apenas uma abordagem de cloud privada e 36% usam ambas.[2] Neste último grupo, a escolha entre cloud pública e privada para IA é baseada no caso de uso.
Cloud pública para IA
A adoção pelas organizações da abordagem de cloud pública para IA envolve transferir os dados para o modelo. Em outras palavras, as empresas pegam os dados, carregam-nos na cloud pública e utilizam os modelos de IA na cloud.
Há vários motivos que levam uma empresa a escolher a cloud pública para IA:
- Falta de talentos de IA internamente: se a empresa não tem as habilidades de IA, os modelos de base públicos podem ajudá-la a acelerar a iniciativa de IA.
- Barreira inicial reduzida: usar a cloud pública para IA, com o emprego de GPUs na cloud, pode ajudar a colocar a iniciativa de IA em funcionamento de forma mais rápida. Os modelos já estão sendo utilizados por muitas empresas.
- Modelos com qualidade superior: muitas vezes, mas nem sempre, é verdade que os modelos de IA disponíveis publicamente têm melhor desempenho, são mais precisos e de qualidade superior quando comparados àqueles que as organizações desenvolvem. A menos que a empresa tenha muito talento em IA, modelos comerciais como Bard, ChatGPT e assim por diante, podem oferecer resultados mais satisfatórios.
Cloud privada para IA
As empresas que usam uma abordagem de cloud privada para IA transferem o modelo para os dados que são armazenados em uma infraestrutura privada. Em outras palavras, as organizações utilizam um modelo de base desenvolvido em outro lugar, fazem o download desse modelo e o executa no local em que os dados privados estão armazenados, de modo que não há necessidade de fazer upload de dados para a cloud pública.
Vale ressaltar que há motivos importantes referentes à escolha de uma cloud privada para IA:
- Privacidade e segurança de dados: em determinados casos de uso e em setores altamente regulamentados, as organizações precisam de um nível mais elevado de privacidade e segurança de dados. Com o uso da cloud privada, a empresa pode hospedar o modelo dentro do firewall e garantir a conformidade com as regulamentações de dados.
- Controle de linhagem do modelo: a transferência do modelo de IA para uma cloud privada também fortalece a capacidade de gerenciá-lo, monitorá-lo e ampliá-lo.
- Redução de custos em escala: em termos de custo, pode ser útil testar alguns modelos de IA gerativa em clouds públicas enquanto os casos de uso de IA são avaliados. No entanto, se muitas aplicações de IA generativa forrem usadas em vários departamentos, utilizar modelos de IA em clouds por meio de APIs se tornará oneroso rapidamente. Da mesma forma, os custos de saída de dados para transferir das clouds os resultados da consulta também se tornarão onerosos.
- Modelos menores e mais rápidos: os modelos de IA em uma cloud privada podem ser menores e mais rápidos, dependendo do caso de uso. Há uma bifurcação no espaço do modelo de base. Pode-se escolher modelos de base muito grandes que podem satisfazer vários casos de uso ou modelos de IA de acordo com o caso de uso específico, que sejam menores em tamanho e, portanto, consumam menos recursos da infraestrutura.
Como escolher a infraestrutura compatível com a sua estratégia de IA
Como a empresa de infraestrutura digital do mundo®, a Equinix desempenha um papel estratégico ao ajudar as organizações com abordagens de cloud pública e privada para IA. Oferecemos diversas soluções para apoiar suas iniciativas de IA generativa.
Cloud pública para IA na Equinix
Caso a cloud pública para IA for escolhida, ainda é possível armazenar dados gerados fora da cloud, bem como fontes de dados legadas, próximas à cloud. Uma instalação neutra em cloud como a Equinix é compatível com uma postura multicloud e oferece um modelo de custo de armazenamento mais previsível. Com o armazenamento adjacente em cloud na Equinix, esses dados podem ser mantidos na Equinix, seja em colocation ou no Equinix Metal®, nossa solução Bare Metal como serviço (BMaaS), e tais dados podem ser inseridos nas clouds conforme necessário. Dessa forma, sua empresa não fica presa a um único provedor de cloud. A Equinix tem parceria com todos os principais fornecedores de armazenamento, o que permite implantar o hardware de armazenamento em colocation ou utilize-o como um serviço.
O armazenamento adjacente em cloud oferece maior controle sobre os dados, bem como garante flexibilidade e acesso a todas as principais clouds por meio de on-ramps de cloud. É possível manter os dados brutos e os bancos de dados vetoriais (ao usar a abordagem de inferência de IA com RAG) na Equinix e depois acessar modelos de IA em clouds públicas por meio de APIs. O armazenamento adjacente em cloud também oferece flexibilidade para alternar entre diferentes modelos de IA com base no desempenho, precisão e custo. Também é possível usar modelos de base de IA de diferentes fornecedores (por exemplo, modelo meteorológico, modelo financeiro, modelo de tráfego etc.) de forma rápida e segura. Além disso, na era da escassez de GPU, há a possibilidade de alternar entre provedores de GPU como serviço, com o ingresso de dados por meio de um local neutro adjacente à cloud, como a Equinix. Os data centers da Equinix têm conectividade de alta velocidade e baixa latência com vários data centers em cloud pública.
Se a cloud pública para IA for utilizada, também será preciso ter uma solução eficiente de conectividade multicloud. Em muitos casos, as empresas precisam acessar dinamicamente dados de fontes externas em tempo real enquanto criam a resposta à consulta de IA. Com o Fabric Cloud Router, a solução de rede multicloud da Equinix, é possível acessar fontes de dados externas de maneira segura, econômica e de alto desempenho. Já o roteamento virtual do Equinix Fabric® permite a conexão com vários provedores de cloud por meio de uma rede privada com resiliência integrada.
Cloud privada para IA na Equinix
Se a privacidade dos dados e a linhagem do modelo de IA representarem uma preocupação, a Equinix oferece uma abordagem de IA privada que disponibiliza privacidade de dados, custos previsíveis e desempenho de latência mais baixo. No modelo de cloud privada, a infraestrutura de computação de IA (CPUs, GPUs, FPGAs) e o armazenamento são instalados na Equinix, enquanto os modelos de base são acessados por meio de clouds públicas ou marketplaces de modelos de IA (por exemplo, HuggingFace) e posteriormente implantados na infraestrutura de IA da Equinix.
Cada vez mais, as organizações estão preocupadas com a linhagem dos modelos de base da cloud pública devido a ações judiciais pendentes entre provedores de dados e criadores de modelos. O uso de uma infraestrutura de IA privada fornece mais controle sobre quais dados estão no modelo de IA.
As soluções de IA generativa também apresentam requisitos substanciais de energia e refrigeração. Algumas empresas estão implantando infraestrutura de IA privada na Equinix, em vez de em data centers privados, porque não conseguem administrar os requisitos de energia e refrigeração da IA, que podem exceder 30 kW por rack. Além disso, a Equinix oferece acesso seguro e de alta largura de banda, baixa latência a fontes de dados nas clouds.
Com a IA privada na Equinix, as empresas também têm acesso a provedores de serviços de rede que trazem o tráfego de usuários e de dispositivos em edge, bem como a um ecossistema robusto de mais de 10 mil empresas e podem trocar dados usando o Equinix Fabric.
Nossa nova solução de IA privada com a NVIDIA DGX permite criar uma cloud privada totalmente gerenciada usando a infraestrutura de supercomputação de IA da NVIDIA DGX para criar e executar modelos de IA generativa personalizados.
Em conclusão, você pode preparar sua arquitetura de IA para o futuro, mantendo os dados em um local adjacente à cloud, como a Equinix. Com isso, você tem a flexibilidade de buscar arquiteturas de IA de cloud pública ou privada. Se você está procurando um lugar para acelerar suas iniciativas de IA generativa, a Equinix pode apoiar sua estratégia de IA com uma variedade de soluções. Para saber mais sobre como as organizações estão pensando em infraestrutura para IA, baixe o Equinix 2023 Global Tech Trends Survey.
[1] Rick Villars, Karen Massey, Mike Glennon, Eileen Smith, Rasmus Andsbjerg, Peter Rutten, Ritu Jyoti, Jason Bremner, David Schubmehl, GenAI Implementation Market Outlook: Worldwide Core IT Spending for GenAI Forecast, 2023–2027, IDC Market Note, Doc # US51294223, outubro de 2023.
[2] Enterprise Technology Research, “July 2023 Macro Views Summary,” julho de 2023. In Weighing the Open-Source, Hybrid Option for Adopting Generative AI, Harvard Business Review Analytic Services, 2 de novembro de 2023.