Hace menos de un año que los grandes modelos lingüísticos (LLM, por sus siglas en inglés) están disponibles para los principales casos de uso de la IA, así que ya hemos visto hasta qué punto han influido en nuestras vidas. En los dos primeros meses tras su lanzamiento, más de 100 millones de usuarios habían probado ChatGPT, lo que la convirtió en la aplicación de consumo de más rápido crecimiento de la historia en aquel momento[1] Desde el punto de vista empresarial, las empresas han estado luchando por ser las primeras en captar las ventajas competitivas que ofrecen los LLM. Parece probable que las cosas se aceleren aún más ahora que OpenAI ha anunciado una versión empresarial de ChatGPT.[2]
Los LLM y otras aplicaciones de IA pueden parecer mágicos para las personas inexpertas, pero en realidad, los resultados que se obtienen dependen de la calidad y disponibilidad de los datos que usted introduce en esos modelos. Esto significa que el modo en que construya su arquitectura de datos es el único factor que determinará en última instancia el éxito o el fracaso de sus iniciativas de IA. En este sentido, los LLM no son tan diferentes de muchos otros servicios de TI empresariales que les precedieron.
Hasta ahora, las empresas con arquitecturas de datos más flexibles y distribuidas han sido las que han podido sacar el máximo partido de los servicios de la IA generativa, mientras que las que dependen de arquitecturas de datos tradicionales y estáticas han empezado a quedarse rezagadas. De cara al futuro, tenemos motivos para creer que esta tendencia se mantendrá. A medida que los LLM pasan de ser una novedad a convertirse en una parte arraigada de las operaciones empresariales cotidianas, los inconvenientes de contar con una arquitectura de datos incorrecta no harán sino aumentar.
En este blog, describiré lo que significa tener una arquitectura de datos adecuada: crear un núcleo de datos autorizado que permita mover los datos desde el edge a la nube y viceversa, sin tener que renunciar nunca al control sobre esos datos.
Guía de infraestructura digital para líderes
Conozca cómo más del 50 % de las empresas Fortune 500 han aprovechado Platform Equinix para implementar y capitalizar sus estrategias digitales.
Descargar ahoraNo pierda la custodia de su núcleo de datos
El concepto más importante que deben entender las empresas a la hora de construir su arquitectura de datos para la IA es precisamente el de custodia de datos. Esto significa que necesita un lugar dentro de su arquitectura de datos donde pueda almacenar sus datos manteniendo al mismo tiempo el control y la propiedad total sobre ellos. Cuando usted es el custodio de sus datos, tiene libertad para:
- Auditar sus datos y el hardware en el que residen
- Proteger sus datos frente a diversas amenazas
- Recuperar los datos tras una interrupción del servicio o una catástrofe
- Analizarlos mediante la alimentación en las herramientas adecuadas.
- Utilizar el modelo financiero que mejor se adapte a sus necesidades -OPEX o CAPEX
Hay muchas razones válidas por las que puede querer utilizar servicios en la nube como parte de su arquitectura de datos, pero el riesgo es que puede perder la custodia de sus datos si no tiene cuidado sobre cómo accede a esos servicios. Si construye su arquitectura de datos directamente en la nube, se enfrentará a onerosas tarifas de salida de datos que impondrán restricciones artificiales a su negocio. Estas tarifas hacen que algo que debería ser una decisión empresarial rápida y sencilla —como dejar un proveedor de nube por otro que ofrezca mejores servicios— se convierta en una labor compleja, larga y costosa.
En una entrada anterior del blog, describí lo que es un núcleo de datos autorizado, y por qué es tan importante que las empresas mantengan sus núcleos de datos fuera de la nube. Un núcleo de datos autorizado no es una ubicación específica, sino más bien una capa lógica en el centro de su arquitectura de datos. Debería ser capaz de agregar datos a su núcleo desde una variedad de fuentes en el edge digital. Luego, debería ser capaz de mover esos datos a donde sea necesario para apoyar diferentes casos de uso – ya sea en sentido ascendente a múltiples proveedores de nube o descendente de vuelta a ubicaciones de edge.
En ese blog anterior, también describí cuatro patrones de movimiento de datos que permiten a las empresas aprovechar los servicios en la nube bajo demanda, mientras que también minimizan el impacto de las tarifas de salida de datos.
Construir una arquitectura de datos que tenga en cuenta los requisitos exclusivos de las cargas de trabajo de IA distribuida
En el caso de la IA, las distintas cargas de trabajo tienen requisitos diferentes y, por tanto, deben alojarse en ubicaciones distintas. Por este motivo, necesita una infraestructura digital distribuida que pueda mover rápidamente sus datos desde el edge a la nube y viceversa.
Por ejemplo, puede optar por realizar el entrenamiento de modelos en la nube para aprovechar los servicios LLM de un proveedor concreto. Sin embargo, sus cargas de trabajo de ingeniería y ajuste de datos pueden incluir datos confidenciales que no desea exponer a la nube. Puede optar por dejar estas cargas de trabajo en el núcleo y utilizar recursos informáticos privados o una oferta de Bare Metal as a Service para procesarlas. Por último, una vez que los modelos han sido entrenados, querrá moverlos de vuelta al edge para soportar cargas de trabajo de inferencia sensibles a la latencia.
La arquitectura de datos ideal para la IA o cualquier otro caso de uso avanzado basado en datos, debería asociar soluciones de almacenamiento escalables con capacidades de interconexión ágiles y programáticas, como se muestra en el siguiente diagrama. Esto le permite crear conexiones virtuales a otras nubes o nuevas ubicaciones de edge según surja la necesidad. Esto significa que los datos pueden desplazarse rápidamente a donde sea necesario para dar soporte a las distintas cargas de trabajo antes mencionadas. Dado que mantiene sus copias de datos principales fuera de la nube, no tiene que preocuparse de que las elevadas tarifas de salida mantengan sus datos como rehenes. Cuando esté listo para abandonar una nube en particular, simplemente puede eliminar la copia de datos de esa nube y empezar de nuevo con una nueva copia en una nube diferente.
Es importante señalar que el núcleo de datos autorizados no es una recomendación ni una práctica óptima; es simplemente la dirección hacia la que se dirige el sector. Todas las empresas acabarán construyendo esta arquitectura de datos, ya sea de forma intencionada o no. La única diferencia es que los que actúen ahora con intención disfrutarán mucho antes de las ventajas de la opcionalidad y la flexibilidad. Esto significa que tendrán la ventaja que conlleva poder utilizar los mejores y más recientes servicios -como los que potencian las aplicaciones de IA- antes que la competencia.
¿Cómo puede ayudar Equinix?
Un núcleo de datos autorizado para la IA no es algo que pueda comprarse a un proveedor o incluso montarlo rápidamente usted mismo. Es un objetivo que usted establece para su organización, de modo que pueda tomar decisiones futuras que le acerquen cada vez más a alcanzar ese objetivo.
Elegir al socio de infraestructura digital adecuado es un paso decisivo para lograr este objetivo. Sólo Equinix puede ofrecer acceso a los principales proveedores de nubes desde muchas zonas metropolitanas diferentes de todo el mundo, lo que garantiza la conectividad de baja latencia necesaria para el almacenamiento adyacente a varias nubes. Además, los servicios digitales de Equinix pueden servir como componentes clave de su arquitectura de datos, proporcionando capacidades de interconexión definidas por software, redes multinube y capacidad de cómputo de bare metal bajo demanda de un solo inquilino.
En resumen, Platform Equinix® proporciona la fundación ideal sobre la cual empezar a construir su núcleo de datos autorizado, garantizando así la custodia de sus datos y situando a su organización en posición de utilizar la tecnología de IA en todo su potencial.
Para conocer más sobre cómo las organizaciones líderes están construyendo infraestructuras digitales distribuidas e interconectadas, con el fin de maximizar su ventaja competitiva hoy y preparar sus operaciones para el futuro, lea la Guía de Líderes para la Infraestructura Digital.
[1] Dan Milmo, ChatGPT alcanza los 100 millones de usuarios dos meses después de su lanzamiento, The Guardian, 2 de Febrero, 2023.
[2] Rachel Metz, OpenAI presenta ChatGPT para empresas, intensificando el impulso de los ingresos, Bloomberg, 28 de Agosto, 2023.