Redefiniendo el Edge: Estableciendo nuevos estándares para la infraestructura de IA

La proximidad al edge está impulsando la necesidad de una infraestructura de IA que sea distribuida, interconectada y escalable

Kevin Egan
Redefiniendo el Edge: Estableciendo nuevos estándares para la infraestructura de IA

El rápido avance de la IA está transformando las industrias. Las empresasde hoy necesitan rapidez en la toma de decisiones, resiliencia operativa y experiencias personalizadas para mantener su ventaja competitiva. También deben satisfacer las cambiantes expectativas de los consumidores y las empresas en cuanto a un rendimiento adecuado.

La infraestructura de IA basada en la proximidad en el Edge es esencial para cumplir con estos estándares cada vez más exigentes. El panorama de la IA está evolucionando, pasando del entrenamiento de modelos de IA en ubicaciones centralizadas a un paradigma más distribuido que incluye la inferencia de la carga de trabajo en el edge. Esto se debe en parte al auge de la inferencia de la IA agéntica, que toma decisiones en el edge y depende de una baja latencia.

Los nuevos modelos de IAson más especializados y pequeños, lo que permite el entrenamiento en el edge. Las empresas están utilizando estos modelos especializados específicos para cada dominio porque se adaptan mejor a su uso en sectores, funciones y conjuntos de datos propios específicos.

Todos estos factores hacen que el edge sea una ubicación de computación más estratégica, dada su proximidad al lugar donde se generan, almacenan y procesan los datos.

¿Dónde está su edge principal?

Las empresas deben replantearse el lugar dónde se encuentra su edge. De hecho, hay múltiples edges donde un negocio podría elegir realizar la inferencia de IA. El edge metropolitano está ganando terreno como ubicación crucial para las cargas de trabajo de inferencia de IA, ya que ofrece el mejor equilibrio entre baja latencia, privacidad de datos y rentabilidad.

La elección del edge metropolitano implica trasladar los datos de inferencia a una instalación diferente, como un data center de colocación, dentro de la misma zona geográfica concentrada que las fuentes de datos. Este enfoque agrega las cargas de trabajo de inferencia en una única ubicación con una latencia típica inferior a 10 milisegundos y elimina la necesidad de que las empresas operen infraestructura privada dentro de sus propias instalaciones.

Los tipos de aplicaciones también influyen en la identificación de las ubicaciones de los edge principales, ya que la tolerancia a la latencia es variable. Las aplicaciones orientadas a máquinas suelen requerir una alta velocidad y una baja latencia. En las aplicaciones orientadas al usuario, unos pocos milisegundos adicionales de retraso ni siquiera se registrarían. Un radiólogo que busca historiales médicos no necesita una respuesta inmediata, pero un automóvil autónomo que intenta evitar atropellar a peatones sí la necesita.

Los requisitos específicos de cada industria, como dónde se generan y procesan los datos y cómo se accede a las fuentes de datos, también determinan la ubicación del edge(s) de una empresa. Las empresas pueden necesitar cumplir con los requisitos de latencia de edge para una variedad de funciones:

  • Empresas de logística: Realice un seguimiento de las entregas, gestione las rutas de entrega, optimice las operaciones del almacén, así como supervise y garantice la seguridad de la carga.
  • Empresas de distribución de contenidos: Proporcione recomendaciones personalizadas en tiempo real y garantice una transmisión con baja latencia, juegos sin retrasos y experiencias de AR/VR inmersivas.
  • Ciudades inteligentes: Utilice el análisis de vídeo en tiempo real y el procesamiento de datos de sensores para la gestión del tráfico, la detección de delitos y la respuesta a emergencias.
  • Organizaciones de atención de la salud: Asegure una monitorización continua, cirugías robóticas remotas sin interrupciones y un análisis rápido de datos para obtener diagnósticos más rápidos y tratamientos personalizados.

Los casos de uso en el edge seguirán evolucionando y creciendo, lo que obligará a las empresas a diseñar tanto para el presente como para el futuro.

Para el año 2029, el 50 % de las empresas utilizarán la computación en el edge, en comparación con el 20 % en el año 2024.[1]"
Gartner® Predicts 2025: Las plataformas de computación en el edge acelerarán la IA en el edge

Las opciones de ubicación de los datos afectan al costo y al cumplimiento normativo.

El lugar donde las empresas deciden ejecutar las cargas de trabajo de IA y almacenar los datos afecta a las tarifas de salida y a las estructuras de costos (OPEX frente a CAPEX). También influye en el rendimiento, la latencia y los requisitos de infraestructura de red.

El volumen de datos generados diariamente en el edge puede acumularse rápidamente. Por ejemplo:

  • Fábrica inteligente: 1 petabyte
  • Avión: 4 terabytes
  • Vehículo autónomo: 3 terabytes

Trasladar esos datos a una ubicación centralizada para la inferencia de IA tiene un impacto significativo en la latencia, el costo y el ancho de banda, lo que hace que el edge sea la opción obvia.

Además, actualmente hay leyes de protección de datos y privacidad en vigor en 144 países, y se están preparando más.[2] Algunas normativas son complejas y requieren una cuidadosa consideración sobre dónde almacenar los datos. Por ejemplo, no se pueden almacenar datos recolectados en Alemania en una nube de AWS en EE. UU.; deben permanecer en Alemania. Es una de las razones por las que usted necesita una infraestructura distribuida para la IA.

Elevando el nivel de innovación en IA en el edge

Veamos dos ejemplos de empresas que están innovando con IA en el edge y desplegando infraestructura de IA para la colaboración en tiempo real y la conectividad de alta velocidad con clientes y socios.

Nanyang Biologics, una empresa emergente de biotecnología especializada en el descubrimiento de fármacos impulsado por la IA, aprovechó la interconexión definida por software de Equinix Fabric® para la computación en el edge con el fin de permitir la colaboración en tiempo real con sus socios de investigación. Esto permitió aumentar la velocidad y la precisión a un menor costo.

Vea este breve vídeo con el caso práctico de Nanyang Biologics para obtener más información sobre cómo la infraestructura de IA escalable en el edge soporta el entrenamiento de modelos de IA y acelera el descubrimiento de fármacos.

Alembic es una empresa SaaS de inteligencia de marketing que proporciona a sus clientes información basada en datos sobre sus actividades de marketing, lo que les permite optimizar el gasto y mejorar el flujo del embudo de ventas. Han posicionado una pila de infraestructura de IA más cerca de los clientes para permitir una inferencia de alto rendimiento en el edge. Alembic también aprovechó el ecosistema de proveedores de servicios de red (NSP) de Equinix y Equinix Fabric para ofrecer conectividad de alta velocidad a sus clientes y socios, lo que en última instancia le permitió proporcionar un producto de mayor rendimiento.

Vea este breve vídeo sobre el caso práctico de Alembic para descubrir cómo están haciendo posible el marketing basado en datos mediante el análisis de datos impulsado por la IA.

Otras industrias que están innovando con IA en el edge incluyen:

  • Servicios financieros para estrategias de trading y detección de fraudes.
  • Medios de comunicación y entretenimiento para la creación de contenido digital y el desarrollo de videojuegos.
  • Vehículos autónomos para la detección de peatones y señales de tráfico, y seguimiento de carriles.
  • Robótica para la fabricación, la construcción y la navegación.

4 pasos para priorizar la proximidad en el edge

La transición hacia una estrategia de infraestructura que priorice la proximidad requiere un enfoque deliberado e integrado. Le recomendamos que siga estos pasos para crear su hoja de ruta.

  1. En primer lugar, audite su infraestructura actual de IA. Querrá mapear los flujos de datos e identificar los cuellos de botella en el rendimiento causados por la latencia.
  2. A continuación, defina sus requisitos sobre el edge: Evalúe las exigencias de las aplicaciones en tiempo real, incluyendo la latencia, el ancho de banda y el cumplimiento normativo. También querrá revisar los requisitos de su empresa con respecto a una conectividad, computación y almacenamiento de datos de alto rendimiento.
  3. Ahora está listo para diseñar una estrategia de datos flexible, multinube y multiproveedor que le permita distribuir las cargas de trabajo de forma inteligente para crear el equilibrio adecuado entre las infraestructuras de edge y centralizadas, así como implementar infraestructuras específicas para cada país o región con el fin de cumplir con la normativa.
  4. Por último, aproveche los ecosistemas de socios de IA interconectados y neutrales para acceder a la amplia gama de socios necesarios para dar soporte a las cargas de trabajo de IA.

Implemente su infraestructura de IA en el edge

La infraestructura distribuida ayuda a las empresas a acelerar la innovación en IA y a preparar sus estrategias de IA para el futuro. Aunque en este blog nos hemos centrado en el edge, su estrategia de infraestructura de IA necesita incluir una combinación de infraestructura en la nube y en el edge, así como una red robusta para conectar de forma segura todos sus recursos.

Los centros de datos de IA de Equinix están estratégicamente ubicados en los mercados más conectados del mundo para ayudar a las empresas a preparar sus operaciones para el futuro. Nuestra presencia global abarca más de 270 centros de datos de colocación interconectados en 76 áreas metropolitanas de todo el mundo, lo que garantiza el acceso a todos los principales proveedores de servicios en la nube a través de nuestra cartera líder en el sector, con más de 220 rampas de acceso a la nube y proximidad a múltiples fuentes de datos.

Miles de proveedores de datos, servicios en la nube, redes, tecnología de IA y GPU como servicio forman parte del sólido ecosistema digital de Equinix. Las empresas pueden utilizar Equinix Fabric para crear conexiones bajo demanda y escalables con socios del ecosistema y entre su propia infraestructura de IA en diferentes ubicaciones.

Para obtener más información sobre por qué la proximidad es importante, lea nuestro informe técnico “La paradoja de la proximidad”.

 

[1]Gartner Predicts 2025: Edge Computing Platforms Will Accelerate Edge AI,” Gartner®, November 28, 2024.

GARTNER is a registered trademark and service mark of Gartner, Inc. and/or its affiliates in the U.S. and internationally and is used herein with permission. All rights reserved.

[2]Data protection and privacy laws now in effect in 144 countries,” IAPP, January 28, 2025.

 

Avatar photo
Kevin Egan Senior Director, Technical Solutions
Subscribe to the Equinix Blog