Ridefinire l’edge: stabilire nuovi standard per l’infrastruttura AI

L’edge proximity accelera la trasformazione verso infrastrutture AI sempre più distribuite, interconnesse e scalabili.

Kevin Egan
Ridefinire l’edge: stabilire nuovi standard per l’infrastruttura AI

Il rapido progresso dell’AI sta trasformando i settori industriali. Per mantenere il vantaggio competitivo, le aziende di oggi hanno bisogno di rapidità decisionale, resilienza operativa ed esperienze personalizzate. Devono inoltre soddisfare le mutevoli aspettative di consumatori e aziende in termini di prestazioni accettabili.

Per soddisfare questi standard crescenti, è essenziale un’infrastruttura AI basata sullì edge proximity. Il panorama dell’Intelligenza Artificiale si sta evolvendo, passando dall’addestramento dei modelli  in sedi centralizzate a un paradigma più distribuito, che include anche l’inferenza dei carichi di lavoro all’edge. Ciò è dovuto in parte all’ascesa dell’inferenza AI agentica, che prende decisioni in ambienti edge e si basa sulla bassa latenza.

I modelli AI più recenti sono più specializzati e più piccoli, il che rende possibile l’addestramento all’edge. Le aziende utilizzano questi modelli specializzati e specifici per dominio perché si adattano meglio all’uso in settori, funzioni e set di dati proprietari specifici.

Tutti questi fattori rendono l’edge un luogo di elaborazione più strategico, data la sua prossimità al luogo in cui i dati vengono generati, archiviati ed elaborati.

Scopri il tuo edge strategico

Le aziende devono riconsiderare la posizione del proprio edge. In effetti, esistono molteplici edge in cui un’azienda potrebbe scegliere di eseguire l’inferenza AI. L’edge metropolitano sta guadagnando terreno come luogo cruciale per i carichi di lavoro di inferenza AI, in quanto offre il miglior equilibrio tra bassa latenza, privacy dei dati e convenienza economica.

La scelta dell’edge metropolitano implica lo spostamento dei dati di inferenza in una struttura diversa, ad esempio un data center di colocation, all’interno della stessa area geografica concentrata delle fonti dei dati. Questo approccio aggrega i carichi di lavoro di inferenza in un’unica posizione con una latenza tipica inferiore a 10 millisecondi ed elimina la necessità per le aziende di gestire infrastrutture private all’interno delle proprie strutture.

Anche i tipi di applicazioni influenzano l’identificazione delle principali sedi edge, poiché la tolleranza alla latenza varia. Le applicazioni rivolte alle macchine in genere richiedono alta velocità e bassa latenza. Nel caso delle applicazioni rivolte all’uomo, qualche millisecondo di ritardo in più non verrebbe nemmeno percepito. Un radiologo che cerca cartelle cliniche non ha bisogno di una risposta immediata, mentre un’auto a guida autonoma che cerca di evitare i pedoni sì.

Anche i requisiti specifici del settore, come ad esempio il luogo in cui i dati vengono generati ed elaborati e le modalità di accesso alle fonti dati, determinano l’ubicazione dell’edge di un’azienda. Le aziende potrebbero dover soddisfare i requisiti di latenza dell’edge per una varietà di funzioni:

  • Aziende di logistica: tracciatura delle consegne, gestione del percorso delle consegne, semplificazione delle operazioni di magazzino, monitoraggio e garanzia della sicurezza del carico.
  • Aziendedi erogazione di contenuti digitali : fornitura di consigli personalizzati in tempo reale, garanzia di streaming a bassa latenza, gaming senza ritardi ed esperienze AR/VR immersive.
  • Smart citiy:utilizzo di analisi video in tempo reale, elaborazione dei dati dei sensori per la gestione del traffico, rilevamento dei reati e risposta alle emergenze.
  • Organizzazioni sanitarie: garanzia di monitoraggio continuo, interventi chirurgici robotici da remoto senza interruzioni, analisi rapida dei dati per diagnosi più veloci e trattamenti personalizzati.

I casi d’uso all’edge continueranno a evolversi e a crescere, richiedendo alle aziende di progettare soluzioni sia per il presente che per il futuro.

Entro il 2029, il 50% delle aziende utilizzerà l’edge computing rispetto al 20% del 2024.[1]”
Previsioni di Gartner® per il 2025: le piattaforme di edge computing accelereranno l'AI all'edge

Le scelte di posizionamento dei dati influiscono su costi e conformità

La scelta delle aziende di eseguire carichi di lavoro AI e di archiviare i dati influisce sulle tariffe di uscita e sulle strutture dei costi (OPEX rispetto a CAPEX). Genera un impatto anche sulle prestazioni, sulla latenza e sui requisiti dell’infrastruttura di rete.

Il volume dei dati generati quotidianamente all’edge può aumentare rapidamente. Ad esempio:

  • Fabbrica intelligente: 1 petabyte
  • Aereo: 4 terabyte
  • Auto a guida autonoma: 3 terabyte

Spostare quei dati in una posizione centralizzata per l’inferenza AI incide significativamente su latenza, costi e larghezza di banda, rendendo l’edge una scelta ovvia.

Inoltre, le leggi sulla protezione e sulla privacy dei dati sono ormai in vigore in 144 Paesi e in molti altri sono in arrivo.[2] Alcune normative sono complesse e richiedono un’attenta valutazione del luogo in cui archiviare i dati. Ad esempio, non è possibile archiviare i dati raccolti in Germania su un cloud AWS negli Stati Uniti; i dati devono rimanere in Germania. Questo è uno dei motivi per cui è necessaria un’infrastruttura distribuita per l’AI.

AI all’edge: il nuovo confine dell’innovazione

Analizziamo due esempi di aziende che innovano con l’AI in ambienti edge e distribuiscono infrastrutture AI per la collaborazione in tempo reale e la connettività ad alta velocità con clienti e partner.

Nanyang Biologics, una startup biotecnologica specializzata nella scoperta di farmaci basata sull’AI, ha sfruttato l’interconnessione definita dal software di Equinix Fabric® per l’edge computing, stabilendo una collaborazione in tempo reale con i partner di ricerca. In questo modo si aumentano la velocità e la precisione a un costo inferiore.

Guarda questo breve video sul caso di studio di Nanyang Biologics per saperne di più su come un’infrastruttura AI scalabile all’edge, supporti l’addestramento dei modelli AI e acceleri la scoperta di farmaci.

Alembic è un’azienda di marketing intelligence SaaS che fornisce ai clienti approfondimenti basati sui dati delle loro attività di marketing, consentendo loro di ottimizzare la spesa e migliorare il movimento nel funnel di vendita. Un’infrastruttura AI è stata posizionata più vicino ai clienti per consentire un’inferenza ad alte prestazioni all’edge. Alembic ha inoltre sfruttato l’ecosistema di provider di servizi di rete (NSP) di Equinix ed Equinix Fabric per offrire una connettività ad alta velocità ai propri clienti e partner, offrendo in definitiva un prodotto dalle prestazioni più elevate.

Guarda questo breve video su un caso di studio di Alembic per scoprire come sta abilitando il marketing basato sui dati grazie all’analisi dei dati potenziata dall’AI.

Altri settori che stanno innovando con l’AI all’edge includono:

  • Servizi finanziari per strategie di trading e rilevamento delle frodi.
  • Media e intrattenimento per la creazione di contenuti digitali e lo sviluppo di giochi.
  • Veicoli a guida autonoma per il rilevamento dei pedoni e della segnaletica stradale e per il tracciamento delle corsie.
  • Robotica per la produzione, l’edilizia e la navigazione.

4 passaggi per dare priorità all’ edge proximity

La transizione verso una strategia infrastrutturale incentrata sulla prossimità richiede un approccio deliberato e integrato. Ti consigliamo di seguire questi passaggi per creare la tua roadmap:

  1. Per prima cosa, verifica la tua attuale infrastruttura AI. Sarà necessario mappare i flussi di dati e identificare i colli di bottiglia nelle prestazioni causati dalla latenza.
  2. Successivamente, dovrai definire i requisiti dell’edge, valutando le esigenze delle applicazioni in tempo reale, tra cui latenza, larghezza di banda e conformità. Dovrai anche esaminare i requisiti della tua azienda in termini di connettività ad alte prestazioni, elaborazione e archiviazione dei dati.
  3. Ora sei pronto a progettare una strategia dati flessibile, multicloud e multi-provider che ti consenta di distribuire i carichi di lavoro in modo intelligente per creare il giusto equilibrio tra infrastrutture all’edge e centralizzate e di distribuire infrastrutture specifiche per Paese o area geografica per garantire la conformità.
  4. Infine, sfrutta gli ecosistemi di partner AI interconnessi e neutrali per accedere alla vasta gamma di partner necessari a supportare i carichi di lavoro dell’AI.

Implementare la infrastruttura AI in ambienti edge

L’infrastruttura distribuita aiuta le aziende ad accelerare l’innovazione dell’AI e a rendere le proprie strategie AI a prova di futuro. Sebbene in questo blog ci siamo concentrati sull’edge, la tua strategia di infrastruttura AI deve includere una combinazione di infrastruttura cloud ed all’edge, oltre a una rete solida che consenta di connettere in modo sicuro tutte le tue risorse.

I data center AI di Equinix sono strategicamente posizionati nei mercati più connessi al mondo per aiutare le aziende a rendere le loro operazioni a prova di futuro. La nostra presenza globale si estende su oltre 270 data center di colocation interconnessi in 76 aree metropolitane in tutto il mondo, garantendo l’accesso a tutti i principali provider di servizi cloud tramite il nostro portfolio leader del settore con oltre 220 accessi al cloud e la prossimità a molteplici fonti di dati.

Migliaia di provider di dati, cloud, reti, tecnologia AI e GPU as a Service fanno parte del solido ecosistema digitale di Equinix. Le aziende possono utilizzare Equinix Fabric per creare connessioni scalabili on-demand con i partner dell’ecosistema e tra le proprie infrastrutture AI in sedi diverse.

Per saperne di più sull’importanza della prossimità, leggi il nostro white paper sul Paradosso della prossimità.

 

[1]Gartner Predicts 2025: Edge Computing Platforms Will Accelerate Edge AI,” Gartner®, November 28, 2024.

GARTNER is a registered trademark and service mark of Gartner, Inc. and/or its affiliates in the U.S. and internationally and is used herein with permission. All rights reserved.

[2]Data protection and privacy laws now in effect in 144 countries,” IAPP, January 28, 2025.

 

Avatar photo
Kevin Egan Senior Director, Technical Solutions
Subscribe to the Equinix Blog