Quatro padrões de movimento de dados habilitados pela Cloud Adjacency

Com a infraestrutura certa, as empresas podem desbloquear os movimentos de dados fundamentais que sustentam o sucesso da multicloud híbrida.

Glenn Dekhayser
Ian Botbyl
Quatro padrões de movimento de dados habilitados pela Cloud Adjacency

Nos primórdios da nuvem, muitas organizações moviam todos os aplicativos e dados para um provedor de nuvem pública. Elas viam isso como a maneira mais rápida de aproveitar a agilidade e a escalabilidade da nuvem. À medida que o tempo passava e os volumes de dados aumentavam, ficou claro que ficar presa a um provedor específico para todas as suas necessidades não era o ideal. As organizações precisavam de uma abordagem independente da nuvem para desbloquear a melhor combinação de eficiência de custos, flexibilidade e os melhores serviços. Para atingir esse objetivo, elas começaram a buscar estratégias híbridas de multicloud.

Na Equinix, acreditamos que infraestrutura digital adjacente à nuvem é o novo componente local que permite uma abordagem moderna para a multinuvem híbrida. No coração de qualquer infraestrutura eficaz adjacente à nuvem estará um núcleo de dados autorizado.

Baixe o guia executivo de infraestrutura digital

Descubra como mais de 50% dos Fortune 500 aproveitaram a Plataforma Equinix para implementar e capitalizar suas estratégias digital-first.

Baixar artigo
print2

O que é um núcleo de dados autoritativo e por que as empresas precisam dele?

Durante anos, empresas bem-sucedidas orientadas por dados agregaram e analisaram conjuntos de dados para extrair informações e desbloquear valor comercial. Até agora, essas empresas usavam principalmente aplicativos grandes e monolíticos que eram executados em apenas alguns lugares. Por isso, os silos de dados comumente encontrados em arquiteturas de dados legadas geralmente não eram um problema.

À medida que as empresas se tornaram mais distribuídas globalmente, os conjuntos de dados se tornaram maiores e os requisitos de latência se tornaram mais rigorosos, as empresas passaram a ver que a maneira antiga era insustentável. Elas precisavam de uma nova abordagem que permitisse a agregação de dados distribuídos em muitos locais diferentes em todo o mundo, além de manter cópias desses conjuntos de dados em um local central.

Esse local é o que chamamos de “núcleo de dados autoritativo” e forma a base para tudo que uma empresa pode fazer com a multicloud híbrida. Ele inclui muitas formas diferentes de dados agregados, como data lakes, sistemas de registro e cópias secundárias de backups. O núcleo de dados autoritativo não é um silo monolítico de armazenamento de dados, mas uma série de regiões interconectadas adjacentes à nuvem que estão estrategicamente localizadas com base nos requisitos de negócios.

As camadas upstream e downstream permitem a movimentação eficaz de dados na nuvem e na borda

Enrolada em torno do núcleo de dados autoritativo está uma camada upstream e uma camada downstream. Cada uma dessas camadas de interconectividade é responsável por mover cópias do núcleo autoritativo para onde quer que os dados precisem ir. No caso da camada a jusante, isso significa interconectividade com pontos de presença do mercado estratégico e, a partir daí, para pontos de presença distantes em todo o mundo.

A camada upstream estabelece interconectividade entre o núcleo de dados autoritativo e vários provedores de nuvem que permitem uma estratégia multicloud. Com nossa experiência em ajudar clientes a criar e operar infraestrutura adjacente à nuvem, identificamos quatro padrões comuns de movimento de dados que ocorrem na camada upstream:

  1. Utilização no local
  2. Projetar e excluir
  3. Cache
  4. Backup e restauração

O diagrama abaixo mostra como é o núcleo autoritativo quando implantado na Equinix. Também mostra a camada upstream que se conecta aos provedores de nuvem e a camada downstream que se conecta à borda digital.

Quatro padrões de movimento de dados para casos de uso de multicloud híbrida

Os quatro padrões de movimento de dados compõem a multicloud híbrida em seu nível mais fundamental. Se você não estiver usando um desses quatro movimentos de dados, provavelmente está permitindo que a gravidade dos dados cresça em lugares dos quais você pode se arrepender mais tarde.

Além de dizer como as organizações fazem multicloud híbrida, esses padrões falam sobre por que as empresas fazem multicloud híbrida. Cada um desses padrões tem a ver com ser capaz de mover dados para aproveitar os serviços de nuvem sob demanda, sem que esses dados fiquem presos a um provedor de nuvem específico no processo.

  1. Utilização no local

Quando as pessoas falam sobre dados adjacentes à nuvem, esse é o movimento de dados que normalmente estão descrevendo. Envolve deixar os dados no núcleo autoritativo e trazer computação e outros serviços da nuvem para os dados.

Esse padrão de movimento de dados é útil para muitos casos de uso porque permite a baixa latência exigida por muitos aplicativos modernos. No entanto, pode haver certos aplicativos para os quais a adjacência por si só não é suficiente para atingir a latência ou a taxa de transferência necessárias. Nesses casos, as empresas podem aplicar um dos outros movimentos de dados descritos abaixo ou aproveitar a computação local no núcleo autoritativo.

Com a utilização, as empresas podem aproveitar extensão do data center para posicionar suas cargas de trabalho nos lugares certos, perto da computação em nuvem necessária para criar resultados de negócios. Eles podem fazer isso ao substitior seus data centers privados legados por um ambiente de armazenamento centralizado que fornece acesso a dados seguro e econômico para cargas de trabalho em execução em locais de borda, nuvem e locais.

  1. Projetar e excluir

Ao projetar uma cópia de dados na nuvem, executar as operações de computação necessárias lá, atualizar a cópia à medida que novos dados entram no núcleo de dados autoritativo e, em seguida, excluir a cópia quando não for mais necessária, as empresas podem aproveitar ao máximo os recursos da nuvem sem experimentar altas taxas de saída de dados.

Como os dados nunca precisam voltar da nuvem para o núcleo, não há desincentivo financeiro que impeça as empresas de deixar um determinado provedor de nuvem ou usar esses dados em outros locais. Isso garante flexibilidade para trabalhar com diferentes provedores de nuvem de primeira linha para diferentes casos de uso.

Um exemplo de um caso de uso em que o projeto e a exclusão podem ser particularmente benéficos é o treinamento e a inferência do modelo de IA. A IA é um processo muito repetitivo; para permanecer dentro de níveis aceitáveis de precisão, os modelos precisam ser retreinados com frequência usando grandes conjuntos de dados. Por isso, as empresas podem se beneficiar da migração desses conjuntos de dados para a nuvem sem ter que se preocupar com o alto custo de levá-los de volta ao núcleo.

  1. Cache

O cache é essencialmente o meio termo entre os dois primeiros padrões descritos acima. Envolve a criação de uma representação montável completa de um conjunto de dados em um local alternativo – neste caso, a nuvem. Ao contrário de projetar e excluir, o cache visa criar uma cópia durável em tempo real dos dados, em vez de uma cópia única para uma tarefa de processamento específica.

Uma possível desvantagem do cache é que as alterações nos dados no núcleo autoritativo invalidarão a cópia de dados armazenada em cache. Para resolver isso, as empresas devem executar atualizações de cache ou operações de leitura.

A natureza durável dos conjuntos de dados armazenados em cache faz com que sejam ideais para oferecer suporte a aplicativos com estado de missão crítica. Esses aplicativos podem se conectar a bancos de dados que contenham dados mestre ou de referência com baixa latência. Ao serem executados adjacentes à nuvem, esses aplicativos podem processar dados até 20 vezes mais rápido do que as arquiteturas de dados legadas.

  1. Backup e restauração

Quando há um conjunto de dados de produção que foi originalmente criado em uma nuvem pública, o movimento de dados de backup e restauração permite que você crie uma cópia desses dados em seu núcleo autoritativo. Depois que o backup é criado, ele pode ser usado para fins de proteção de dados — para restaurar o conjunto de dados original — ou replicado para uso em diferentes nuvens e serviços.

As empresas podem aproveitar o backup e a restauração para criar sites virtuais de recuperação de desastres adjacentes à nuvem. Eles são mais rápidos de configurar e mais econômicos do que os locais tradicionais de recuperação física de desastres, além de fornecer velocidades de backup e transferência de dados até 10 vezes mais rápidas. Combinads com a tecnologia de eliminação de duplicação, o custo de saída da nuvem pública pode se tornar irrelevante.

Crie a infraestrutura adjacente à nuvem que desbloqueia os quatro padrões de movimento de dados

Como esses quatro movimentos de dados estão no centro de todas as implantações híbridas de várias nuvens, é fundamental ter a infraestrutura subjacente adjacente à nuvem para suportá-los.

Isso significa o próprio núcleo de dados autoritativo, os recursos de interconexão que compõem as camadas upstream e downstream, a disponibilidade global de nuvem na rampa e a infraestrutura distribuída que oferece suporte a casos de uso de borda. Como empresa™ de infraestrutura digital do mundo, a Equinix é o único parceiro capaz de suportar cada um desses componentes com os locais mais capazes de multicloud a nível global.

Para saber mais sobre como a Equinix permite uma abordagem completa de borda para nuvem, incluindo padrões de movimento de dados adjacentes à nuvem para o sucesso de multicloud híbrida, leia o Guia de Líderes da Equinix para Infraestrutura Digital.

Posts Relacionados:
Adjacência à cloud
Como conversar na cloud

Avatar photo
Glenn Dekhayser Global Principal, Global Solutions Architects
Avatar photo
Ian Botbyl Senior Manager, Product Marketing
Subscribe to the Equinix Blog