생성형 AI가 주류로 급부상하여 엔터프라이즈 AI의 빠른 성장을 견인하는 데 일조한지 약 1년이 지났습니다. 최근 IDC 보고서에 따르면 AI(생성형 AI 포함)에 대한 연간 지출은 2023년의 1,759억 달러 규모에서 2027년에는 5,091억 달러 규모로 증가할 것이며, 연평균 성장률(CAGR)은 30.4%입니다.[1]
기업은 기회를 못 알아볼 리 없고 경쟁업체에 뒤처지는 것을 원하지 않기 때문에 자사 AI 전략에 막대한 투자를 하고 있습니다. 그러나 AI 도입 속도가 높아지면서 많은 기업은 AI 전략이 지속가능성과 책임감 있는 방식으로 수행되도록 주의를 기울여야 한다는 점도 알게 되었습니다.
우려가 높아지는 또 하나의 영역은 데이터 관리 및 보호입니다. 결국 데이터는 AI의 핵심입니다. AI와 관련된 약속을 이행하려면 기업은 적절한 출처에서 데이터를 수집하여 적절한 모델에 투입해야 합니다. 이렇게 기업이 AI 전략을 활성화하고자 할 때 해결해야 하는 큰 과제가 하나 있습니다. 어떻게 하면 데이터가 노출되거나 위험한 상황에 처하지 않으면서 AI 모델의 가치를 극대화할 수 있을까요? 이를 위해 많은 기업이 프라이빗 AI로 전환하기 시작했습니다. 프라이빗 AI란 특정 기업의 주도로 또는 특정 기업을 위해 구축되어 해당 기업에서만 사용할 수 있는 AI 환경을 말합니다.
프라이빗 AI와 퍼블릭 AI의 차이점
생성형 AI와 대규모 기반 모델이 확산되기 전, 일반적으로 AI 모델은 프라이빗 모델이 기본이었습니다. 이는 각 모델이 각 기업의 특정 적용 사례를 위한 프라이빗 데이터에 대해 학습이 이루어져야 했기 때문입니다. 퍼블릭 AI가 실행 가능한 것은 기반 모델(예: ChatGPT에 사용되는 대규모 언어 모델[LLM])의 시기에만 국한됩니다. 기반 모델은 다양한 적용 사례에 맞추어 상세 조정될 수 있으므로 다양한 사용자 또는 기업이 동일한 모델을 사용하고 공유할 수 있습니다.
아래 표에서 프라이빗 AI와 퍼블릭 AI를 구분짓는 특징을 요약합니다:
프라이빗 AI | 퍼블릭 AI | |
---|---|---|
목적 | 특정 기업/기관에서 사용하도록 설계된다. 즉, 일반적으로 AI 전략을 실행하는 동시에 데이터에 대한 제어 및 관리 권한을 유지하고자 하는 기업이 이에 해당된다. | 공유 환경의 여러 테넌트가 공개 퍼블릭 도메인에서 사용되도록 설계된다. 이에 해당하는 사용자는 소비자, 기업에 속한 개별 직원, 더 넓게는 기업이 될 수도 있다. |
모델 | 타사에서 또는 내부적으로 개발된다. 어느 쪽이든 이 모델은 일반적으로 방화벽 뒤의 프라이빗 보호 환경에서 호스팅된다. | 타사에서 개발되어 퍼블릭 환경에서 호스팅된다. 모든 사용자와 이 모델 간의 상호작용이 모델 확장에 사용될 수 있다. |
데이터(학습용) | 기업의 가장 민감하고 가치 있는 비즈니스 데이터를 포함하여 자체 데이터 세트만 사용한다. | 퍼블릭 플랫폼에서 구매할 수 있는 데이터 팩과 같이, 공개적으로 입수할 수 있는 데이터를 사용하는 경우가 많다. 사용자가 자체 데이터를 추가하여 세부 조정을 실시할 수도 있다. 이 모델의 서비스 공급자는 학습용 데이터를 액세스 및 저장할 수 있다. |
데이터(추론용) | 일반적으로 기업/기관의 자체 데이터를 사용한다. 해당기업/기관만 데이터에 액세스할 수 있다. | 자체 데이터 또는 공개적으로 입수할 수 있는 데이터를 사용할 수 있다. 이모델의 서비스 공급자는 추론용 데이터를 액세스 및 저장할 수 있다. |
워크로드의 소재 | 온프레미스, 코로케이션 데이터 센터 또는 서비스형 베어메탈 환경과 같은 모든 프라이빗 환경에서 호스팅될 수 있다. | 멀티 테넌트 환경(보통 퍼블릭 클라우드)에서 호스팅된다. |
네트워킹 | 데이터는 프라이빗 전용 네트워크 연결을 통해서만 이동된다. | 데이터는 퍼블릭 인터넷으로 교차 이동될 수 있다. |
현재 프라이빗 AI가 부상하고 있는 이유는 기업이 퍼블릭 AI를 중심으로 AI 전략을 배타적으로 구축하는 데 따르는 한계를 인식하기 시작했기 때문입니다. 용어는 잘 알지 못하더라도 프라이빗 AI의 필요성은 알고 있는 것입니다.
기업을 위한 Top 3 프라이빗 AI
프라이빗 AI의 사용으로 기업은 아래와 같이 AI 전략을 최적화할 수 있는 다양한 기회를 얻을 수 있습니다:
자체 데이터 보호
기업이 자체 데이터를 퍼블릭 AI 모델에 제공한다면 기업이 인지하든 아니든 해당 데이터를 공개하는 데 동의하는 것이 됩니다. 우선, 민감한 데이터를 제3자에게 맡기고 이를 신뢰하고 있는 것인데, 이 제3자가 해당 데이터를 보호하기 위해 적절한 예방조치를 취할 것인지 확신할 수 없습니다. 또한 데이터에서 발견한 비즈니스 인사이트를 취하여 퍼블릭 AI 모델에 구축할 것입니다. 이는 경쟁사가 이러한 인사이트에서 직접적으로 이점을 얻을 수 있다는 의미입니다.
프라이빗 데이터 아키텍처를 사용하면 데이터를 적절한 위치에 기업이 직접 보관할 수 있습니다. 이는 기업의 데이터가 보호되고 있으며 기업의 데이터가 해당 기업의 이점을 위해서만 사용된다는 점을 신뢰할 수 있게 된다는 의미입니다.
규제 리스크 감소
현재 우리는 전 세계 규제 기관이 기업의 데이터 수집, 저장, 전송 및 처리 방법에 대해 새로운 요구사항을 설정하고 있어 규제의 복잡성이 심화되는 시대에 살고 있습니다. 이러한 요구사항은 데이터 독립성 요구사항과 데이터 수명 주기 관리에 대한 특정 규칙을 준수해야 하는 글로벌 기업의 경우 특히 부담스러울 수있습니다. 기업이 AI 모델에 필요한 막대한 양의 데이터에 계속 접속하면서도 법을 위반하지 않을 수 있는 방법은 무엇일까요?
프라이빗 AI 접근 방식을 택한다면 도움이 될 수 있습니다. 기업은 자사에 적합한 모델과 데이터 아키텍처를 설계하여 데이터에 대한 전체적 제어 능력을 확보할 수 있습니다. 여기에는 데이터 저장 및 이동에 사용되는 장비, 데이터가 저장되는 물리 위치, 데이터에 액세스할 수 있는 주체 및 목적을 정확하게 지정하는 것도 포함됩니다. 즉, 퍼블릭 AI 모델을 사용하는 경우처럼 규제 준수의 책임을 제3자에게 아웃소싱할 필요가 없습니다.
성능 및 비용 효율성 최적화
기업이 자체 데이터를 퍼블릭 AI 모델에 제공할 때 데이터와 모델은 일반적으로 서로 다른 환경에 위치합니다. 예를 들면, 퍼블릭 AI 모델은 퍼블릭 클라우드 환경에서 호스팅되는 경우가 많습니다. 따라서 기업이 자체 환경과 퍼블릭 클라우드 간에 데이터를 이동해야 할 때마다 지연 및 이그레스 비용이 발생할 수 있습니다. 특히 성능 최적화에 도움이 되는 상호연결 파트너가 없는 경우 더욱 그렇습니다.
프라이빗 AI 환경을 설계하면 이러한 문제를 최소화할 수 있습니다. 이는 데이터 아키텍처를 AI 모델과 데이터 웨어하우스가 서로 인접하도록 구축하는 것이 될 수도 있습니다. 그렇게 하면 일관성 있고 지연 시간이 짧은 데이터 흐름이 보장됩니다. 또한 데이터가 내부 데이터 아키텍처를 벗어나지 않기 때문에, 기업이 자체 데이터의 이동 권한에 대해 제3자에게 비용을 지불할 필요가 없습니다.
기업이 자체 데이터를 퍼블릭 AI 모델에 제공한다면 기업이 인지하든 아니든 해당 데이터를 공개하는 데 동의하는 것이 됩니다.”Ruth Faller, VP Corporate Development and Strategy, Equinix
프라이빗 AI에 필요한 인프라 요구사항
AI는 획기적인 기술이며 고유의 인프라 요구사항을 수반합니다. 기업은 기존 IT 인프라에 계속 의존하면서 AI의 이점도 얻을 수는 없습니다. 실제로 이런 것은 퍼블릭 AI의 장점에 해당해서, 기업에서는 이를 자체 AI 인프라 구축 없이도 빠르고 쉽게 시작할 수 있는 방법으로 보고 있습니다.
이 블로그 게시물에서 소개한 것처럼, 기업이 AI 전략을 확장할 준비가 되면 자체 프라이빗 인프라를 ‘구축해야 할’ 중요한 이유가 있습니다. 이 섹션에서는 해당 인프라가 어떤 모습이어야 하는지에 대해 설명하겠습니다.
클라우드 인접성
AI 환경이 프라이빗 환경이라고 해서 퍼블릭 클라우드에서 완전히 차단되어야 한다는 의미는 아닙니다. 퍼블릭 클라우드 자료를 활용하고자 하는 이유는 많을 것입니다(예: 호스팅되는 서비스형 AI 모델 벤더와 연결). 핵심은 기업이 원하는 대로 퍼블릭 클라우드에 연결할 수 있다는 점입니다. 즉, 클라우드 인접 데이터
아키텍처를 구축하면 데이터에 대한 관리 권한을 유지하면서 동시에 전용 프라이빗 네트워크 연결을 통해 필요에 따라 데이터를 클라우드로 이동할 수도 있다는 의미입니다.
에코시스템 액세스
기업이 자체 프라이빗 AI 인프라를 구축한다고 해서 반드시 단독으로 구축해야 하는 것은 아닙니다. 다양한 파트너 및 서비스 공급자와 연결하여 AI 인프라에서 필요한 민첩성과 유연성을 얻을 수 있습니다. 적절한 위치에서 적절한 디지털 에코시스템 파트너에게 액세스하여, 기업은 변화하는 비즈니스 요구에 발맞추기 위하여 AI 인프라를 신속하게 확장하고 시간이 지남에 따라 지속적으로 발전시키는 데 필요한 네트워크, 클라우드 및 SaaS 서비스를 배포할 수 있습니다.
파트너가 프라이빗 AI 인프라를 통해 기업에 도움을 줄 수 있는 방법의 예시는 다음과 같습니다:
- 액체 냉각기술의 배포를 도와 고밀도 AI 워크로드의 요구사항을 충족할 수 있도록 지원
- 단일 테넌트서비스형 베어메탈을 통해 전략적 위치에서 필요한 온디맨드 컴퓨팅 용량을 확보할 수 있도록 지원
전 세계적 도달
프라이빗 AI 환경 구축에는 데이터가 생성되는 곳이라면 전 세계 어디서나 귀중한 데이터를 수집할 수 있는 유연성이 필요합니다. 또한. 밀도 및 지연 시간 요구사항을 충족하는 가장 적절한 위치에 AI 워크로드를 배치해야 합니다. 물론 인프라를 사용하기에 최적의 위치이기도 해야 합니다.
이러한 글로벌 리치를 스스로의 힘으로 구축한다고 생각하면 매우 두려울 수 있습니다. 반가운 소식은, 그럴 필요가 없다는 것입니다. Equinix와 같은 글로벌 코로케이션 파트너와 협업하면 단독으로 구축할 때 발생하는 높은 비용과 복잡성을 경험하지 않고도 필요한 모든 위치에서 필요한 AI 인프라를 구축하는 데 도움이 될 것입니다. Equinix는 글로벌 AI 시장의 다양한 주요 업체가 포함되는 밀도 높은 파트너 에코시스템을 비롯하여 전 세계 최고의 클라우드 공급자에 대해 지연 시간이 짧은 온램프를 제공합니다.
분산형 상호연결 디지털 인프라를 갖춘 현대 디지털 경제에서 Equinix고객이 성장을 실현하는 방법에 대해서는 Equinix비전 문서 디지털 리더십의 미래에서 자세히 확인할 수 있습니다.
[1] Rick Villars, Karen Massey, Mike Glennon, Eileen Smith, Rasmus Andsbjerg, Peter Rutten, Ritu Jyoti, Jason Bremner, David Schubmehl, GenAI Implementation Market Outlook: Worldwide Core IT Spending for GenAI Forecast, 2023–2027, IDC Market Note, Doc # US51294223, October 2023.