AI 에이전트로 인한 워크플로우의 급증으로 기존 GPU를 넘어, CPU가 새로운 병목 현상 해결사로 떠오르고 있다. 이에 맞춰 엔비디아가 'CPU 전용 서버'를 선보일 가능성이 점쳐졌다.
로이터와 CNBC 등에 따르면, 엔비디아는 16일(현지시간) 개막하는 'GTC'에서 에이전트 AI 시대에 최적화된 CPU 전략을 공개할 예정이다. GPU 없이 CPU만으로 구성된 서버 랙도 공개될 가능성이 있다.
실제로 엔비디아는 최근 메타와 다년 계약을 체결하며 CPU만을 대규모 배치하는 안을 추진하고 있으며, 여기에는 차세대 '베라(Vera)' CPU가 도입될 예정이다.
엔비디아의 GPU는 오랫동안 데이터센터의 핵심 칩으로 자리 잡아왔지만, 최근 에이전트형 AI의 등장으로 CPU가 다시 주목받고 있다. 디온 해리스 엔비디아 AI 인프라 책임자는 "AI와 에이전트 워크플로가 확대되면서 CPU가 병목이 되는 상황이 나타나고 있다"라며 "CPU 시장이 새로운 성장 기회를 맞고 있다"라고 설명했다.
엔비디아는 2021년 첫 데이터센터 CPU인 '그레이스(Grace)'를 발표했고, 차세대 CPU 베라는 현재 생산 단계에 들어갔다. 이 CPU들은 '호퍼(Hopper)' '블랙웰(Blackwell)' '루빈(Rubin)' 등 엔비디아의 GPU와 대규모 AI 서버 시스템에서 사용된다.
엔비디아는 GPU 폭발적 수요 덕분에 시가총액 약 4조4000억달러(약 6612조원)에 이르는 세계 최대 기업으로 성장했다. 하지만, AI 활용 방식이 바뀌면서 컴퓨팅 요구도 변화하고 있다는 분석이다.
기존에는 AI 모델을 학습시키는 훈련(training)이 핵심이었다면, 이제는 여러 AI 에이전트가 협력해 실제 작업을 수행하는 추론(inference)과 오케스트레이션이 중요해지고 있다. GPU는 대규모 병렬 계산에 강하지만, 데이터 이동과 작업 조율 같은 일반적인 연산은 CPU가 담당한다.
단일 모델의 응답을 기다리는 기존 방식과 달리, 에이전트가 협업하는 환경에서는 이들의 '순서'와 '데이터 흐름'을 제어하는 관리자 역할이 필수적이며, 이를 CPU가 수행한다. 즉, 에이전트 AI 시대에는 CPU의 역할이 크게 늘어나게 된다.
칩 분석가 벤 바자린은 "AI 에이전트들을 조율하는 역할을 맡는 새로운 CPU 인프라가 등장하고 있다"라며 "GPU와 가속기는 계산을 담당하지만, 그 사이를 관리하는 CPU 계층이 필요하다"라고 설명했다.
CPU 수요도 급증하고 있다. 뱅크 오브 아메리카는 전 세계 CPU 시장 규모가 2025년 270억달러에서 2030년 600억달러(약 90조원)까지 두배 이상 성장할 것으로 전망했다.
하지만 수요 폭증으로 공급 부족 현상도 나타나고 있다. AMD와 인텔은 중국 고객들에게 CPU 공급 부족 가능성을 경고했으며, 납기 기간은 최대 6개월까지 늘어나고 가격도 10% 이상 상승한 것으로 전해졌다.
포레스트 노로드 AMD 데이터센터 부문 책임자는 "지난 6~9개월 동안 수요 증가가 전례 없는 수준"이라며 "당분간 둔화할 가능성은 보이지 않는다"라고 말했다.
특히, 엔비디아의 CPU는 기존 CPU와 다른 설계 철학을 기반으로 개발됐다. 가장 큰 차이는 코어 수와 성능 구조다.
일반적으로 서버 시장에서 사용되는 AMD와 인텔의 CPU는 약 128개의 코어를 탑재해 많은 코어를 통해 병렬 작업을 처리하는 데 초점을 맞춘다. 하지만, 엔비디아의 그레이스 CPU는 약 72개의 코어로 상대적으로 적다.
대신, 엔비디아는 CPU의 단일 스레드 성능을 높이는 데 집중했다. 이는 AI 서버에서 매우 값비싼 GPU가 데이터를 기다리며 유휴 상태에 머무르지 않도록 하기 위한 설계로, CPU가 빠르게 데이터를 처리하고 전달해 GPU가 지속적으로 AI 연산을 수행하는 것이 목적이다.
또 엔비디아 CPU는 스마트폰 칩에서 널리 사용되는 암(Arm) 아키텍처 기반으로 설계됐다. 인텔과 AMD 서버 CPU는 전통적인 x86 아키텍처 기반이다.
엔비디아는 경쟁이 심화하는 환경에도 대비하고 있다. 최근 주요 클라우드 기업들이 데이터센터 효율성을 높이기 위해 자체 CPU 개발에 적극 나서고 있기 때문이다.
대표적으로 아마존은 자체 설계한 '그래비톤(Graviton)' CPU를 도입해 클라우드 서비스에 활용하고 있으며, 구글은 '액시온(Axion)' 프로세서를 통해 내부 데이터센터 워크로드를 처리하고 있다. 마이크로소프트도 '코발트(Cobalt)' CPU를 개발해 자체 클라우드 인프라에 적용하고 있다.
이처럼 빅테크 기업들이 자체 반도체 개발을 확대하면서 서버 CPU 시장 경쟁도 치열해지고 있다. 시장 조사 전문 머큐리 리서치에 따르면, 2025년 말 서버 CPU 시장 점유율은 인텔이 60%로 가장 높았다. 이어 AMD가 24.3%, 엔비디아가 6.2%를 차지했다.
엔비디아는 이러한 경쟁 환경에서 GPU뿐 아니라 CPU, 네트워킹, 소프트웨어까지 포함한 풀 스택 AI 플랫폼 전략을 강화하고 있다. 이를 위해 GPU 연결 기술인 NV링크도 외부 기업에 개방했다.
현재 엔비디아는 AI 칩 시장에서 여전히 압도적인 위치를 차지하고 있다. 분석가들은 훈련과 추론 시장에서 엔비디아의 점유율이 90% 이상에 달한다고 보고 있다.
하지만, TPU와 트레이니엄과 같은 자체 ASIC(특정 목적 칩) 개발이 확대되면서 2027년부터는 점유율이 줄어들 가능성이 제기된다.
그런데도 AI 에이전트의 폭발적 확산은 엔비디아에 또 다른 기회를 제공하고 있다는 평이다. GPU 중심의 AI 시대에서 CPU·네트워크·소프트웨어가 결합한 'AI 공장(AI Factory)' 인프라로 확장하고 있기 때문이다.
(사진=엔비디아) |
이번 GTC에서는 이런 변화에 맞춰 CPU는 물론, 추론 프로세스에 최적화한 비전을 공개할 것으로 예측됐다. 여기에는 최근 인수한 추론 칩 스타트업 그로크(Groq)와 투자를 강화한 데이터센터 광학 장비 업체 루멘텀과 코히어런트 등이 추론 효율성 강화에 어떤 역할을 할지 자세한 설명이 포함될 것이라는 설명이다.
제이콥 본 이마케터 애널리스트는 "엔비디아는 루빈부터 파인먼까지 이어지는 풀스택 로드맵 업데이트를 발표하면서 추론, 에이전트 AI, 네트워킹, AI 팩토리 인프라 등을 강조할 것으로 예상한다"라고 내다봤다.
결국 이번 GTC에서는 CPU를 통한 에이전트 시스템의 효율적인 구동, 그로크 기술을 활용한 고속 추론, 그리고 광학 기술 기반의 연결 등을 묶어, 경쟁사들의 ASIC 추격을 따돌리려는 '풀스택 방어선'을 선보일 것이라는 예측이다.
박찬 기자 cpark@aitimes.com
<저작권자 copyright ⓒ ai타임스 무단전재 및 재배포 금지>저작권자>















