본문 바로가기

뉴스

"땡큐 삼성"…젠슨 황, GTC서 삼성 언급한 이유

댓글0
엔비디아 AI 추론칩 '그록3' 첫 공개
"삼성이 제조"…파운드리 협력 확대
AI 칩 시장 초대형 성장 전망도


비즈워치

엔비디아가 인공지능(AI) 추론에 특화된 반도체 '그록3 LPU(Language Processing Unit)'를 공개하며 AI 칩 시장 주도권 굳히기에 나섰다. 이 칩이 삼성전자 파운드리에서 생산된다는 사실도 처음 공개되면서 양사의 협력이 메모리를 넘어 파운드리로까지 확대되는 모습이다.

GPU 보완하는 '추론 전용칩'

젠슨 황 엔비디아 최고경영자(CEO)는 16일(현지시각) 미국 캘리포니아주 새너제이에서 열린 연례 개발자 행사 GTC 2026 기조연설에서 "그록3 LPU를 처음 공개한다"며 "삼성전자가 우리를 위해 그록3 LPU 칩을 제조하고 있다"고 말했다.

이어 그는 "이미 생산 단계에 들어갔고 올해 하반기 아마도 3분기쯤 출하가 시작될 것"이라며 "지금 가능한 한 빠르게 생산을 늘리고 있다. 삼성에게 정말 감사드린다"고 밝혔다.

그록3 LPU는 대형언어모델(LLM)을 실행하는 '추론' 연산에 특화된 AI 반도체다. 지난해 말 AI 반도체 스타트업 그록의 핵심 인재와 기술을 흡수한 뒤 약 3개월 만에 내놓은 첫 결과물이다.

핵심은 메모리 병목을 최대한 줄였다는 점이다. 기존 AI 가속기는 계산을 담당하는 GPU와 데이터를 저장하는 고대역폭메모리(HBM)가 분리돼 있어 데이터가 오가는 과정에서 지연이 발생한다. 반면 그록3 LPU는 연산 반도체 내부에 SRAM을 탑재해 데이터 이동 거리를 줄이고 지연 시간을 크게 낮췄다.

엔비디아의 차세대 AI 플랫폼 '루빈'에는 288GB 규모의 HBM4가 탑재된다. 반면 그록3 LPU는 약 500MB의 SRAM을 사용한다. 메모리 용량은 훨씬 작지만 데이터 대역폭은 초당 150TB 수준으로 루빈 플랫폼보다 약 7배 빠르다.

LPU는 GPU와 달리 데이터 이동 경로와 속도를 미리 설계하는 '결정론적 구조'를 채택했다. 작업 상황에 따라 자원을 동적으로 배분하는 GPU와 다른 방식이다. 이를 통해 데이터 지연을 최소화하고 추론 처리 속도를 끌어올렸다.

다만 한계도 있다. 칩 하나당 토큰 생성 속도는 GPU 기반 가속기보다 낮다. 엔비디아는 이 약점을 보완하기 위해 GPU의 높은 연산 성능과 LPU의 낮은 지연 특성을 결합한 새로운 AI 칩을 개발 중이다.

"AI 칩 시장, 내년 '1조달러' 열린다"

이번 발표는 AI 반도체 시장의 중심이 '학습'에서 '추론'으로 빠르게 이동하는 흐름과 맞물려 있다. 학습이 AI 모델을 만드는 단계라면, 추론은 모델을 실제 서비스에서 실행하는 과정이다. AI 서비스가 확산되면서 추론 연산 수요도 급격히 늘고 있다.

황 CEO는 "AI는 생각하려면 추론해야 하고 행동하려면 추론해야 한다"며 "지금은 추론의 변곡점"이라고 말했다. 그는 또 "지난 2년 동안 컴퓨팅 수요가 100만배 증가했다"며 AI 인프라 수요가 폭발적으로 확대되고 있다고 강조했다.

아울러 엔비디아는 AI 반도체 시장이 앞으로 더 빠르게 팽창할 것으로 내다봤다. 황 CEO는 "AI 칩 시장은 올해 10월까지 전년 대비 2배 성장해 1조달러 규모에 이를 것"이라며 "2027년에는 최소 1조달러 이상의 매출 기회를 보게 될 것"이라고 말했다.

빅테크 기업들도 추론용 반도체 개발에 속도를 내고 있다. 구글은 TPU, 아마존은 트레이니엄, 마이크로소프트는 마이아 등과 같은 주문형 반도체(ASIC)를 잇달아 내놓으며 AI 인프라 경쟁에 뛰어든 상태다. 업계에서는 코딩이나 실시간 검색처럼 데이터 처리 속도가 중요한 영역에서 LPU 수요가 빠르게 늘어날 것으로 보고 있다.

한편 엔비디아는 이날 차세대 AI 반도체 로드맵도 공개했다. 현재 주력 제품인 블랙웰 이후 '베라 루빈' 아키텍처가 등장하고, 그 다음 세대에는 미국 물리학자 이름을 딴 '파인만' 칩이 출시될 예정이다. 매년 새로운 아키텍처를 내놓는 전략으로 AI 반도체 시장에서 기술 격차를 더 벌리겠다는 구상이다.

ⓒ비즈니스워치(www.bizwatch.co.kr) - 무단전재 및 재배포금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

비즈워치 주요뉴스

해당 언론사로 연결

이 기사를 본 사람들이 선택한 뉴스

  • 이투데이인천~나트랑 지연율 45.8% 달해⋯내년부터 지연된 시간 평가 반영
  • 연합뉴스텔레픽스, AI 큐브위성 영상 유럽 첫 수출
  • 헤럴드경제한유원 ‘동반성장몰’ 수해 재난지역 지원 특별 기획전
  • 조선비즈증권 영업 3개월 만에… 우리투자증권, 2분기 순익 159억원
  • 파이낸셜뉴스부산 스포원 체력인증센터, 8~9월 평일 아침 확대 운영

쇼핑 핫아이템

AD