2026년 3월 30일 기준 엔비디아 해자는 아직 강하다. 다만 지금 시장에서 더 중요한 질문은 GPU가 제일 빠른가가 아니다. 더 중요한 것은 CUDA와 소프트웨어 스택이 여전히 기본 경로인가, NVLink와 네트워킹이 여전히 가장 안전한 대규모 배포 경로인가, 공급망과 고객 권력이 이 마진 구조를 얼마나 갉아먹을 수 있는가다.
엔비디아를 여전히 반도체 회사로만 보면 핵심을 놓치기 쉽다. 2026년 10-K에서 엔비디아는 스스로를 데이터센터 규모 AI 인프라 회사로 정의했고, 실제 사업 설명도 GPU 단품보다 칩 + 인터커넥트 + 시스템 + 소프트웨어 + 서비스에 더 가깝다. 따라서 해자도 단일 제품 성능보다 플랫폼 전체가 만들어내는 전환비용으로 보는 편이 더 정확하다. 2
한눈에 보기
- 사실: 엔비디아의 FY2026 연간 매출은
2,159억 달러, 데이터센터 매출은1,937억 달러, FY2026 4분기 GAAP 매출총이익률은75.0%였다. 지금의 사업은 이미 게임용 GPU 회사의 규모를 훨씬 넘어섰다. 1 2 - 사실: 2026년 10-K에서 엔비디아는
more than half of our engineers work on software라고 적었다. 해자의 중심축이 소프트웨어와 플랫폼 운영에 있다는 회사 스스로의 설명이다. 2 - 사실: CUDA-X 공식 페이지는
400개 이상 라이브러리와100만 명 이상 개발자를 강조한다. 이는 단순한 API 우위보다 축적된 개발 습관과 배포 경로의 우위에 가깝다. 3 - 사실: FY2026 네트워킹 매출은
313.76억 달러였다. 엔비디아는 GPU만 파는 회사가 아니라 네트워킹까지 포함한랙 스케일(rack-scale)AI 인프라 회사가 되었다. 2 - 사실: 엔비디아는 2025년
NVLink Fusion을 발표해 하이퍼스케일러와 커스텀 ASIC 설계사가 자사 NVLink 생태계 안에서세미커스텀AI 인프라를 만들 수 있게 하겠다고 밝혔다. 커스텀 칩 확산을 일부는 자사 플랫폼 안으로 흡수하려는 전략이다. 4 - 사실: 엔비디아는 2025년
DGX Cloud Lepton을 통해 여러 GPU 클라우드 사업자의 용량을 하나의컴퓨트 마켓플레이스로 묶기 시작했고, 여기에NIM,NeMo같은 소프트웨어 계층도 함께 연결했다. 5 - 사실: 2026년 10-K 기준
직접 고객1곳이 매출의22%, 다른 1곳이14%를 차지했다. 해자가 남아 있어도 고객 집중이 높으면 가격 결정력은 먼저 흔들릴 수 있다. 2 - 사실: 같은 10-K에서 엔비디아는 2026회계연도 말 기준 중국 데이터센터 컴퓨트 시장에서
사실상 경쟁이 봉쇄된 상태라고 적었다. 중국은 단순 리스크가 아니라 이미 구조적으로 일부 시장이 닫힌 영역에 가깝다. 2 - 추정: 앞으로 엔비디아 해자의 핵심은 점유율 자체보다
토큰당 비용을 얼마나 빨리 낮추느냐,대형 고객의 커스텀 ASIC 압박을 어느 정도 플랫폼 안으로 흡수하느냐에 달릴 가능성이 높다. - 의견: 현재 엔비디아를 설명할 때 가장 자주 빠지는 부분은
공급망과 고객 권력이다. 해자는 강하지만, 그 해자의 일부는 엔비디아 내부가 아니라 파운드리·패키징·HBM 생태계와 하이퍼스케일러 관계 위에 놓여 있다.
엔비디아의 현재 해자
1. CUDA 다음의 진짜 본체는 소프트웨어 스택이다
엔비디아 해자를 아직도 GPU 성능 우위로만 설명하면 절반만 보는 셈이다. 10-K에서 엔비디아는 자사 플랫폼을 풀스택 컴퓨팅 플랫폼으로 설명하고, 산업별 소프트웨어 스택과 NVIDIA AI Enterprise 같은 유료 소프트웨어까지 함께 강조한다. 2
이 구조의 핵심은 개발자가 코드를 짜는 순간부터 프로덕션에 올릴 때까지의 경로가 이미 엔비디아 기준으로 최적화돼 있다는 점이다. CUDA-X의 라이브러리 수와 개발자 기반은 단순 홍보 수치라기보다 이미 너무 많은 코드, 튜닝 노하우, 운영 관성, 인력 경험치가 엔비디아 위에 쌓여 있다는 뜻에 가깝다. 3
따라서 엔비디아의 첫 번째 해자는 칩이 더 빠르다가 아니라 가장 빠르고 안전하게 배포하는 익숙한 경로에 있다. 이 점에서 해자의 본체는 GPU보다 소프트웨어와 운영 경험에 더 가깝다.
2. 네트워킹과 시스템은 이미 별도 해자다
현재 엔비디아를 GPU 회사로 부르는 것은 점점 부정확해지고 있다. 10-K 기준 FY2026 네트워킹 매출만 313.76억 달러였고, 회사는 GPU, CPU, NVLink switch, DPU, NIC, 스케일아웃 네트워킹, 그리고 소프트웨어를 함께 공동 설계한다고 설명한다. 2
이 점은 중요하다. 대규모 AI 클러스터에서 병목은 이제 GPU 한 장의 FLOPS가 아니라 여러 랙과 노드가 얼마나 잘 묶이는가에서 자주 발생한다. 엔비디아가 Mellanox 이후 만든 구조적 우위는 바로 이 지점에 있다. NVLink와 Spectrum-X, InfiniBand, 랙 스케일(rack-scale) 설계 경험은 GPU 성능표와 다른 층위의 해자다.
NVLink Fusion은 이 해자의 방향을 더 분명하게 보여 준다. 엔비디아는 커스텀 ASIC 흐름을 막기보다, 자사 인터커넥트와 생태계 안으로 편입시키는 쪽을 택했다. 이는 커스텀 칩이 늘수록 엔비디아가 무조건 불리하다는 해석을 단순화한다. 적어도 일부 경쟁은 NVLink 생태계 안에서 발생할 수 있기 때문이다. 4
3. 추론 경제성도 이제 해자의 일부다
훈련 중심 시대에는 누가 더 큰 모델을 더 빨리 학습시키는가가 핵심이었다. 하지만 지금은 장문 추론, 에이전트, 테스트 타임 스케일링이 늘면서 토큰당 비용을 얼마나 낮출 수 있는가가 더 중요해졌다.
엔비디아는 2026년 3월 Dynamo 1.0을 발표하며 자사 추론 소프트웨어를 AI 공장의 추론 운영체제로 위치시켰다. 2026년 1월 발표한 Rubin 플랫폼도 Blackwell 대비 추론 토큰 생성 비용을 크게 줄이는 방향을 전면에 내세웠다. 6 7
이는 엔비디아가 더 이상 고성능 프리미엄 벤더에만 머무르지 않고, 비용을 낮추는 운영체제가 되려 한다는 뜻이다. 커스텀 ASIC의 가장 큰 무기가 비용이라면, 엔비디아도 해자를 지키기 위해 비용 축으로 전장을 옮기고 있는 셈이다.
4. 시장을 조직하는 힘도 해자다
DGX Cloud Lepton은 단순한 클라우드 상품이 아니다. 여러 GPU 클라우드 사업자와 CSP를 연결해 엔비디아 기반 컴퓨트를 시장처럼 조직하려는 시도에 더 가깝다. 여기에 NIM, NeMo, 블루프린트 같은 소프트웨어 계층이 얹히면 엔비디아는 칩 공급자이면서 동시에 GPU가 소비되는 경로를 설계하는 회사가 된다. 5
공급이 부족한 시기에는 누가 더 좋은 칩을 만드느냐만큼 누가 더 많은 컴퓨트 용량과 소프트웨어를 한 묶음으로 엮어 주느냐도 중요하다. 이 점에서 엔비디아는 하드웨어 벤더를 넘어 시장 조직자로 움직이고 있다.
먼저 흔들릴 수 있는 구간
1. 완전한 CUDA 대체보다 이식성 개선이 더 현실적이다
엔비디아 해자를 약화시키는 가장 현실적인 경로는 모든 CUDA 바이너리가 내일부터 다른 GPU에서 그대로 돈다가 아니다. 더 현실적인 경로는 PyTorch, Triton, SYCL, HIP 같은 상위 레이어에서 전환 마찰이 조금씩 낮아지는 것이다.
AMD의 ROCm 경로는 여전히 CUDA의 완전 복제보다 CUDA 코드와 프레임워크를 AMD로 옮기는 마찰을 줄이는 방향에 가깝다. Intel 역시 공식 전략의 무게중심이 즉시 대체 가능한 CUDA 호환보다 CUDA -> SYCL 이식 도구에 있다. 10 11
즉, 엔비디아의 진짜 균열은 기존 CUDA 자산이 한 번에 이탈하는 방식보다 새 워크로드가 처음부터 CUDA 독점이 아닌 형태로 작성되기 시작하는가에서 먼저 나타날 가능성이 높다.
2. 하이퍼스케일러 고객 권력은 점유율보다 먼저 마진을 흔든다
투자자 관점에서 더 중요한 균열은 점유율 붕괴보다 협상력 약화다. 직접 고객 두 곳이 전체 매출의 36%를 차지하는 구조에서는, 대형 고객이 커스텀 ASIC을 키우거나 멀티벤더 전략을 강화할 때 점유율보다 매출총이익률 프리미엄이 먼저 흔들릴 수 있다. 2
이때 커스텀 ASIC의 역할은 엔비디아를 당장 밀어내는 것이 아니라, 가격 협상에서 대체 가능성을 높이는 데 있다. 해자가 남아 있어도 협상력이 약해지면 기대수익률은 달라진다.
놓치기 쉬운 현재 변수
1. 해자의 일부는 공급망 바깥에 있다
지금 엔비디아 해자는 순수하게 내부 역량만으로 설명되지 않는다. 실제 AI 인프라 경쟁력은 파운드리, 첨단 패키징, HBM 공급망과 함께 만들어진다. 10-K도 공급망이 아시아에 집중돼 있고, 대만과 한국의 해외 파트너로부터 안정적인 공급을 받는 능력이 중요하다고 적는다. 2
이 점을 투자자는 과소평가하기 쉽다. 엔비디아가 강한 것은 맞지만, 그 강함의 일부는 TSMC 파운드리·첨단 패키징·HBM 메모리 생태계 위에서 구현된다. SK hynix는 2025년 HBM4 샘플을 주요 고객에게 먼저 공급했고, Micron은 H200용 HBM3E 공급을 공개했으며, 삼성전자도 2026년 GTC에서 NVIDIA Vera Rubin용 HBM4를 전면에 내세웠다. 이는 엔비디아 해자가 외주화된 기반 위에 서 있다는 점을 보여 준다. 12 13 14
따라서 공급망 병목은 단순 운영 리스크가 아니라 해자의 지속 조건이다. 칩 설계 우위만으로는 대규모 AI 공장을 돌릴 수 없기 때문이다.
2. 중국은 리스크가 아니라 이미 부분적으로 닫힌 시장이다
지정학을 막연한 불확실성 정도로만 다루면 현재 상황을 약하게 읽게 된다. 2026년 10-K에서 엔비디아는 현재 규제 환경 아래에서는 중국 데이터센터 시장에 대해 경쟁 가능한 제품을 만들고 공급하기 어렵고, 결과적으로 사실상 경쟁이 봉쇄된 상태라고 적었다. 2
이는 단지 한 분기 실적 변수가 아니다. 중국 시장이 장기간 비어 있으면 그 사이 경쟁사와 현지 생태계가 더 커질 수 있다. 엔비디아가 우위를 지키더라도, 일부 지역에서의 개발자 축적과 고객 습관 형성은 시간이 지날수록 비가역적일 수 있다.
3. AI 공장 경제성도 같이 봐야 한다
현재 엔비디아를 이해할 때 빠지기 쉬운 또 하나의 축은 전력, 냉각, 첫 수익화까지 걸리는 시간이다. 2026년 3월 엔비디아는 Vera Rubin DSX 레퍼런스 디자인과 Omniverse DSX 블루프린트를 발표하면서 AI 공장을 연산 + 네트워킹 + 전력 + 냉각 + 소프트웨어가 함께 설계되는 대상이라고 설명했다. 8
이 말은 곧 해자의 범위가 넓어졌다는 뜻이다. 앞으로 엔비디아가 강하면 강할수록, 그 강점은 칩 단품보다 AI 공장을 더 빨리 짓고 더 많은 와트당 토큰을 뽑아내는 능력에 가까워질 것이다. 반대로 전력과 데이터센터 CAPEX 제약이 커질수록, 엔비디아는 성능뿐 아니라 전체 공장 경제성을 증명해야 한다.
투자 체크포인트
CUDA 전환비용이 실제로 낮아지는가Blackwell -> Rubin -> Dynamo로 이어지는 토큰당 비용 절감이 커스텀 ASIC 압박을 계속 상쇄하는가고객 집중이 높은 구조에서도 매출총이익률 프리미엄이 유지되는가중국 봉쇄와 공급망 제약이 장기 생태계 경쟁력까지 갉아먹기 시작하는가
결론
엔비디아 해자는 아직 살아 있다. 다만 그 해자를 최고의 GPU로만 설명하는 시점은 이미 지났다. 현재의 엔비디아는 CUDA와 소프트웨어, NVLink와 네트워킹, 추론 비용 절감, 시장 조직력이 함께 묶인 AI 인프라 플랫폼 회사에 더 가깝다.
동시에 해자의 균열도 더 정교하게 봐야 한다. 가장 먼저 흔들릴 수 있는 것은 점유율 자체보다 전환비용, 고객 협상력, 공급망 병목, 중국 시장 상실 같은 층위다. 따라서 지금 투자자가 확인해야 할 것은 해자가 있느냐보다 그 해자가 어느 층에서 유지되고 어느 층에서 약해지는가다.
참고 링크
- NVIDIA FY2026 4분기 및 연간 실적 발표
- NVIDIA FY2026 10-K
- NVIDIA CUDA-X
- NVIDIA NVLink Fusion 발표
- NVIDIA DGX Cloud Lepton 발표
- NVIDIA Dynamo 1.0 발표
- NVIDIA Rubin 플랫폼 발표
- NVIDIA Vera Rubin DSX 및 Omniverse DSX Blueprint
- AMD ROCm PyTorch 호환성
- AMD HIP 소개
- Intel DPC++ 호환성 도구
- SK hynix HBM4 샘플 공급
- Micron HBM3E
- Samsung GTC 2026 HBM4E 및 NVIDIA 협력