DGX Station for Windows 공개, 1조 모델이 책상 위로
NVIDIA가 GB300 기반 DGX Station for Windows를 공개했습니다. 784GB 메모리와 dual boot로 기업 책상 위 AI 에이전트 장비를 겨냥합니다.
- 무슨 일: NVIDIA가 2026년 6월 1일 DGX Station for Windows를 공개했습니다.
GB300 Grace Blackwell Ultra, 최대 784GB coherent memory, Windows 11과 DGX OS dual boot가 핵심입니다.
- 의미: Windows PC가 AI 에이전트의 얇은 client를 넘어 대형 모델 실행 장비로 올라옵니다.
- 개발자 영향: 1조 parameter급 모델 실험과 private agent prototype을 cloud GPU와 on-prem workstation 사이에서 비교하게 됩니다.
- 판단 기준은 FLOPS보다 데이터 위치, 드라이버 안정성, IT 관리, 전력·소음, 장비 감가상각입니다.
- 주의점: 가격, 실제 출시 구성, Windows on Arm 호환성, 기업 보안 통제는 발표 뒤 검증이 필요합니다.
NVIDIA가 Windows 책상 위로 다시 내려왔습니다. 2026년 6월 1일 NVIDIA는 DGX Station for Windows를 공개했습니다. 회사는 이 장비를 trillion-parameter AI supercomputer라고 부릅니다. 기업 개발자와 연구자가 1조 parameter급 모델을 로컬 책상 가까이에서 개발, fine-tune, inference할 수 있다는 설명입니다. 발표의 중심에는 NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip, 최대 784GB coherent memory, Windows 11과 NVIDIA DGX OS를 오가는 dual-boot 구성이 있습니다.
이 뉴스는 RTX GPU가 들어간 또 하나의 workstation 발표로 읽으면 작아집니다. 전날인 2026년 5월 31일 NVIDIA와 Microsoft는 RTX Spark를 공개했습니다. 발표의 표현은 Windows PC를 personal AI agent용 장치로 포지셔닝했습니다. RTX Spark가 노트북과 소형 데스크톱의 AI PC 범주를 흔드는 발표였다면, DGX Station for Windows는 그 위쪽 enterprise desk 계층입니다. 개인 개발자의 로컬 LLM 장비가 아니라, 회사가 민감한 코드와 데이터를 가까운 곳에 두고 큰 모델 실험을 돌릴 수 있는 장비로 설계됐습니다.

Windows AI PC의 위쪽 계층
Microsoft의 Windows Experience Blog는 RTX Spark를 설명하면서 Windows on Arm, Windows ML, TensorRT, PyTorch, llama.cpp, Hugging Face, Unsloth, Kohya 같은 개발 stack을 함께 언급했습니다. 이 목록은 단순히 AI 앱이 Windows에서 실행된다는 뜻이 아닙니다. 로컬 agent가 모델을 실행하고, 파일을 읽고, 이미지와 비디오 작업을 만들고, shell 또는 앱을 제어하는 구조를 Windows 생태계 안에 넣겠다는 뜻입니다.
DGX Station for Windows는 같은 방향을 훨씬 큰 장비로 밀어붙입니다. NVIDIA의 제품 페이지는 Windows 11과 DGX OS dual boot를 전면에 둡니다. 사용자는 Windows application ecosystem과 기업 관리 도구를 쓰면서, 필요할 때 NVIDIA AI software stack이 깔린 DGX OS로 넘어갈 수 있습니다. 이 구성이 중요한 이유는 기업 AI 개발이 항상 Linux 서버에서만 일어나지 않기 때문입니다. 데이터 과학자는 Excel, Power BI, CAD, Adobe, 사내 Windows 앱을 오가고, 개발자는 VS Code, Git, Docker, Python, model runtime을 함께 씁니다. Windows를 완전히 버리지 않고 대형 AI 장비를 붙이는 선택지가 생깁니다.
NVIDIA가 말한 system maker도 이 제품의 성격을 보여줍니다. 발표에는 Lenovo, Dell Technologies, HP, BOXX가 DGX Station for Windows systems를 제공한다고 적혀 있습니다. 이는 DIY workstation 부품이 아니라 IT 구매, 보증, 배포, 현장 지원을 포함하는 enterprise channel입니다. 회사가 cloud GPU만 쓰지 않고 deskside AI 장비를 사려면, 성능만큼 procurement와 support가 중요합니다.
| 계층 | 대표 장비 | 주요 숫자 | 개발자가 보는 질문 |
|---|---|---|---|
| Personal AI PC | RTX Spark 노트북·소형 데스크톱 | 최대 128GB unified memory, 120B LLM 타깃 | 로컬 에이전트와 앱 호환성이 충분한가 |
| Enterprise desk | DGX Station for Windows | 784GB coherent memory, 1조 parameter급 모델 타깃 | 민감한 데이터와 큰 모델 실험을 사내에 둘 가치가 있는가 |
| Cloud GPU | H100/B200/GB200 instance, managed GPU cloud | 탄력적 quota, 시간당 과금, remote runtime | 대기 시간, 데이터 이동, 비용 예측성을 감당할 수 있는가 |
784GB coherent memory가 말하는 것
DGX Station for Windows 발표에서 가장 먼저 볼 숫자는 784GB coherent memory입니다. AI workstation 경쟁은 GPU FLOPS만으로 설명하기 어렵습니다. 로컬 LLM과 agent workload는 모델 weight, KV cache, 긴 context, retrieval index, tool output, image/video tensor, fine-tuning batch가 동시에 메모리를 요구합니다. 24GB 또는 32GB VRAM 장비는 7B, 14B, 일부 quantized 70B 모델에는 유용하지만, 큰 모델과 긴 context, 멀티모달 작업이 섞이면 빠르게 막힙니다.
NVIDIA는 GB300 Grace Blackwell Ultra Desktop Superchip을 이 문제의 답으로 제시합니다. Grace CPU와 Blackwell GPU가 NVLink-C2C로 연결되고, CPU와 GPU가 같은 coherent memory 공간을 다루는 구조입니다. 발표문은 "1조 parameter 모델"이라는 문구를 앞세우지만, 실무적으로 더 중요한 것은 큰 모델 하나를 겨우 띄우는 장면이 아닙니다. 여러 모델 버전, adapter, retrieval cache, evaluation dataset, agent trace를 같은 장비에서 다루는 반복 작업입니다.
예를 들어 보안팀이 사내 코드베이스를 외부 클라우드 agent에 올리기 어렵다고 판단할 수 있습니다. 이 경우 작은 local model만으로는 충분하지 않습니다. 실제 repository와 사내 문서, build log, 테스트 결과, binary artifact까지 읽는 에이전트를 검증하려면 더 큰 memory와 안정적인 runtime이 필요합니다. DGX Station 같은 장비는 "모델을 한 번 실행하는 장치"보다 "사내 agent 실험과 evaluation을 계속 돌리는 장치"에 가깝습니다.
또 다른 사용자는 media, CAD, simulation, robotics 데이터를 다루는 팀입니다. 이 팀은 텍스트 LLM만 보지 않습니다. 3D asset, image/video generation, digital twin, synthetic data, physical AI pipeline을 함께 봅니다. RTX Spark 발표가 creator와 gamer, developer를 한 장치 범주에 넣은 이유도 여기에 있습니다. DGX Station for Windows는 이 범주를 기업 연구실과 엔지니어링 책상으로 올립니다.
Dual boot는 타협이 아니라 판매 조건입니다
Windows 11과 DGX OS dual boot는 사양표의 작은 항목처럼 보이지만, 기업 도입에서는 핵심 판매 조건입니다. AI 개발팀은 Linux를 선호할 수 있습니다. 하지만 기업 IT는 Windows endpoint management, device inventory, identity, endpoint detection, data loss prevention, 원격 지원을 이미 갖고 있습니다. 반대로 순수 Windows 환경만으로는 CUDA, container, driver, model serving, distributed training stack을 다루기 어려울 수 있습니다.
Dual boot는 이 충돌을 제품 구성으로 풀려는 시도입니다. Windows에서는 사내 앱, Office, design tool, enterprise identity, endpoint policy를 유지합니다. DGX OS에서는 NVIDIA AI Enterprise, CUDA, container 기반 model workflow, DGX Cloud 또는 NGC와 연결된 software stack을 더 직접적으로 씁니다. 개발자에게는 귀찮은 OS 전환일 수 있지만, 구매자에게는 "기존 Windows fleet과 완전히 분리된 Linux 서버를 또 관리해야 한다"는 부담을 줄이는 문장입니다.
물론 dual boot가 모든 문제를 해결하지는 않습니다. agent workflow는 stateful합니다. Windows에서 열어 둔 파일, WSL 또는 container 상태, Linux 쪽 model cache, 회사 네트워크 인증이 OS 전환에서 자연스럽게 이어지지 않을 수 있습니다. 기업이 실제로 원하는 것은 dual boot보다 policy와 data boundary가 명확한 shared workflow입니다. NVIDIA와 Microsoft가 이 지점에서 얼마나 좋은 관리 도구를 제공하는지는 출시 후 확인해야 합니다.
클라우드 GPU와 경쟁하는 지점
DGX Station for Windows가 클라우드 GPU를 대체한다고 쓰면 과합니다. 대규모 학습, burst workload, 여러 팀의 공유 queue, 전 세계 배포, managed service integration은 여전히 cloud가 강합니다. 장비를 한 번 사면 quota 걱정이 줄지만, 전력, 냉각, 보안, 물리적 접근, 고장 대응, 감가상각이 생깁니다. 회사 책상 밑의 AI supercomputer는 낭만적인 표현이지만, 실제 운영에서는 asset management와 helpdesk 티켓의 대상입니다.
그럼에도 deskside 장비가 유효한 경우가 있습니다. 첫째, 데이터 이동 비용이 큰 팀입니다. 의료, 제조, 반도체, 금융, 공공 부문은 원본 데이터와 설계 파일을 클라우드로 올리는 절차가 느리거나 제한됩니다. 둘째, 반복 실험 latency가 중요한 팀입니다. 작은 fine-tuning, adapter 비교, retrieval index 재구성, local agent evaluation을 하루에도 여러 번 돌릴 때 cloud queue와 data sync가 병목이 될 수 있습니다. 셋째, 비용 예측성이 필요한 팀입니다. 월별 GPU bill보다 고가 장비를 3년 감가상각으로 처리하는 편이 예산 설명에 맞을 수 있습니다.
반대 경우도 분명합니다. 팀이 이미 cloud dev environment, hosted CI, managed vector database, model API를 쓰고 있다면 DGX Station은 local island가 될 수 있습니다. 특히 agent 제품은 model inference만으로 끝나지 않습니다. browser automation, external API, database, queue, secret vault, audit log, deployment pipeline이 붙습니다. 이 주변 시스템이 cloud에 있으면 로컬 supercomputer의 장점은 줄어듭니다.
RTX Spark와 DGX Station은 한 묶음입니다
NVIDIA와 Microsoft가 하루 간격으로 RTX Spark와 DGX Station for Windows를 발표한 것은 우연으로 보기 어렵습니다. 하나는 개인 또는 prosumer PC 계층이고, 다른 하나는 enterprise desk 계층입니다. 둘 다 Windows를 AI agent 실행 표면으로 다시 세우려는 메시지를 공유합니다. 차이는 규모입니다. RTX Spark는 최대 128GB unified memory와 120B LLM을 말하고, DGX Station은 784GB coherent memory와 1조 parameter 모델을 말합니다.
이 묶음은 Apple Silicon과도 자연스럽게 비교됩니다. Mac Studio와 MacBook Pro는 이미 큰 unified memory, 조용한 local inference, MLX와 llama.cpp 생태계로 개발자에게 쓰이고 있습니다. NVIDIA는 CUDA, TensorRT, RTX graphics, Windows 앱 생태계, OEM channel로 맞섭니다. 경쟁의 기준은 "로컬에서 모델이 돌아가나"에서 "개발자가 쓰는 agent harness, IDE, media tool, security agent, driver가 덜 깨지는가"로 옮겨갑니다.
Microsoft의 이해관계도 명확합니다. cloud assistant가 강해질수록 Windows PC는 얇은 client로 밀려날 위험이 있습니다. 로컬 agent, Windows ML, RTX Spark, DGX Station for Windows는 PC를 다시 실행 장비로 만드는 주장입니다. 사용자가 프롬프트를 입력하는 화면이 아니라, 모델과 에이전트가 파일, 앱, GPU, NPU, 보안 primitive를 함께 쓰는 장치가 되겠다는 방향입니다.
개발팀이 확인할 체크리스트
첫 번째는 실제 workload trace입니다. 자기 팀의 agent가 무엇 때문에 느린지 봐야 합니다. 모델 inference가 병목인지, repository checkout이 병목인지, browser automation이 병목인지, vector search가 병목인지에 따라 DGX Station의 값은 달라집니다. 784GB memory가 있어도 대부분의 시간이 외부 API 대기라면 큰 장비는 해결책이 아닙니다.
두 번째는 데이터 경계입니다. 로컬 장비가 필요한 가장 강한 이유는 성능보다 데이터입니다. 사내 코드, 고객 데이터, CAD 파일, 보안 로그, 실험 결과를 외부 cloud GPU에 올릴 수 없다면 deskside AI 장비는 실제 선택지가 됩니다. 반대로 데이터가 이미 cloud data warehouse와 object storage에 있다면 로컬 장비로 다시 내려받는 과정이 새 병목을 만들 수 있습니다.
세 번째는 운영입니다. Windows driver, DGX OS, CUDA toolkit, container runtime, antivirus, endpoint detection, disk encryption, identity provider, remote desktop, backup 정책이 함께 맞아야 합니다. "AI supercomputer"라는 이름은 멋지지만, 개발자가 매일 쓰려면 패치 화요일, 드라이버 업데이트, 계정 권한, 사내 proxy, package registry 접근이 더 중요해질 때가 많습니다.
네 번째는 비용 비교입니다. 클라우드 GPU는 비싸지만 사용하지 않을 때 꺼둘 수 있습니다. DGX Station은 비싼 장비를 사는 순간 전력, 공간, 유지보수, 감가상각이 시작됩니다. 조직은 시간당 GPU 비용과 장비 구매가를 단순 비교하면 안 됩니다. 데이터 이동, 보안 승인, queue 대기, 개발자 idle time, 모델 다운로드 시간, 실패 실험 재시도 비용까지 넣어야 합니다.
에이전트 장비 경쟁의 다음 기준
DGX Station for Windows가 보여준 변화는 AI PC라는 말의 상단이 넓어졌다는 점입니다. 2024년 AI PC는 NPU TOPS와 Copilot key로 설명됐습니다. 2026년 NVIDIA와 Microsoft가 말하는 AI PC는 로컬 모델, CUDA, Windows ML, agent runtime, coherent memory, enterprise endpoint management를 함께 묶습니다. PC가 다시 developer infrastructure가 되는 그림입니다.
이 변화는 AI agent 시장에도 직접 닿습니다. 에이전트가 단순히 답변을 생성하는 동안에는 cloud API가 편합니다. 에이전트가 코드를 실행하고, 파일을 읽고, 사내 앱을 조작하고, 시뮬레이션을 돌리고, 민감한 데이터를 평가하는 순간 실행 위치가 제품의 일부가 됩니다. 어디서 실행되는가. 누가 통제하는가. 어떤 로그가 남는가. 실패한 실행은 어떻게 회수되는가. DGX Station for Windows는 그 질문에 대한 NVIDIA와 Microsoft의 enterprise desk 답변입니다.
성공 조건은 분명합니다. 가격이 납득 가능해야 하고, Windows와 DGX OS 사이의 개발 workflow가 끊기지 않아야 하며, enterprise IT가 관리할 수 있어야 합니다. 발표만 보면 숫자는 충분히 큽니다. 1조 parameter, 784GB memory, GB300이라는 단어는 강합니다. 이제 확인할 것은 책상 위 장비가 클라우드 GPU보다 개발자 시간을 줄이고, 보안팀 질문을 줄이고, agent 실험의 반복 속도를 높이는지입니다.
NVIDIA가 만든 메시지는 단순합니다. 로컬 AI는 작은 챗봇을 돌리는 취미가 아니라 기업 인프라가 될 수 있다는 주장입니다. Microsoft는 그 인프라의 화면과 운영 체제를 Windows로 만들고 싶어 합니다. DGX Station for Windows는 그 두 전략이 만난 가장 큰 책상 위 장비입니다.