Devlery
Blog/AI

3개월 손익분기점, Dell이 에이전트를 책상 옆에 둔 이유

Dell Deskside Agentic AI는 에이전트 추론을 클라우드 API에서 워크스테이션과 데이터센터로 되돌리는 배포 전략입니다.

3개월 손익분기점, Dell이 에이전트를 책상 옆에 둔 이유
AI 요약
  • 무슨 일: Dell이 NVIDIA와 함께 Deskside Agentic AI를 공개해 에이전트 실행을 워크그룹 로컬 장비로 끌어왔습니다.
    • Dell은 2026년 5월 18일 발표에서 GB10, Pro Precision 9, GB300 워크스테이션과 NVIDIA NemoClaw/OpenShell을 묶었습니다.
  • 핵심 숫자: Dell은 클라우드 API 대비 빠르면 3개월 손익분기점, 2년 기준 최대 87% 지출 절감을 주장합니다.
  • 의미: 에이전트 경쟁의 병목이 모델 성능에서 토큰이 어디서 생성되는가로 이동하고 있습니다.
  • 주의점: 비용 수치는 벤더 제공 데이터와 특정 워크로드 가정에 기대므로, 실제 TCO 검증은 각 조직의 사용 패턴에 달려 있습니다.

Dell Technologies가 2026년 5월 18일 Dell Technologies World에서 흥미로운 에이전트 인프라 메시지를 냈습니다. 이름은 Dell Deskside Agentic AI입니다. 얼핏 보면 NVIDIA GPU가 들어간 워크스테이션 신제품 묶음처럼 보입니다. 하지만 발표문이 겨냥하는 문제는 하드웨어 사양표보다 더 구체적입니다. AI 에이전트가 채팅보다 훨씬 많은 토큰을 만들고, 도구를 호출하고, 파일을 읽고, 반복 실행을 하면서 클라우드 API 비용과 데이터 이동 비용을 증폭시키는 상황입니다.

Dell의 해법은 "더 좋은 챗봇"이 아닙니다. 에이전트가 돌아가는 장소를 다시 설계하자는 제안입니다. 데이터가 있는 책상 옆, 연구실, 보안 구역, 워크그룹의 로컬 장비에서 에이전트를 만들고 테스트하고 실행한 뒤, 성공한 워크플로를 데이터센터로 확장하는 방식입니다. 그래서 이 발표는 OpenAI, Google, Anthropic이 내놓는 에이전트 제품 발표와 같은 선상에 있으면서도 결이 다릅니다. 모델이나 앱이 아니라, 에이전트 추론이 만들어지는 물리적 위치와 비용 회계의 문제를 전면에 세웁니다.

Dell Deskside Agentic AI 제품군

발표의 핵심은 워크스테이션이 아니라 토큰 위치입니다

Dell은 별도 종합 발표에서 Dell AI Factory with NVIDIA 확장을 크게 네 갈래로 묶었습니다. 에이전트 AI, AI 데이터 플랫폼, 차세대 인프라, 그리고 Google, Hugging Face, OpenAI, Palantir, ServiceNow, SpaceXAI 같은 파트너 생태계입니다. 그중 개발자에게 가장 직접적인 부분은 Deskside Agentic AI와 NVIDIA OpenShell 지원입니다.

공식 발표에 따르면 Deskside Agentic AI는 Dell 고성능 워크스테이션, NVIDIA NemoClaw reference stack, Dell Services를 결합한 솔루션입니다. Dell Pro Max with GB10은 30B에서 200B 모델의 개인 또는 소규모 프로토타이핑을 겨냥합니다. Dell Pro Precision 9은 Intel Xeon 600 프로세서와 NVIDIA RTX PRO Blackwell 워크스테이션 GPU 구성을 통해 30B에서 500B 모델 범위를 맡습니다. Dell Pro Max with GB300은 NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip 기반으로 120B에서 1조 파라미터급 모델 추론까지 겨냥한다고 설명됩니다.

숫자만 보면 "이제 큰 모델도 책상 밑에서 돌린다"는 식의 하드웨어 뉴스로 읽힐 수 있습니다. 그러나 Dell이 반복해서 강조한 문장은 따로 있습니다. 에이전트형 워크플로는 단일 프롬프트와 단일 응답이 아니라는 점입니다. 여러 전문 에이전트가 서로 작업을 나누고, 파일을 읽고, 계획을 수정하고, 도구를 호출하고, 테스트를 반복하면 토큰 소비는 선형으로 늘지 않습니다. 토큰 가격이 내려가도 전체 사용량이 더 빠르게 늘면 월별 API 비용은 여전히 예측하기 어려워집니다.

여기서 "책상 옆"이라는 표현이 중요해집니다. Dell은 클라우드가 필요 없다고 말하지 않습니다. 오히려 큰 frontier 모델, 탄력적 확장, 중앙화된 데이터센터가 필요한 작업은 계속 클라우드와 데이터센터에 남는다고 봅니다. 다만 모든 에이전트 단계를 원격 API로 보내는 방식은 민감한 코드, 연구 데이터, 규제 데이터, 사내 문서가 얽힌 워크플로에서 비용과 보안의 병목이 된다는 주장입니다.

3개월 손익분기점과 87% 절감이라는 공격적인 숫자

Dell이 가장 강하게 내세운 수치는 두 가지입니다. 첫째, 공용 클라우드 API 비용 대비 빠르면 3개월 안에 손익분기점에 도달할 수 있다는 주장입니다. 둘째, 2년 기준 최대 87%까지 지출을 줄일 수 있다는 주장입니다. 둘 다 Signal65와 Futurum Group의 검증 분석을 근거로 제시됐고, Dell은 이 분석이 공개 API 가격, Dell 솔루션 가격, Dell이 제공한 성능 데이터, 일반 지식·영업·소프트웨어 개발 에이전트 워크로드 가정에 기반한다고 각주로 설명했습니다.

Dell이 설명한 에이전트 AI 클라우드 비용 구조

3개월
Dell이 제시한 빠른 손익분기점
87%
2년 기준 최대 지출 절감 주장
30B-1T
워크스테이션별 목표 모델 범위

이 숫자는 매력적이지만 그대로 받아들이면 위험합니다. 온프레미스나 로컬 장비의 경제성은 장비 구매가, 전력, 냉각, 유지보수, GPU 활용률, 모델 압축, 운영 인력, 장애 대응, 보안 감사 비용에 따라 크게 달라집니다. 특히 에이전트 워크로드는 아직 표준화된 측정 단위가 없습니다. 채팅 API처럼 "입력 토큰과 출력 토큰"만으로 비교하기 어렵고, 도구 호출, 파일 IO, 재시도, 실패한 작업의 폐기 비용까지 포함해야 합니다.

그럼에도 Dell의 수치가 의미 있는 이유는 있습니다. 벤더가 에이전트 비용을 더 이상 "모델 가격표"만으로 설명하지 않기 시작했다는 점입니다. 지난 1년 동안 AI 기업들은 더 빠르고 싼 모델을 계속 내놓았습니다. 하지만 에이전트는 비용 절감분을 다시 사용량 증가로 먹어치우는 경향이 있습니다. 코딩 에이전트가 테스트를 네 번 돌리고, 리포지터리 전체를 훑고, PR 코멘트를 반영하고, 실패한 접근을 되돌리는 순간 토큰은 업무 프로세스의 운영비가 됩니다.

그래서 이번 발표의 진짜 질문은 "Dell 워크스테이션을 사야 하는가"가 아닙니다. 더 현실적인 질문은 "우리 조직의 에이전트 추론 중 어느 부분을 클라우드에 두고, 어느 부분을 데이터와 가까운 곳에 둘 것인가"입니다. 고빈도 반복 작업, 민감한 코드 검색, 사내 문서 기반 리서치, 규제 산업의 의사결정 보조처럼 로컬 데이터 접근이 핵심인 작업은 클라우드 API 단가만 보고 판단하기 어렵습니다.

NemoClaw와 OpenShell, 로컬 에이전트의 운영 계층

Dell 발표에서 하드웨어만큼 중요한 이름은 NVIDIA NemoClaw와 OpenShell입니다. Dell은 NemoClaw를 OpenClaw, NVIDIA Nemotron open models, OpenShell secure runtime을 묶은 reference stack으로 설명합니다. 목적은 로컬 하드웨어에서 장기 실행되고, 항상 켜져 있으며, 여러 단계로 움직이는 에이전트를 관리하는 것입니다.

OpenShell은 더 직접적인 운영 계층입니다. Dell 설명에 따르면 OpenShell은 Dell AI Factory 전반에서 지원되며, 워크스테이션부터 PowerEdge XE 서버까지 샌드박스 실행 환경과 보안·프라이버시 제어를 제공합니다. Dell의 실험에서 비즈니스 임팩트로 이동하는 글도 OpenShell을 각 에이전트가 개별 격리 샌드박스에서 실행되도록 하는 런타임으로 설명합니다.

이 부분은 최근 에이전트 플랫폼 경쟁과 맞닿아 있습니다. OpenAI Agents SDK, Google Gemini API Managed Agents, Anthropic의 커넥터와 권한 모델 모두 같은 문제를 다룹니다. 에이전트는 텍스트를 생성하는 모델 호출이 아니라, 파일을 읽고, 명령을 실행하고, 외부 시스템을 호출하는 실행 주체입니다. 그러므로 안전한 에이전트 배포에는 프롬프트 가드레일만으로 부족합니다. 파일 시스템 경계, 네트워크 경계, 도구 승인, 상태 보존, 감사 로그, 정책 적용이 필요합니다.

Dell과 NVIDIA의 접근은 이 제어를 로컬 인프라와 연결합니다. 클라우드 관리형 에이전트가 "격리된 실행 환경을 API로 빌려준다"에 가깝다면, Deskside Agentic AI는 "격리된 실행 환경을 조직의 장비와 데이터 위치 안에 둔다"에 가깝습니다. 둘 중 하나가 절대적으로 우월하다는 뜻은 아닙니다. 대신 에이전트 인프라 시장이 클라우드 API, 관리형 샌드박스, 데스크사이드 워크스테이션, 데이터센터 서버 사이의 라우팅 문제로 바뀌고 있다는 뜻입니다.

배치 위치강점주의할 점
클라우드 API최신 frontier 모델, 탄력적 확장, 낮은 초기 비용반복 에이전트 작업에서 비용 예측이 어려워질 수 있음
책상 옆 워크스테이션데이터 근접성, 낮은 지연, 민감 데이터의 로컬 처리장비 활용률과 운영 역량이 경제성을 좌우함
온프레미스 데이터센터통합 거버넌스, 대규모 사내 데이터, 규제 대응초기 설계와 배포 리드타임이 길어질 수 있음

워크호스 모델의 부상

Dell은 발표에서 "대략 절반 이상"의 에이전트 워크플로가 open-weight 모델에서 돌아간다는 내부 분석을 언급하며, 30B에서 284B 파라미터 범위를 대량 추론을 담당하는 워크호스 모델 구간으로 봅니다. 제품 페이지에서는 실제 에이전트 워크로드 상당수가 70B에서 235B 모델에 적합하다고 설명합니다. 여기서 중요한 단어는 "frontier"가 아니라 "workhorse"입니다.

AI 업계의 뉴스 표면은 여전히 가장 큰 모델과 최고 벤치마크 점수에 몰려 있습니다. 하지만 기업 에이전트 운영에서 매번 가장 큰 모델을 호출하는 것은 경제적으로 맞지 않을 수 있습니다. 코드 검색, 문서 분류, 로그 요약, 내부 리포트 초안, 테스트 실패 분석, 정형화된 도구 호출처럼 반복되는 작업은 충분히 좋은 중형 모델을 가까운 곳에서 많이 돌리는 편이 나을 수 있습니다. 큰 모델은 어렵고 애매한 판단, 고난도 reasoning, 외부 지식이 필요한 단계에 라우팅하면 됩니다.

이 관점은 최근 모델 라우팅과도 연결됩니다. AI 팀들은 단일 모델을 고르는 대신, 작업 유형과 민감도에 따라 모델을 나누기 시작했습니다. 빠른 모델, 싼 모델, 긴 컨텍스트 모델, 코딩 모델, 로컬 모델, 감사 가능한 모델을 조합합니다. Dell/NVIDIA의 이번 발표는 그 라우팅 계층을 하드웨어 배치까지 확장합니다. 어떤 작업은 API 게이트웨이를 지나 클라우드로 가고, 어떤 작업은 워크스테이션의 open-weight 모델로 가며, 어떤 작업은 데이터센터의 사내 GPU 풀로 갑니다.

이 흐름은 개발자에게도 영향을 줍니다. 에이전트 애플리케이션을 설계할 때 모델 호출 코드를 하나의 provider로 추상화하는 것만으로는 부족해질 수 있습니다. 데이터 위치, 도구 실행 권한, 샌드박스 정책, 로그 보존 위치, 실패 시 재시도 위치가 설계 대상이 됩니다. "이 에이전트가 어떤 모델을 쓰는가"보다 "이 에이전트의 어느 단계가 어느 인프라에서 실행되는가"가 더 중요한 질문이 됩니다.

Dell의 메시지는 OpenAI-Dell Codex 발표와도 이어집니다

하루 전후로 OpenAI와 Dell은 Codex를 하이브리드 및 온프레미스 기업 환경으로 가져가는 협력도 발표했습니다. devlery에서 이미 다룬 것처럼, 이 흐름은 코딩 에이전트가 개발자 개인의 IDE 보조 기능을 넘어 기업 데이터, 저장소, 보안 정책, 배포 환경 안으로 들어가고 있음을 보여줍니다. 이번 Deskside Agentic AI는 그보다 더 넓은 인프라 그림입니다.

Codex 온프레미스가 "특정 에이전트 제품을 기업 환경에 배치하는 문제"라면, Deskside Agentic AI는 "여러 에이전트와 모델을 어떤 물리적 계층에서 돌릴 것인가"에 가깝습니다. Dell은 발표문에서 코딩 보조, 연구 에이전트, 규제 산업의 프라이빗 AI 어시스턴트 같은 예시를 듭니다. 즉 소프트웨어 개발팀만이 아니라 연구소, 제조, 금융, 공공 부문처럼 민감한 데이터와 반복 분석이 많은 워크그룹을 겨냥합니다.

여기서 Dell의 영업적 이해관계를 빼놓으면 안 됩니다. Dell은 당연히 더 많은 워크스테이션, 서버, 스토리지, 서비스를 팔고 싶어 합니다. NVIDIA 역시 agentic AI가 더 많은 로컬·온프레미스 추론 수요를 만든다는 이야기가 필요합니다. 그래서 공식 숫자는 독립적인 실사용 사례가 충분히 쌓이기 전까지는 신중하게 읽어야 합니다. 하지만 벤더의 이해관계와 별개로, 문제 제기 자체는 현실적입니다. 에이전트가 실제 업무 프로세스에 들어오면 "클라우드 API를 조금 더 싸게 쓰면 된다"로 끝나지 않습니다.

커뮤니티 반응은 아직 얕지만, 논점은 분명합니다

Hacker News나 GeekNews에서 이 특정 발표에 대한 큰 개발자 토론은 아직 두드러지지 않습니다. Reddit에서는 r/Dell과 NVIDIA 투자자 커뮤니티를 중심으로 OpenAI-Dell 협력, Dell/NVIDIA AI Factory, 로컬 에이전트 인프라에 대한 짧은 반응이 보입니다. 다만 대부분은 실제 개발 경험보다는 기업 AI 인프라 시장과 NVIDIA 수요 전망에 가까운 이야기입니다.

그 공백 자체가 시사하는 점도 있습니다. 로컬 에이전트 인프라는 아직 개발자가 "설치해 보고 비교했다"고 말할 만큼 대중화된 영역이 아닙니다. Codex, Claude Code, Gemini CLI처럼 개인 개발자가 바로 써보는 제품과 달리, Deskside Agentic AI는 구매·배포·보안 검토·운영 모델이 필요한 기업 인프라입니다. 따라서 초기 평가는 벤더 자료와 언론 브리핑에 치우칠 수밖에 없습니다.

개발자 관점에서 봐야 할 것은 제품명보다 아키텍처의 방향입니다. 앞으로 에이전트 런타임은 세 가지 질문을 계속 받게 됩니다. 첫째, 에이전트가 접근하는 데이터는 어디에 있는가. 둘째, 도구 실행과 파일 접근은 어떤 샌드박스에서 통제되는가. 셋째, 반복 추론 비용은 누가 예측하고 제한하는가. Dell/NVIDIA 발표는 이 세 질문을 워크스테이션과 데이터센터 인프라 판매 언어로 번역한 사건입니다.

실무 팀이 지금 확인할 것

당장 모든 팀이 데스크사이드 AI 장비를 검토해야 한다는 뜻은 아닙니다. 오히려 먼저 해야 할 일은 현재 에이전트 사용량을 분해하는 것입니다. 코딩 에이전트, 리서치 에이전트, 문서 요약, 고객 지원 자동화, 내부 BI 분석에서 어떤 단계가 고빈도 반복 작업인지, 어떤 단계가 민감 데이터와 가까운지, 어떤 단계가 꼭 최고 성능 모델을 필요로 하는지 나눠야 합니다.

그다음에는 실패 비용을 봐야 합니다. 에이전트가 잘못된 도구를 호출했을 때, 외부 API로 민감한 맥락을 보냈을 때, 테스트를 반복하며 수천만 토큰을 소비했을 때, 또는 로컬 장비가 놀고 있을 때의 비용이 각각 다릅니다. 클라우드 API는 시작이 쉽지만 사용량이 보이지 않으면 비용이 뒤늦게 드러납니다. 로컬 장비는 단가를 고정할 수 있지만 활용률이 낮으면 비싼 실험 장비가 됩니다. 온프레미스 데이터센터는 통제력이 높지만 배포와 운영이 무거울 수 있습니다.

마지막으로 에이전트 런타임의 이식성을 봐야 합니다. Dell은 OpenShell이 워크스테이션에서 서버까지 이어진다고 말합니다. Google은 Managed Agents와 Antigravity harness를 Gemini API와 AI Studio에 연결합니다. OpenAI는 Agents SDK와 Codex 경로를 확장합니다. Anthropic은 SDK, MCP, 커넥터, 엔터프라이즈 배포를 강화합니다. 이 경쟁에서 개발자에게 중요한 것은 특정 벤더의 "완전한 제어판"에 갇히지 않고, 에이전트 정의·도구 권한·로그·상태를 최대한 이식 가능하게 유지하는 일입니다.

책상 옆 AI 공장은 과장일 수도, 조기 신호일 수도 있습니다

Dell Deskside Agentic AI는 과장된 마케팅 문구를 많이 품고 있습니다. "AI Factory", "agentic era", "production-ready" 같은 말은 이제 거의 모든 기업 AI 발표에 등장합니다. 하지만 이번 발표에는 흘려보내기 어려운 구조적 변화가 있습니다. 에이전트가 늘어날수록 추론은 더 이상 추상적인 API 호출이 아니라, 위치와 전력과 냉각과 데이터 경계와 감사 로그를 가진 운영 자원이 됩니다.

클라우드가 사라지는 것은 아닙니다. 오히려 더 강력한 모델과 관리형 에이전트 플랫폼은 계속 클라우드에서 먼저 나올 가능성이 큽니다. 다만 에이전트가 실제 업무를 반복적으로 수행하기 시작하면, 모든 단계를 원격 API로 보내는 방식은 점점 더 많은 예외를 만듭니다. 민감한 데이터는 움직이기 어렵고, 장기 실행 에이전트는 많은 상태를 남기며, 반복 추론은 비용을 누적합니다.

그래서 Dell의 책상 옆 AI 공장은 하나의 제품 발표라기보다 질문에 가깝습니다. 에이전트 시대의 기본 배포 단위는 무엇인가. 모델 API인가, 샌드박스 런타임인가, 워크스테이션인가, 데이터센터인가. 지금은 답이 하나로 정리되지 않았습니다. 하지만 이번 발표는 기업 AI 인프라 업체들이 이미 같은 결론을 향해 움직이고 있음을 보여줍니다. 에이전트가 일하는 곳은 모델이 있는 곳이 아니라, 데이터와 비용 통제가 만나는 곳이 될 가능성이 큽니다.