BlueField-4 STX 보안 공개, 에이전트 기억을 실리콘에서 통제

NVIDIA가 DOCA Vault, Argus, Flow로 BlueField-4 STX에 에이전트 데이터 접근 통제를 넣었습니다. KV 캐시와 파일 보안의 변화입니다.

AI 요약

무슨 일: NVIDIA가 Vera BlueField-4 STX용 DOCA Vault, Argus, Flow 보안 기능을 공개했습니다.
- 발표일은 2026년 5월 31일 GTC Taipei이며, 대상은 에이전트가 읽는 파일, 컨텍스트 메모리, 네트워크 경로입니다.
숫자: NVIDIA는 런타임 위협 탐지가 기존 agentless 방식보다 최대 1000배 빠르고 정책 집행은 최대 800Gb/s라고 주장합니다.
의미: 에이전트 보안의 통제점이 앱 로그와 프롬프트 필터에서 storage, DPU, data path로 내려갑니다.
- 개발팀은 모델 권한뿐 아니라 KV cache, 파일 접근, multi-tenant network isolation까지 threat model에 넣어야 합니다.

NVIDIA가 2026년 5월 31일 GTC Taipei에서 Vera BlueField-4 STX용 DOCA 보안 기능을 발표했습니다. 보도자료의 대상은 모델 API가 아니라 AI 에이전트가 실제로 읽고 쓰는 저장소, 컨텍스트 메모리, 네트워크 경로입니다. NVIDIA는 새 DOCA Vault, DOCA Argus, DOCA Flow 기능이 BlueField-4 실리콘에서 정책을 집행해 에이전트와 데이터 사이의 상호작용을 inline으로 검사한다고 설명했습니다.

이 뉴스는 Vera Rubin 플랫폼 전체나 Vera CPU 출하 이야기와 구분해서 볼 필요가 있습니다. devlery에서도 이미 Vera CPU가 OpenAI와 Anthropic 같은 AI 랩에 전달된 사건, DGX Station for Windows, RTX Spark, Alpamayo 2 Super를 다뤘습니다. 이번 발표의 초점은 compute 공급이 아니라 장기 컨텍스트와 파일 기반 데이터 접근이 보안 경계가 된다는 점입니다. 에이전트가 코드를 고치고, 문서를 검색하고, 도구를 호출하고, 중간 상태를 저장할수록 보안 검사는 채팅 UI 바깥의 data path로 내려갑니다.

NVIDIA DOCA 보안 구조 .

NVIDIA 보도자료는 이 변화를 "storage가 실시간 control point가 된다"는 문장으로 설명합니다. 에이전트는 proprietary data와 context memory에 빠르게 접근해야 하고, 동시에 인간이 매번 승인하지 않는 상태로 정보를 읽고 쓰고 공유합니다. 기존 보안 도구가 애플리케이션 로그, endpoint agent, API gateway에서 뒤늦게 이상 행위를 찾는 방식이라면, BlueField-4 STX는 storage processor와 DPU 경로에서 파일 접근과 네트워크 흐름을 집행하려는 설계입니다.

숫자는 공격적입니다. NVIDIA는 DOCA가 Vera BlueField-4 STX에서 런타임 위협 탐지를 기존 agentless runtime solution보다 최대 1000배 빠르게 제공하고, network와 file access policy를 최대 800Gb/s 속도로 집행한다고 밝혔습니다. 이 수치는 독립 벤치마크가 아니라 NVIDIA 발표 기준입니다. 그래도 방향은 분명합니다. 에이전트 보안이 모델 응답 검열이나 prompt injection 차단만으로 끝나지 않고, storage I/O와 network packet 처리 성능 안에서 계산돼야 한다는 주장입니다.

이번 발표에 나온 이름은 세 가지입니다. DOCA Vault는 승인된 AI workload만 올바른 파일과 권한에 접근하도록 돕는 microservices입니다. DOCA Argus는 agent behavior와 AI workload activity를 관측하는 기능입니다. DOCA Flow는 BlueField 프로세서에서 packet processing pipeline을 실행해 multi-tenant AI 환경의 traffic isolation과 policy enforcement를 맡습니다. NVIDIA 기술 블로그는 이 세 기능을 runtime visibility, zero-trust data protection, accelerated network enforcement의 조합으로 설명합니다.

기능	통제 대상	개발팀이 확인할 질문
DOCA Vault	파일, 모델, 데이터셋, 컨텍스트 메모리 접근	어떤 agent workload가 어떤 파일을 만들고 읽을 수 있는가
DOCA Argus	에이전트 행동, workload activity, runtime integrity	정상 plan, tool call, file access의 기준선을 어디에 둘 것인가
DOCA Flow	네트워크 트래픽, segmentation, packet inspection	tenant, agent, storage service 사이 통신을 어디서 차단할 것인가

BlueField-4 STX가 갑자기 나온 제품은 아닙니다. NVIDIA는 2026년 3월 GTC에서 STX를 AI-native storage reference architecture로 공개했습니다. 당시 보도는 긴 컨텍스트와 KV cache가 GPU HBM을 압박한다는 병목에 집중했습니다. Tom's Hardware의 2026년 3월 17일 정리에 따르면 STX는 CPU를 거치는 host DRAM/NVMe 경로 대신 BlueField-4가 NVMe SSD와 data integrity, encryption을 직접 다루는 구조입니다. NVIDIA는 그때 STX가 기존 CPU 기반 storage architecture보다 token throughput 5배, energy efficiency 4배, page ingestion 2배를 제공한다고 주장했습니다.

5월 31일 발표는 그 성능 이야기에 보안 책임을 붙였습니다. 장기 컨텍스트 에이전트는 한 번 답하고 끝나는 chatbot보다 많은 상태를 남깁니다. retrieval 결과, 중간 reasoning artifact, tool output, session memory, KV cache, 파일 diff가 모두 다음 단계의 입력이 됩니다. 이 데이터가 잘못 노출되면 prompt injection이 단순한 답변 오염을 넘어 내부 문서 유출, 모델 컨텍스트 탈취, tenant 간 데이터 섞임으로 이어질 수 있습니다.

NVIDIA의 표현에서 "context memory"는 마케팅 문구만은 아닙니다. Transformer inference에서 KV cache는 긴 대화와 multi-turn agent 작업의 비용을 결정합니다. 모델이 이미 본 token의 key/value를 저장해 다음 token 생성에 재사용하기 때문입니다. 컨텍스트 창이 수십만 token으로 커지고 여러 에이전트가 같은 작업 상태를 나눠 쓰면, KV cache는 GPU memory 안에만 머물기 어렵습니다. STX가 storage layer를 agentic AI의 일부로 끌어올린 이유가 여기에 있습니다.

DOCA Vault 데이터 보안 구조 .

보안 관점에서 KV cache와 파일 storage는 다르게 보이지만 같은 질문을 만듭니다. 어떤 workload가 어떤 컨텍스트를 읽을 수 있는가. 어떤 agent가 생성한 파일을 다른 agent가 재사용할 수 있는가. 실행 중인 container가 policy에 없는 파일을 만들거나 모델 weight를 외부로 보내려 할 때 어디서 막을 것인가. DOCA Vault는 이 질문을 파일 기반 AI-native storage의 권한 문제로 다루고, DOCA Argus는 workload 행동과 runtime integrity를 관측하는 쪽에 가깝습니다.

NVIDIA 기술 블로그는 Vault가 전통적인 authorization을 넘어 runtime integrity control을 집행한다고 설명합니다. 예시는 승인되지 않은 file creation 방지, 특정 program 실행 제한, runtime drift 제한, model 또는 data exfiltration 차단입니다. 이 설명은 agent sandbox나 app-level permission prompt와 다른 계층을 가리킵니다. 사용자가 "이 도구를 실행해도 되는가"를 승인하는 UI보다 아래에서, storage processor가 workload의 파일 행위를 정책과 맞춰 보는 구조입니다.

DOCA Flow는 네트워크 쪽 담당입니다. NVIDIA의 DOCA 페이지는 Flow가 packet inspection, segmentation, policy enforcement, threat mitigation, accelerated encryption을 data path에서 처리한다고 설명합니다. AI factory가 여러 tenant, 여러 모델, 여러 storage service, 여러 agent runtime을 묶으면 lateral movement가 공격 표면이 됩니다. 에이전트 하나가 취약한 connector를 통해 침해됐을 때 같은 rack이나 pod의 다른 storage service로 이동하지 못하게 하는 문제가 됩니다.

이 접근은 기존 cloud security 팀에도 낯설지 않습니다. DPU, SmartNIC, IPU는 오래전부터 host CPU 밖에서 네트워크와 storage를 격리하는 장치로 쓰였습니다. 차이는 AI agent workload가 그 필요성을 더 자주 드러낸다는 점입니다. 전통적인 웹 서비스는 request, database query, response의 경로가 비교적 예측 가능합니다. 반면 agent는 plan을 세우고, 검색하고, 코드를 실행하고, 실패하면 재시도하고, 파일을 만든 뒤 다른 도구로 넘깁니다. 보안 정책은 API endpoint 단위보다 workload 행동과 데이터 이동 단위로 쪼개집니다.

파트너 명단도 이 발표의 성격을 보여줍니다. 보안 쪽에는 Akamai, Armis from ServiceNow, Check Point, Cisco, CrowdStrike, EQTY, F5, Fortinet, Palo Alto Networks, TrendAI, Xage Security, Zscaler가 언급됐습니다. storage와 data platform 쪽에는 DDN, Dell Technologies, HPE, Hitachi Vantara, IBM, MinIO, NetApp, Nutanix, Pure Storage, VAST Data, WEKA가 들어갑니다. NVIDIA가 혼자 agent security product를 파는 구조라기보다, BlueField-4와 DOCA를 security vendor와 storage vendor가 붙을 수 있는 enforcement substrate로 제시하는 모양입니다.

개발자에게 직접적인 영향은 당장 "DOCA 코드를 써야 한다"가 아닙니다. 대부분의 애플리케이션 팀은 BlueField DPU를 직접 프로그래밍하지 않습니다. 영향은 배포 아키텍처 질문으로 옵니다. 장기 실행 agent를 enterprise data 위에 올릴 때, 데이터 접근 정책을 app middleware에만 둘지, storage platform과 network fabric에도 둘지 결정해야 합니다. 특히 여러 고객의 문서, source code, embedding store, KV cache를 같은 AI cluster에서 처리하는 팀은 tenant isolation을 모델 gateway 밖에서도 검증해야 합니다.

MCP server, coding agent, retrieval agent를 운영하는 팀은 threat model을 더 구체적으로 써야 합니다. 예를 들어 agent가 사내 Git repository를 읽고 test log를 저장한 뒤 issue tracker에 comment를 쓰는 workflow가 있다고 가정합니다. 이때 보호 대상은 prompt와 final answer만이 아닙니다. checkout된 source tree, dependency cache, tool stdout, 임시 patch file, vector index, long-context cache가 모두 데이터 경계에 들어갑니다. BlueField-4 STX 발표는 이런 중간 산출물이 storage 보안의 관리 대상이라고 못박은 셈입니다.

물론 모든 팀이 이 레벨의 인프라를 필요로 하지는 않습니다. 소규모 SaaS나 내부 도구는 cloud provider의 managed IAM, audit log, object storage policy, endpoint security만으로 충분할 수 있습니다. BlueField-4 STX와 DOCA stack은 대규모 AI factory, multi-tenant inference, 보안 벤더, storage platform 사업자에게 더 직접적인 뉴스입니다. Reddit의 r/homelab 논의에서도 BlueField류 DPU는 일반 사용자가 쉽게 다루는 장비가 아니라 극단적인 scale과 복잡한 isolation 요구가 있을 때 의미가 있다는 반응이 있었습니다.

그래도 이 발표가 넓은 개발자 시장에 남기는 질문은 작지 않습니다. 에이전트 보안 제품이 어디까지 관측해야 충분한가. API gateway가 tool call을 기록하는 것으로 충분한가, 아니면 storage 계층에서 파일 생성과 읽기까지 봐야 하는가. prompt injection 대응은 모델 입력 정제만으로 충분한가, 아니면 agent가 접근할 수 있는 파일과 network segment를 hardware-enforced policy로 줄여야 하는가. NVIDIA는 답을 "data path 안쪽"으로 끌고 가고 있습니다.

비용과 운영 복잡도는 남습니다. DPU 기반 보안은 성능 오버헤드를 줄일 수 있지만, 정책 정의와 운영 책임은 사라지지 않습니다. 어떤 파일이 민감한지, 어떤 agent runtime이 신뢰된 workload인지, 어떤 partner XDR이 Argus signal을 받아 incident로 올릴지 정해야 합니다. BlueField-4에서 policy를 집행하더라도 잘못된 allow rule은 여전히 잘못된 접근을 허용합니다. DOCA의 장점은 enforcement 위치와 속도이지, 조직의 데이터 분류를 대신하는 것은 아닙니다.

또 하나의 주의점은 benchmark 해석입니다. 1000배 빠른 runtime threat detection과 800Gb/s 정책 집행은 NVIDIA 발표와 기술 블로그의 수치입니다. 실제 효과는 workload 종류, storage stack, 보안 벤더 통합, 암호화 방식, cluster topology, policy granularity에 따라 달라집니다. agent workload는 특히 재시도, tool latency, model latency, retrieval quality가 섞여 전체 성능을 만듭니다. 한 계층의 line-rate 숫자가 end-to-end agent latency로 그대로 변환되지는 않습니다.

커뮤니티 반응은 아직 제한적입니다. Hacker News에서 큰 논의는 확인하지 못했고, Reddit에서는 Computex 2026 요약 글이나 NVIDIA 보도자료 링크 공유 수준이 많았습니다. 이는 이 발표가 일반 개발자 도구보다 데이터센터, security vendor, storage vendor 쪽에 가까운 뉴스라는 뜻이기도 합니다. 반대로 AI agent가 production 시스템의 표준 workload가 되면, 오늘은 인프라 벤더 용어처럼 보이는 DPU, KV cache storage, runtime integrity가 플랫폼 팀의 구매 체크리스트로 올라올 수 있습니다.

최근 AI 보안 논의는 prompt injection, MCP server 권한, coding agent의 shell access, browser agent의 data exfiltration에 집중됐습니다. NVIDIA의 BlueField-4 STX 발표는 그 목록에 storage와 context memory를 더합니다. agent가 더 오래 실행되고 더 많은 파일을 만질수록, 보안의 기본 단위는 "답변이 안전한가"에서 "이 workload가 이 데이터를 이 경로로 읽어도 되는가"로 바뀝니다. 이 변화는 모델 성능 경쟁보다 덜 화려하지만, enterprise agent 배포에서는 더 빨리 예산과 아키텍처 결정으로 이어질 수 있습니다.

BlueField-4 STX 보안 공개, 에이전트 기억을 실리콘에서 통제

출처