TrustAI 킬 스위치 공개, 에이전트 데이터 접근을 초 단위 차단

TrustLogix TrustAI가 에이전트 권한을 데이터 계층에서 차단합니다. MCP, 의도 기반 권한, Guardian Agent를 짚습니다.

AI 요약

무슨 일: TrustLogix가 TrustAI 차세대 릴리스와 에이전트 런타임 킬 스위치를 공개했습니다.
- 발표일은 2026년 5월 27일이며, IBAC, MCP Data Gateway, Guardian Agent, 감사 도구가 함께 나왔습니다.
의미: 에이전트 보안의 제어 지점이 프롬프트 가드레일에서 데이터 계층 권한으로 내려갑니다.
- TrustAI는 사용자, 에이전트, MCP 서버, 도구, 데이터 요청을 하나의 정책 판단 흐름으로 묶겠다고 설명합니다.
주의점: 킬 스위치는 마지막 장치입니다. 실제 경쟁력은 에이전트 식별, 의도 판정, 정책 우회 탐지, 감사 로그 품질에서 갈립니다.

TrustLogix가 2026년 5월 27일 TrustAI 차세대 릴리스를 발표했습니다. 발표문은 제품을 "AI Control Plane for the Enterprise"라고 부르지만, 이번 뉴스에서 봐야 할 사건은 이름보다 제어 위치입니다. TrustAI는 에이전트가 Snowflake, Databricks, AWS, Azure, Power BI 같은 데이터 플랫폼에 접근할 때 요청을 데이터 계층에서 평가하고, 문제가 생기면 특정 에이전트의 데이터 접근을 초 단위로 끊는 킬 스위치를 전면에 세웠습니다. 공식 발표가 열거한 새 기능은 intent-based authorization, runtime kill switch, MCP Data Gateway, Guardian Agent, audit and compliance tooling입니다.

TrustLogix의 주장은 기존 IAM과 AI 플랫폼 사이의 빈칸을 겨냥합니다. IAM은 사람과 서비스 계정의 인증·권한을 관리하지만 애플리케이션 경계 뒤에서 에이전트가 왜 데이터를 요구하는지는 알기 어렵습니다. AI 플랫폼은 프롬프트, 응답, 모델 라우팅, 비용을 다루지만 데이터베이스의 row, column, 파일, BI 데이터셋에 대한 최종 정책 집행 지점은 아닙니다. TrustAI는 이 빈칸을 "data layer"라고 부르고, 모든 에이전트 tool call과 data request를 실시간으로 가로채 fine-grained control을 적용한다고 설명합니다.

TrustAI

이번 발표가 일반적인 보안 마케팅보다 눈에 띄는 이유는 MCP와 에이전트 권한 문제가 구체적인 운영 문제로 바뀌었기 때문입니다. 개발팀은 LangChain이나 LangGraph로 에이전트를 만들고, Cursor·Claude·ChatGPT 같은 클라이언트에서 MCP 서버를 붙이고, 데이터 팀은 Snowflake나 Databricks에 이미 service account와 role을 열어둡니다. 이때 에이전트가 사람 대신 실행되면 감사 로그에는 service account만 남고, 실제 요청자가 누구인지, 에이전트의 선언된 목적이 무엇인지, 현재 tool call이 그 목적을 벗어났는지 분리하기 어렵습니다.

TrustLogix는 이 문제를 의도 기반 권한으로 풀겠다고 말합니다. 공식 발표의 IBAC 설명은 사용자가 누구인지와 접근 권한이 무엇인지뿐 아니라, 에이전트가 왜 접근을 요청하는지까지 평가한다고 적습니다. 예를 들어 "고객 이탈 위험 리포트 작성" 목적으로 승인된 에이전트가 고객 이메일 전체를 내려받거나, 결제 테이블의 원본 카드 관련 필드를 호출한다면, 단순 RBAC만으로는 허용될 수 있습니다. IBAC 모델에서는 요청 목적, 작업 문맥, 필요한 리소스 범위를 함께 봐서 deny 또는 escalate를 걸 수 있다는 주장입니다.

제어 지점	기존 역할	에이전트 환경의 빈칸	TrustAI가 내세운 보완
IAM	사용자·서비스 계정 인증	에이전트가 왜 데이터를 요청하는지 알기 어려움	on-behalf-of identity를 데이터 계층까지 전파
AI 플랫폼	모델, 프롬프트, 라우팅, 비용 관리	데이터 row·column 정책 집행은 별도 시스템에 남음	agent request를 데이터 정책 판단으로 연결
MCP 게이트웨이	도구 호출 경로 집약	tool allowlist만으로 데이터 민감도와 목적을 설명하기 어려움	MCP server, tool call, data request를 단일 제어 평면으로 평가
감사 로그	누가 어떤 쿼리를 실행했는지 기록	에이전트·사용자·목적·정책 verdict 연결이 빠질 수 있음	SOC 2, HIPAA, NIST AI RMF, ISO 42001 증거 패키지 주장

킬 스위치는 이 구조의 가장 눈에 띄는 기능입니다. TrustLogix는 에이전트가 침해되거나 과도한 권한을 쌓거나 의도된 범위를 벗어나면, 보안팀이 해당 에이전트의 데이터 접근을 모든 연결 데이터 플랫폼에서 즉시 차단할 수 있다고 설명합니다. 중요한 단서는 "다른 정상 에이전트와 사용자에게 영향을 주지 않는다"는 대목입니다. 전체 API gateway나 데이터베이스 권한을 닫는 방식은 사고 대응에는 빠르지만 업무 중단 범위가 큽니다. TrustAI가 약속하는 것은 특정 고위험 에이전트만 데이터 계층에서 멈추는 정밀 차단입니다.

제품 페이지는 이 킬 스위치가 API 앞단이 아니라 데이터 계층에서 작동한다고 강조합니다. 이 차이는 실무에서 큽니다. 에이전트는 하나의 MCP 서버만 쓰지 않습니다. 같은 agent identity가 BI 도구, warehouse, vector store, 내부 API, 파일 저장소를 오가며 tool call을 이어갈 수 있습니다. API gateway 한 곳에서 차단해도 다른 경로가 살아 있으면 사고는 계속됩니다. 데이터 계층의 정책 집행 지점은 에이전트가 어떤 경로로 들어오든 마지막 접근 허용 여부를 다시 판단하는 위치입니다.

MCP Data Gateway는 그 앞단의 수문 역할로 제시됩니다. 공식 발표는 모든 에이전트, MCP server, tool call, data request가 하나의 control plane을 통과한다고 설명합니다. 제품 페이지는 MCP와 A2A traffic을 단일 제어 지점에서 broker하고, agent와 tool을 discovery하며, entitlements를 allow, deny, redact로 다룬다고 적습니다. 개발자가 봐야 할 부분은 "MCP 서버를 붙였다"가 끝이 아니라는 점입니다. 어떤 agent가 어떤 human user를 대신하는지, 어떤 tool이 어떤 데이터 store에 닿는지, tool 결과가 다시 다음 action에 영향을 주는지까지 정책의 입력값이 됩니다.

Human user + agent identity

↓

Agent plan, MCP server, tool call

↓

Intent, ABAC/PBAC/RBAC, risk score

↓

Allow, deny, redact, escalate, kill switch

Guardian Agent는 킬 스위치와 정책 엔진 사이의 관측 계층입니다. TrustLogix는 Guardian Agent가 에이전트별 행동 기준선을 만들고, 범위나 데이터 접근이 의도한 행동에서 벗어나면 실시간 경고를 트리거한다고 설명합니다. 발표문에는 formal deployment process를 따르지 않은 ShadowAI agents를 찾아 shut down할 수 있다는 주장도 들어 있습니다. 이 기능이 제대로 작동하려면 에이전트 식별이 먼저 안정적이어야 합니다. 같은 service account를 여러 자동화가 공유하거나, 개발자 개인 토큰으로 에이전트가 실행되면 기준선과 책임 경계는 흐려집니다.

TrustAI의 감사 기능은 규제 산업을 겨냥합니다. 발표문은 SOC 2, GDPR, HIPAA, NIST AI RMF, ISO 42001, EU AI Act 지원을 나열하고, ISO 42001-ready logs, impact assessments, control evidence를 하나의 패키지로 export할 수 있다고 설명합니다. 이 목록은 단순한 badge보다 운영 요구사항을 드러냅니다. 에이전트가 데이터를 읽고, 요약하고, 다른 도구에 전달하는 순간 감사 질문은 "모델이 무엇을 답했나"에서 "누가, 누구를 대신해, 어떤 정책으로, 어떤 데이터 경로를 허용받았나"로 바뀝니다.

최근 연구도 같은 방향을 가리킵니다. 2026년 5월 6일 제출된 AgentTrust 논문은 현대 AI 에이전트가 파일 작업, shell command, HTTP request, database query 같은 실제 side effect를 tool call로 실행한다고 설명합니다. 논문은 잘못된 한 번의 action이 삭제, credential exposure, data exfiltration으로 이어질 수 있다고 봅니다. 이 논문은 tool call 실행 전에 allow, warn, block, review verdict를 반환하는 runtime safety layer를 제안합니다. TrustAI의 접근은 연구 시스템보다 제품 지향적이지만, "실행 전 차단"이라는 문제 정의는 비슷합니다.

MCP 쪽 위험도 커졌습니다. 2026년 4월 제출된 MCPShield 논문은 MCP가 LLM 기반 에이전트를 외부 도구와 데이터 소스에 연결하는 표준으로 빠르게 확산됐지만, 위협을 체계적으로 분류하고 방어하는 통합 프레임워크가 부족하다고 지적합니다. 해당 초록은 9700만 monthly SDK downloads와 17만7000개 이상의 registered tools를 언급합니다. 숫자의 정확한 시장 해석은 조심해야 하지만, MCP가 더 이상 작은 개발자 실험이 아니라는 신호로는 충분합니다. 도구 수가 늘수록 allowlist와 수동 리뷰만으로는 blast radius를 계산하기 어렵습니다.

TrustLogix가 경쟁하는 시장은 이미 붐빕니다. Microsoft Agent 365는 에이전트 registry와 governance를 Microsoft 365·Entra·Defender·Purview 표면에 묶습니다. Trust3 AI는 agent discovery를 platform APIs, development environment scan, runtime telemetry 같은 방향으로 설명합니다. Cyberhaven, Zenity, Straiker, Cloudflare, Collibra도 shadow AI, MCP, agent activity, data access governance를 각자 다른 위치에서 다룹니다. TrustAI의 차별점은 "에이전트 전체 수명주기 관리"보다 "데이터 접근 허용과 차단"을 전면에 둔다는 점입니다.

개발팀 입장에서 바로 생기는 질문은 세 가지입니다. 첫째, 에이전트 identity를 사람 identity와 어떻게 연결할 것인가입니다. 제품 페이지는 on-behalf-of credentials, OAuth 2.0, OIDC, JWT, SAML assertions를 언급합니다. 실제 구현에서는 에이전트가 항상 별도 service principal을 갖고, human owner와 session 목적을 함께 전달해야 감사가 의미를 가집니다. 둘째, intent를 누가 정의하고 어떻게 갱신할 것인가입니다. "고객 리포트 작성" 같은 목적 문구가 너무 넓으면 모든 것을 허용하고, 너무 좁으면 정상 자동화가 계속 멈춥니다. 셋째, kill switch가 실행된 뒤 복구 기준을 누가 정할 것인가입니다.

이 제품군이 해결해야 할 기술적 난점도 분명합니다. 에이전트가 tool result를 prompt context로 다시 넣고, 그 결과가 다른 tool call을 유도하는 multi-step chain에서는 단일 요청의 의도만으로 위험을 판단하기 어렵습니다. 데이터가 RAG index, BI extract, temporary file, cache, agent memory로 복제된 뒤에는 원본 data layer의 차단만으로 충분하지 않을 수 있습니다. 또한 에이전트가 여러 클라우드와 SaaS를 오가면 정책 지연시간, connector coverage, 장애 시 fail-open/fail-closed 선택이 제품 신뢰를 좌우합니다.

TrustAI 발표에서 가장 현실적인 메시지는 "킬 스위치가 필요하다"가 아니라 "킬 스위치를 쓸 수 있으려면 앞단의 식별과 정책이 먼저 필요하다"입니다. 에이전트를 멈추려면 어떤 프로세스가 에이전트인지 알아야 하고, 어떤 사람과 업무 목적을 대신하는지 알아야 하며, 어떤 데이터 요청이 정상 범위를 벗어났는지 판단해야 합니다. 그렇지 않으면 킬 스위치는 큰 빨간 버튼처럼 보이지만 실제 사고 순간에는 어떤 대상을 눌러야 할지 모르는 기능이 됩니다.

따라서 이번 릴리스는 AI 에이전트 보안 시장의 언어가 바뀌고 있음을 보여줍니다. 2025년의 많은 논의는 prompt injection, model guardrail, sandbox, MCP server allowlist에 머물렀습니다. 2026년의 엔터프라이즈 요구는 데이터 계층의 정책 집행, 에이전트별 권한, runtime verdict, SIEM 연동, ISO 42001 증거로 내려오고 있습니다. 개발자에게는 귀찮은 변화입니다. 에이전트를 빠르게 붙이는 것만으로는 운영 승인을 받기 어려워지고, tool call마다 신원과 목적과 증거를 남기는 설계가 필요해집니다.

TrustLogix의 발표가 곧 시장 표준이 된다는 뜻은 아닙니다. 공식 주장에는 고객 수, 처리 지연시간, 실제 차단 성공률, connector별 제한, 가격 같은 검증 가능한 세부 수치가 빠져 있습니다. 다만 방향은 분명합니다. AI 에이전트가 기업 데이터를 직접 만지는 순간, 보안팀은 prompt log보다 "데이터 요청을 누가 어떤 정책으로 허용했는가"를 묻습니다. TrustAI의 킬 스위치는 그 질문에 대한 제품화된 답변 중 하나입니다. 앞으로의 경쟁은 누가 더 많은 에이전트를 발견하느냐보다, 누가 데이터 접근을 더 정확하게 허용·차단·증명하느냐로 갈릴 가능성이 큽니다.