Google DeepMind 1000만 달러 펀드, 에이전트 거래 안전 시험대

Google DeepMind와 파트너들이 다중 에이전트 안전 연구에 1000만 달러를 배정했습니다. 단일 모델 평가 밖의 위험을 봅니다.

AI 요약

무슨 일: Google DeepMind와 Schmidt Sciences, Cooperative AI Foundation, ARIA, Google.org가 다중 에이전트 안전 연구 펀드를 열었습니다.
- 공식 발표일은 2026년 6월 11일이고, 총 지원 규모는 최대 1000만 달러입니다.
지원 구조: Cooperative AI Foundation은 30만 달러와 100만 달러 두 단계의 연구비 상한을 공개했습니다.
개발자 영향: 안전 평가 대상이 단일 모델에서 에이전트 네트워크, 신원, 평판, 약속, 감독 API로 넓어집니다.
- 신청 마감은 Google DeepMind 발표 기준 2026년 8월 8일, CAIF 발표 기준 AoE 2026년 8월 9일 23:59입니다.

2026년 6월 11일, Google DeepMind가 안전 연구의 대상을 단일 모델에서 에이전트 집단으로 옮기는 펀드를 발표했습니다. 발표 주체는 Google DeepMind, Schmidt Sciences, Cooperative AI Foundation, 영국의 Advanced Research and Invention Agency, Google.org입니다. 총액은 최대 1000만 달러입니다. Cooperative AI Foundation은 별도 발표에서 Tier 1 최대 30만 달러, Tier 2 최대 100만 달러의 지원 구조를 공개했습니다.

이번 발표가 개발자에게 닿는 지점은 "AI 안전 연구에 돈이 들어갔다"가 아닙니다. Google DeepMind는 앞으로 수백만 개의 AI 에이전트가 서로 통신하고, 협상하고, 거래할 수 있다고 전제합니다. 회사가 각자 만든 에이전트가 같은 시장, 문서 저장소, 결제 시스템, 클라우드 계정, 업무 메신저에서 만나면 단일 모델 벤치마크만으로는 충분하지 않습니다. 모델 하나가 정책을 잘 지키는지보다, 여러 에이전트가 동시에 행동할 때 네트워크가 어떻게 흔들리는지가 문제가 됩니다.

Cooperative AI Foundation의 1000만 달러 다중 에이전트 안전 펀드 발표 이미지

Google DeepMind 발표문은 연구 과제를 네 가지로 나눕니다. 첫째는 샌드박스와 테스트베드입니다. 가상 시장, 시뮬레이션 생태계, 여러 조직이 얽힌 업무 흐름을 재현 가능한 환경으로 만들어야 합니다. 둘째는 에이전트 네트워크의 과학입니다. 에이전트 집단의 능력이 언제 갑자기 나타나는지, 어떤 네트워크가 불안정해지는지, 위험한 집단 속성을 어떻게 감지하는지가 여기에 들어갑니다. 셋째는 에이전트 인프라 강화입니다. 신원, 평판, 약속을 다루는 프로토콜이 플랫폼을 넘어 안전하게 작동하는지 점검해야 합니다. 넷째는 감독과 통제입니다. 배포된 에이전트 집단을 관측하고 집단 피해를 줄이는 방법을 찾는 영역입니다.

연구 영역	공식 발표의 범위	개발자가 보게 될 결과물
샌드박스와 테스트베드	가상 시장, 시뮬레이션 생태계, 여러 조직 업무 흐름	에이전트 회귀 테스트, 표준 시나리오, 재현 가능한 실패 사례
에이전트 네트워크의 과학	집단 능력 출현, 네트워크 실패, 변동성 감지	단일 실행 로그를 넘어선 집단 지표와 경보 기준
에이전트 인프라	신원, 평판, 약속 프로토콜의 스트레스 테스트	권한 위임, 거래 승인, 플랫폼 간 신뢰 검증 API
감독과 통제	배포된 에이전트 집단 관측과 피해 완화	운영 대시보드, 차단 정책, 사고 대응 기준

지금까지 많은 AI 안전 평가는 질문 하나, 답변 하나, 도구 호출 하나를 단위로 삼았습니다. 코드 리뷰 에이전트가 위험한 변경을 제안하지 않는지, 브라우저 에이전트가 프롬프트 인젝션에 속지 않는지, 고객지원 에이전트가 개인정보를 노출하지 않는지를 보는 식입니다. 이런 평가는 여전히 필요합니다. 다만 여러 회사의 에이전트가 같은 문서, 같은 결제 경로, 같은 티켓 시스템, 같은 공급망 API에서 동시에 행동하면 실패 단위가 바뀝니다.

예를 들어 한 회사의 구매 에이전트가 가격 협상을 맡고, 다른 회사의 판매 에이전트가 자동 견적을 내며, 물류 에이전트가 배송 조건을 조정한다고 가정해 보겠습니다. 각 에이전트가 내부 정책을 지켜도 집단 결과는 예상과 다를 수 있습니다. 과도한 재협상으로 거래가 멈출 수 있고, 특정 평판 신호가 잘못 전파돼 공급자가 배제될 수 있으며, 에이전트끼리 만든 약속이 법적 승인이나 인간 검토보다 앞설 수 있습니다. Google DeepMind가 "집단 행동"과 "보이지 않는 안전 위험"을 강조한 이유가 여기에 있습니다.

Cooperative AI Foundation 발표는 이 문제를 더 직접적으로 부릅니다. 현재 대부분 사례는 한 주체가 여러 에이전트를 오케스트레이션하는 구조이지만, 앞으로는 서로 다른 주체가 배포한 에이전트가 같은 디지털 인프라에서 만나는 다중 주체 다중 에이전트 상호작용이 늘어난다는 설명입니다. 이 표현은 기업용 제품팀에게 꽤 구체적인 요구로 번역됩니다. 에이전트가 누구를 대신하는지, 어떤 권한을 갖는지, 어떤 약속을 유효한 것으로 볼지, 상대 에이전트의 평판을 어디서 가져올지 정해야 합니다.

최근 devlery에서 다룬 에이전트 주제들과 비교하면 차이가 분명합니다. AWS Agent-EvalKit은 에이전트가 쓴 답변과 도구 추적을 평가하는 방법에 가까웠습니다. Arcade 투자는 에이전트가 외부 서비스를 호출할 때 권한과 행동을 통제하는 시장을 보여줬습니다. Colab CLI는 코딩 에이전트가 원격 GPU와 TPU 런타임을 빌리는 실행 표면을 다뤘습니다. 이번 Google DeepMind 펀드는 그 다음 질문을 겨냥합니다. 여러 에이전트가 서로를 호출하고 거래할 때, 누가 네트워크 전체의 안전성을 측정할 수 있느냐는 질문입니다.

2026년 6월 11일

Google DeepMind와 파트너들이 최대 1000만 달러 펀드를 발표했습니다.

2026년 8월 8일

Google DeepMind 발표 기준 신청 마감일입니다.

2026년 8월 9일 23:59 AoE

Cooperative AI Foundation 발표 기준 신청 마감입니다.

2026년 가을

수상 연구팀 발표가 예정돼 있습니다.

신청 마감일이 두 발표에서 다르게 보이는 점은 기록해 둘 필요가 있습니다. Google DeepMind 블로그는 2026년 8월 8일을 마감으로 적었습니다. Cooperative AI Foundation은 AoE 기준 2026년 8월 9일 23:59를 명시했습니다. 실제 지원자는 application portal의 최종 안내를 확인해야 합니다. 기사 관점에서는 두 조직이 같은 펀드를 설명하면서 시차 기준을 다르게 표기했다는 정도로 처리하는 편이 안전합니다.

Schmidt Sciences와 ARIA가 함께 들어온 점도 단순한 후원 명단 이상의 의미가 있습니다. Schmidt Sciences는 신뢰할 수 있는 AI와 AI 에이전트 프로그램을 통해 프런티어 AI 위험을 이해하고 완화하는 기초 연구를 지원한다고 설명됩니다. ARIA는 Scaling Trust 프로그램을 통해 사이버 물리적 다중 에이전트 조정의 새로운 형태를 열겠다는 목표를 갖고 있습니다. Google.org는 비영리 조직의 임무를 자금, 프로그램, 기술 전문성으로 돕는 역할로 이름을 올렸습니다. 연구비가 한 회사의 내부 평가 도구가 아니라 독립 연구자와 학계 네트워크로 흘러가게 설계된 셈입니다.

개발자 입장에서 가장 실용적인 부분은 샌드박스와 테스트베드입니다. 에이전트 제품은 지금도 평가가 어렵습니다. 같은 프롬프트도 모델 버전, 도구 응답, 사용자 데이터, 네트워크 지연에 따라 다른 결과를 냅니다. 여기에 다른 조직의 에이전트가 들어오면 재현성은 더 낮아집니다. 가상 시장이나 여러 조직 업무 흐름을 표준 테스트로 만들 수 있다면, 에이전트 제품팀은 "우리 에이전트는 이 환경에서 어떤 집단 실패를 일으키는가"를 릴리스 전에 볼 수 있습니다.

인프라 영역은 MCP, A2A, Agent Passport 같은 최근 논의와 맞닿아 있습니다. Google DeepMind 발표는 특정 표준을 지정하지 않았지만, 신원, 평판, 약속 프로토콜을 명시했습니다. 신원은 에이전트가 누구의 대리인인지 확인하는 문제입니다. 평판은 과거 행동과 신뢰도를 어디서 가져올지에 관한 문제입니다. 약속은 에이전트가 한 제안이나 합의가 어떤 조건에서 유효한지 정하는 문제입니다. 이 세 가지가 없으면 에이전트끼리 거래하는 시스템은 결국 각 플랫폼의 폐쇄된 권한 모델에 갇히거나, 반대로 아무 검증 없이 외부 에이전트를 믿는 위험한 구조가 됩니다.

감독과 통제 영역은 운영팀의 부담으로 돌아옵니다. 사람이 한 명의 에이전트 실행을 로그로 검토하는 방식은 수천 개 에이전트가 동시 실행될 때 작동하지 않습니다. 필요한 것은 집단 지표입니다. 갑자기 특정 리소스 호출이 폭증하는지, 에이전트들이 같은 잘못된 평판 신호를 증폭하는지, 협상 루프가 무한 반복되는지, 한 에이전트의 오류가 다른 조직의 자동 의사결정으로 전파되는지를 봐야 합니다. 이 지표는 일반 애플리케이션 관측성과 비슷해 보이지만, 행동 주체가 코드 경로가 아니라 정책을 가진 에이전트라는 점에서 다릅니다.

커뮤니티 반응은 아직 대형 토론으로 굳어지지 않았습니다. 검색 기준 Hacker News와 GeekNews에서 이 발표만을 다룬 큰 스레드는 확인하지 못했습니다. 대신 AI/TLDR와 CV Brief 같은 AI 뉴스 다이제스트가 6월 12일 이후 이 소식을 요약했습니다. 이런 반응은 발표의 성격과도 맞습니다. 당장 쓸 API나 모델이 나온 것이 아니라, 앞으로 어떤 평가 환경과 표준을 만들지에 연구비가 배정된 사건입니다. 개발자 커뮤니티에서 체감도가 생기려면 수상 연구팀, 공개 테스트베드, 논문, 코드 저장소가 나와야 합니다.

이번 펀드를 과대평가하지 않는 것도 필요합니다. 1000만 달러는 AI 모델 학습비나 대형 클라우드 약정에 비하면 작은 금액입니다. 한편 독립 연구자와 학계 연구팀에게는 재현 가능한 실험 환경, 공개 평가, 프로토콜 분석을 시작할 수 있는 충분한 씨앗 자금이 될 수 있습니다. Cooperative AI Foundation이 30만 달러와 100만 달러 두 단계를 공개한 것도 이 때문입니다. 작은 팀은 특정 실패 양상이나 테스트베드를 만들고, 큰 팀은 여러 기관이 함께 쓸 수 있는 연구 인프라를 제안할 수 있습니다.

제품팀이 지금 할 수 있는 일은 세 가지입니다. 첫째, 에이전트 로그에 상대 에이전트 신원과 권한 출처를 남길 수 있는지 확인해야 합니다. 둘째, 자동 협상이나 자동 결제 같은 기능은 단일 에이전트 성공률이 아니라 집단 루프와 취소 조건을 테스트해야 합니다. 셋째, 외부 에이전트와의 약속을 사람이 승인해야 하는 지점과 API가 자동 처리할 수 있는 지점을 분리해야 합니다. 이번 펀드는 이런 항목을 당장 표준으로 확정하지 않습니다. 대신 연구비를 통해 표준 후보가 나올 수 있는 통로를 엽니다.

AI 에이전트 시장은 지난 1년 동안 실행 능력을 빠르게 늘렸습니다. 코딩 에이전트는 PR을 만들고, 업무 에이전트는 CRM과 회계 시스템을 호출하고, 결제 에이전트는 사용자를 대신해 구매 경로를 탐색합니다. Google DeepMind의 1000만 달러 펀드는 이 확장 뒤에 남은 빈칸을 가리킵니다. 에이전트가 서로를 상대하기 시작하면, 안전은 모델 카드의 한 문단이 아니라 네트워크 실험, 신원 인프라, 운영 통제, 사고 대응 절차의 묶음이 됩니다.