Google 내부 AI 에이전트가 너무 인기라 접근을 제한했다, Agent Smith의 정체
Google의 자율 코딩 에이전트 Agent Smith가 프로덕션 코드의 25% 이상을 생성하며 18만 직원 사이에서 폭발적 인기를 얻었다. 비동기 실행과 모바일 제어로 코딩 어시스턴트 시대를 넘어선 내부 에이전트의 부상을 분석한다.
Google 내부에서 AI 코딩 에이전트가 너무 인기가 많아 접근을 제한해야 하는 상황이 벌어졌습니다. 이름은 Agent Smith. 18만 명 이상의 Google 직원이 사용하는 이 자율 코딩 에이전트는 백그라운드에서 독립적으로 코드를 작성하고, 테스트를 실행하며, 실패하면 스스로 반복합니다. 엔지니어가 랩톱을 닫고 자리를 비워도 작업을 계속하고, 휴대폰으로 진행 상황을 확인할 수 있습니다.
Business Insider가 "해당 도구에 정통한 세 명의 관계자"를 인용해 보도한 이 소식은 단순한 내부 도구 이야기가 아닙니다. Google 신규 코드의 25% 이상이 AI에 의해 생성된다는 Sundar Pichai의 발언, 그리고 코딩 어시스턴트에서 자율 에이전트로의 패러다임 전환이 실제로 어디까지 왔는지를 보여주는 사례입니다.
코딩 어시스턴트에서 자율 에이전트로, 전환의 배경
우리가 사용하는 AI 코딩 도구의 진화를 돌아보겠습니다. 2021년 GitHub Copilot이 자동완성 기반의 코딩 어시스턴트 시대를 열었고, 2024년에는 Cursor가 AI 네이티브 IDE라는 개념을 대중화했습니다. 2025년에는 Claude Code, Copilot Agent Mode 등이 "에이전트 모드"를 도입하며, 단일 작업 자동완성을 넘어 멀티스텝 작업 수행으로 진화했습니다.
하지만 이 모든 도구에는 공통적인 한계가 있었습니다. 개발자가 에디터 앞에 앉아 있어야 한다는 것. AI는 보조자(assistant)였고, 인간이 세션을 시작하고, 감독하고, 마무리하는 구조였습니다.
Agent Smith는 이 전제를 뒤집습니다. 인간이 자리를 비운 사이에도 작업을 계속하는 완전 비동기 자율 에이전트. 이것이 "어시스턴트"와 "에이전트"의 결정적 차이입니다.
이 전환의 인프라 기반이 된 것이 Google의 Antigravity 플랫폼입니다. 2025년 11월 Gemini 3와 함께 공개된 Antigravity는 에이전트 우선(agent-first) 개발 플랫폼으로, 에디터 뷰(VS Code/PyCharm 유사 IDE + 에이전트 사이드바)와 매니저 뷰(여러 에이전트를 병렬 오케스트레이션하는 제어 센터)를 제공합니다. Agent Smith는 바로 이 Antigravity 위에 구축된 내부 전용 애플리케이션입니다.
Agent Smith의 3계층 구조와 작동 방식
Agent Smith의 아키텍처를 이해하려면 Google 내부의 에이전틱 코딩 스택 전체를 봐야 합니다. 크게 세 개 층으로 구성됩니다.
첫 번째 층, Antigravity(플랫폼). Google의 에이전틱 코딩 인프라입니다. Gemini 3.1 Pro와 Gemini 3 Flash 모델을 기반으로 하며, 에이전트를 생성하고 실행하는 기반 환경을 제공합니다.
두 번째 층, Project EAT(표준화). AI 도구의 배포, 평가, 거버넌스를 표준화하는 내부 이니셔티브입니다. Google 인프라 조직에서 운영하며, 혁신 속도와 리스크 관리, 프라이버시 보호의 균형을 잡는 프레임워크 역할을 합니다.
세 번째 층, Agent Smith(사용자 향 애플리케이션). 실제로 Google 직원이 사용하는 자율 코딩 에이전트입니다.
자율 실행이 바꾸는 것
기존 코드 어시스턴트와 Agent Smith의 가장 큰 차이는 자율 실행(autonomous execution)에 있습니다. Copilot이 타이핑 중 자동완성을 제안하는 방식이라면, Agent Smith는 고수준 작업 설명을 받아 스스로 서브태스크로 분해합니다. 여러 파일에 걸쳐 코드를 작성하고, 테스트를 실행하고, 실패하면 스스로 반복합니다. 인간 엔지니어가 결과물을 확인하기 전에 전 과정을 자율적으로 수행합니다.
더 주목할 만한 것은 비동기 작동입니다. Agent Smith는 백그라운드에서 독립적으로 작동하기 때문에 활성 랩톱이 필요하지 않습니다. 엔지니어가 Google 내부 채팅 플랫폼을 통해 작업을 할당하면, 나중에 결과를 확인하는 방식입니다. 그리고 여기에 모바일 제어가 더해집니다. 엔지니어가 책상을 떠나 휴대폰으로 진행 상황을 확인하고 지시를 내릴 수 있습니다.
수행 가능한 작업의 범위도 단순 코드 생성을 넘어섭니다. 코드 작성과 테스트, 관련 파일 업데이트, 코드 리뷰를 위한 변경사항 준비, 문서 관리, 티켓 조율, 릴리스 프로세스 지원까지. 개발 워크플로우 전반을 커버합니다.
능력이 아니라 맥락이다
여기서 핵심적인 질문이 하나 떠오릅니다. 외부에도 Claude Code, Copilot Agent Mode 같은 에이전틱 도구가 있는데, Agent Smith가 이들과 근본적으로 다른 이유는 무엇일까요?
분석가 shashi.co의 답은 명쾌합니다.
"상용 코딩 도구와 내부 에이전트의 격차는 능력이 아니라 맥락에 있다."
(원문: "The gap between a commercial coding tool and an internal agent is not about capability. It is about context.")
Agent Smith는 Google의 내부 문서 시스템, 이슈 트래커, 직원 프로필, 내부 라이브러리, 네이밍 컨벤션, 배포 파이프라인, 아키텍처 문서에 직접 접근합니다. 이것은 외부 도구가 아무리 뛰어난 모델을 탑재하더라도 복제할 수 없는 이점입니다.
외부 도구는 사용자가 제공하는 코드베이스와 문서에만 접근할 수 있습니다. 반면 내부 에이전트는 기관 기억(institutional memory) 전체를 맥락으로 활용합니다. 수십 년간 축적된 코드 컨벤션, 팀 간 의존성, 배포 정책, 인시던트 히스토리. 이 모든 것이 에이전트의 판단 근거가 됩니다.
이것이 벤치마크에서는 보이지 않는 실질적 격차입니다. SWE-bench에서 높은 점수를 받는 것과, 실제 프로덕션 환경에서 조직의 맥락을 이해하고 의미 있는 코드를 생성하는 것은 전혀 다른 문제입니다.
25%와 30%, 수치의 정확한 맥락
Agent Smith를 다루는 많은 매체에서 "Google 프로덕션 코드의 25%를 AI가 작성한다"는 수치가 언급됩니다. 하지만 이 수치의 출처와 맥락을 정확히 짚어야 합니다. 여러 2차 매체에서 수치가 혼용되고 있기 때문입니다.
타임라인을 정리하겠습니다. 2024년 10월 29일, Sundar Pichai가 Alphabet Q3 2024 실적 발표에서 처음으로 이 수치를 공개했습니다.
"Google의 모든 신규 코드의 1/4 이상이 이제 AI가 생성합니다."
(원문: "More than a quarter of all new code at Google is now generated by AI.")
2025년 4월 24일, Alphabet Q1 2025 실적 발표에서 이 수치가 30%를 넘었다고 업데이트했습니다. Pichai는 이 수치가 "checked-in code(체크인된 코드)" 기준이라고 밝혔습니다. 단순 자동완성 수락률이 아니라, 엔지니어가 AI 제안을 수락한 뒤 리뷰를 거쳐 실제 프로덕션에 배포되는 코드라는 의미입니다.
"우리는 아직 초기 단계에 있지만, 초기 활용 사례는 변혁적이었습니다."
(원문: "We're still in the early days, but the initial use cases have been transformative.")
여기서 주의해야 할 점이 있습니다. 25%와 30% 수치는 Agent Smith 런칭(2026년 초) 이전의 발언입니다. 즉, 이 수치에는 Agent Smith뿐 아니라 기존의 자동완성 도구, 코드 어시스턴트 등 Google 내부의 모든 AI 코딩 도구의 기여분이 합산되어 있을 가능성이 높습니다. 2026년 3월 Business Insider가 보도한 "25%+"가 Agent Smith 단독 기여분인지, 전체 AI 도구 합산인지는 명확하지 않습니다.
다만 분명한 것은, Agent Smith 도입 이후 이 비율이 더 높아졌을 가능성이 크다는 점입니다. 접근을 제한해야 할 정도의 수요가 이를 시사합니다. Agent Smith 도입 이후의 공식 수치는 아직 발표되지 않았습니다.
맥락 비교도 흥미롭습니다. Microsoft의 Satya Nadella는 2025년 4월 29일 "Microsoft 코드의 최대 30%가 AI 작성"이라고 발표했습니다. Google과 Microsoft가 거의 같은 시기에 비슷한 수치를 내놓은 것은 AI 코드 생성이 빅테크 전반의 현실이 되었음을 보여줍니다.
빅테크의 내부 AI 코딩 도구 경쟁
Agent Smith는 고립된 현상이 아닙니다. 주요 빅테크들이 상용 도구에 의존하지 않고 자체 내부 에이전트를 구축하는 추세가 뚜렷해지고 있습니다.
- 자율 비동기 실행, 모바일 제어
- Antigravity 플랫폼 위에 구축
- AI 코드 기여율: 25%+
- 내부 전용 (비공개)
- 상용 Copilot 내부 활용
- Satya Nadella 직접 발표
- AI 코드 기여율: ~30%
- 일부 기능 외부 공개
- 오픈소스, MCP 기반
- 엔지니어 75%가 주당 8~10h 절약
- GitHub Stars: 27K+
- 오픈소스 공개
- Zuckerberg 개발 의사 확인
- 구체적 스펙 미공개
- AI 코드 기여율: 미공개
- 개발 중 (비공개)
Google은 Agent Smith를 Antigravity 플랫폼 위에 구축했습니다. 자율 비동기 에이전트에 모바일 제어까지 갖춘, 가장 야심 찬 내부 도구입니다.
Meta는 Mark Zuckerberg가 자체 에이전트 도구를 개발 중이라고 밝혔으나 구체적 이름과 스펙은 아직 공개되지 않았습니다.
Block(Square/Cash App)은 Goose라는 이름의 오픈소스 에이전트를 만들었습니다. MCP(Model Context Protocol) 기반으로, 엔지니어의 75%가 주당 8~10시간 이상을 절약한다고 보고했습니다. GitHub 스타 27K 이상을 기록하며 커뮤니티에서도 주목받고 있습니다.
Microsoft는 자체 Copilot을 내부적으로 활용하며, Nadella가 코드의 ~30%가 AI 생성이라고 발표했습니다.
Pragmatic Engineer의 2026년 AI 도구 설문조사에 따르면, 직원 10,000명 이상 기업에서 상용 도구 사용이 정체(plateau)되는 반면, 내부 에이전트가 주도적 역할을 하는 추세가 나타나고 있습니다. 대기업이 범용 솔루션 대신 자사 인프라에 깊이 통합된 맞춤형 도구를 선택하는 이유가 바로 앞서 말한 "맥락"의 문제입니다.
Agent Smith vs 외부 도구, 무엇이 다른가
Agent Smith와 시장에 공개된 주요 AI 코딩 도구를 직접 비교해 보겠습니다.
GitHub Copilot은 에디터 내 자동완성과 Agent Mode를 제공합니다. 실시간 편집 중 제안 방식이며, 외부 리포지토리만 접근 가능합니다. 비동기 작동과 모바일 제어는 지원하지 않습니다.
Cursor는 AI 네이티브 IDE로 실시간 AI 협업 편집에 특화되어 있습니다. 역시 외부 리포지토리에만 접근 가능하고, 비동기 작동은 지원하지 않습니다.
Claude Code는 터미널 기반 에이전틱 도구로, 코드베이스 분석과 멀티스텝 자율 실행을 지원합니다. MCP 서버를 통한 확장이 가능하고 백그라운드 에이전트를 부분적으로 지원하지만, 조직 내부 시스템과의 깊은 통합은 없습니다.
Agent Smith는 이 모든 도구와 근본적으로 다릅니다. 백그라운드 자율 실행, 랩톱 없이 모바일로 제어, 그리고 Google 내부 문서, 프로필, 파이프라인, 라이브러리 전체에 접근. 이 세 가지 조합은 현재 공개된 어떤 도구에서도 찾을 수 없습니다.
하지만 이 비교에는 중요한 단서가 있습니다. Agent Smith의 강점은 동시에 한계이기도 합니다. Google 내부 인프라에 깊이 결합되어 있기 때문에 외부로 직접 공개하는 것이 사실상 불가능합니다. 일부 분석가는 Agent Smith의 요소가 Gemini Code Assist에 반영될 수 있다고 예측하지만, 내부 시스템과의 깊은 통합 없이는 핵심 가치의 상당 부분이 사라집니다.
개발자 역할의 변화와 거버넌스 과제
Agent Smith가 제기하는 더 근본적인 질문은 개발자의 역할 변화입니다. "모든 코드 줄을 직접 작성"하던 시대에서 "목표를 정의하고 결과를 리뷰"하는 시대로의 전환. 코드 작성자(writer)에서 코드 감독자(reviewer/supervisor)로의 패러다임 시프트가 실제 프로덕션 환경에서 일어나고 있습니다.
이 전환은 생산성 향상을 가져오지만, 동시에 심각한 거버넌스 과제를 동반합니다. 2026년 Stanford/Carnegie Mellon 공동 연구에 따르면, AI 생성 코드의 보안 결함 비율은 인간 작성 코드와 유사합니다. 문제는 다른 곳에 있습니다. 리뷰어가 AI 출력의 결함을 덜 포착한다는 것입니다. AI가 생성한 코드는 문법적으로 깔끔하고 구조가 일관되어 겉보기 신뢰성(perceived credibility)이 높기 때문에, 리뷰어가 무의식적으로 덜 엄밀하게 검토하는 경향이 나타납니다.
프로덕션 코드의 25% 이상이 AI에 의해 생성되는 환경에서, 이 "리뷰 완화 효과"는 누적되면 치명적인 보안 리스크가 될 수 있습니다. Google이 Project EAT이라는 거버넌스 프레임워크를 Agent Smith와 병행 운영하는 이유가 여기에 있습니다. 생산성 향상에는 반드시 리뷰 규율(review discipline)의 병행 강화가 따라야 합니다.
접근 제한의 배경과 내부 반응
Agent Smith가 2026년 초 런칭된 이후 내부 반응은 폭발적이었습니다. 18만 명 이상의 직원 규모에서 인프라에 부하가 집중되었고, Google은 수요 관리를 위해 접근을 제한(throttle)해야 했습니다. 도구가 너무 인기 있어서 접근을 제한해야 했다는 사실 자체가, 이 도구의 실질적 유용성을 입증하는 가장 강력한 증거일 수 있습니다.
동시에 Google 내부에서는 AI 도구 사용에 대한 기대치가 높아지고 있습니다. 비기술직 Googler 일부에게 AI 도입이 "더 이상 권장(encouraged)이 아닌 기대(expected)"라는 메시지가 전달되었으며, 일부 경우 AI 도구 사용이 성과 평가(performance review)에 반영되고 있다는 보도도 있습니다.
Sergey Brin도 2026년 3월 초 Google 영업 직원 대상 타운홀에서 이 흐름을 뒷받침했습니다.
"에이전트가 올해 회사 안에서 큰 역할을 할 것입니다."
(원문: "Agents will play a big role inside the company this year.")
엔지니어들의 엇갈린 반응
긍정적 반응은 분명합니다. 반복적 작업에 소요되는 시간이 줄고, 더 복잡한 설계와 아키텍처 업무에 집중할 수 있게 되었다는 피드백이 있습니다.
하지만 우려의 목소리도 적지 않습니다. 특히 중간 레벨 엔지니어(mid-level engineers)가 자신의 핵심 업무가 AI에 흡수되는 것에 긴장감을 표출하고 있습니다. 코드 작성이 주요 업무였던 엔지니어에게 "코드 감독자"로의 전환은 커리어 경로의 근본적 재정의를 의미합니다. 장기적인 기술(skill) 퇴화에 대한 우려도 제기됩니다.
그리고 에이전트의 이름 자체가 함의를 지닌다는 반응도 있습니다.
"Agent Smith는 결국 시스템에 대한 위협을 제거하도록 설계된 프로그램이었다."
(원문: "Agent Smith, after all, was a program designed to eliminate threats to the system.")
영화 매트릭스에서 Agent Smith는 시스템 내의 이상 요소를 추적하고 제거하는 프로그램이었습니다. 내부 코딩 에이전트에 이 이름을 붙인 것이 의도적이었는지는 알 수 없지만, 일부 직원들 사이에서 묘한 불안감을 자아내고 있는 것은 사실입니다.
Google 공식 대변인은 이 모든 보도에 대해 절제된 입장을 밝혔습니다.
"우리는 항상 사람과 기업의 실질적 문제를 해결하는 에이전트를 구축하는 새로운 방법을 실험하고 있지만, 현재 공유할 내용은 없습니다."
(원문: "We're always experimenting with new ways to build agents that solve real-world problems for people and businesses, but we don't have anything to share right now.")
외부 커뮤니티 반응
X(Twitter)에서는 Agent Smith의 핵심 기능을 요약하는 게시물들이 공유되고 있습니다. @ai_for_success는 "Antigravity 플랫폼 기반의 내부 AI 에이전트, 비동기 작동, 랩톱 없이 백그라운드에서 실행, 휴대폰으로 제어 가능"이라는 핵심을 정리했고, @IndianTechGuide는 "Google 직원들이 랩톱 없이도 코딩 같은 작업을 처리하기 위해 Agent Smith에 점점 더 의존하고 있다"고 전했습니다.
Hacker News에서는 Agent Smith에 대한 대규모 토론 스레드가 두드러지지는 않았지만, 관련 논의에서 "내부 에이전트의 맥락 우위"와 "외부 도구의 한계"에 대한 토론이 이어지고 있습니다. 흥미롭게도 "Agent Smith"라는 이름의 오픈소스 프로젝트(이슈를 PR로 변환하는 에이전트)가 HN Show에 올라온 바 있어 이름 혼동 가능성도 존재합니다.
분석 블로그 shashi.co는 "Google's Agent Smith and the End of the Coding Assistant Era(Google의 Agent Smith와 코딩 어시스턴트 시대의 종말)"이라는 제목의 글에서 보다 근본적인 분석을 내놓았습니다. 핵심 논점은 상용 도구의 벤치마크 성적이 내부 에이전트의 실질적 효용을 반영하지 못한다는 것입니다. 아무리 SWE-bench 점수가 높아도, 조직 고유의 맥락을 이해하지 못하면 프로덕션에서의 가치는 제한적이라는 주장입니다.
전망과 시사점
Agent Smith가 가리키는 방향은 명확합니다. 코딩 어시스턴트 시대가 끝나고 있다는 것. "자동완성을 더 똑똑하게"라는 접근은 한계에 도달했고, 이제 경쟁의 축은 "얼마나 자율적으로, 얼마나 깊은 맥락으로"로 이동하고 있습니다.
이 전환에서 핵심 변수는 세 가지입니다.
첫째, 기관 기억의 중요성. Agent Smith 사례가 증명한 것은 AI 코딩 도구의 가치가 모델 능력보다 조직 맥락에 의해 결정된다는 점입니다. 이는 대기업이 내부 에이전트를 구축하는 트렌드를 가속할 것입니다. 동시에 외부 도구들도 MCP 같은 프로토콜을 통해 이 격차를 좁히려 할 것입니다.
둘째, 거버넌스의 필수화. 프로덕션 코드의 25~30%가 AI 생성인 시대에, 코드 리뷰와 보안 검증의 강화는 선택이 아닌 필수가 됩니다. Google의 Project EAT 같은 거버넌스 프레임워크가 업계 표준으로 자리 잡을 가능성이 높습니다.
셋째, 개발자 역할의 재정의. "코드 작성"이 개발자의 핵심 역량이었던 시대가 저물고 있습니다. 시스템 설계, 아키텍처 결정, 에이전트 오케스트레이션, 결과물 검증이 새로운 핵심 역량이 될 것입니다. 이 전환은 특히 중간 레벨 엔지니어에게 가장 큰 적응을 요구합니다.
Agent Smith의 외부 공개 가능성은 낮습니다. Google 내부 인프라와의 깊은 결합이 핵심 가치이기 때문에, 이를 분리하면 본질이 훼손됩니다. 다만 Antigravity 플랫폼과 Gemini Code Assist를 통해 Agent Smith의 일부 개념과 기능이 외부에 점진적으로 반영될 것으로 예상됩니다.
우리가 주목해야 할 것은 Agent Smith 자체보다, 이것이 상징하는 전환입니다. AI가 코드 한 줄을 추천하던 시대에서, AI가 작업 전체를 자율적으로 수행하고 인간은 결과를 감독하는 시대로. 이 전환은 이미 Google 내부에서 현실이 되었고, 나머지 업계가 따라가는 것은 시간 문제입니다.
Sundar Pichai가 말한 "아직 초기 단계"라는 표현이 정확할 수 있습니다. 하지만 초기 단계치고는 25%라는 수치가 꽤 무겁게 다가옵니다.