65% IDE 선택지 시대, 코딩 에이전트 시장의 운영 전쟁
Gartner의 65% 예측은 AI 코딩 에이전트 경쟁이 IDE 경험에서 거버넌스, 가격, 검증 플랫폼으로 이동한다는 신호입니다.
- 무슨 일: Gartner가 엔터프라이즈
AI coding agents시장이 확장과 재편의 새 단계에 들어갔다고 발표했습니다.- 2027년까지 agentic coding을 쓰는 엔지니어링 팀의 65% 이상이 IDE를 선택적 표면으로 볼 것이라는 예측이 핵심입니다.
- 의미: 경쟁 기준이 모델 성능과 IDE UX에서 거버넌스, 가격, 지원, workflow, 검증 플랫폼으로 이동합니다.
- 실무 영향: 개발팀은 어떤 에이전트가 코드를 잘 쓰는지보다, 누가 실행·감사·권한·비용을 통제하는지 봐야 합니다.
2026년 5월 20일 Gartner가 낸 발표는 짧지만, 코딩 에이전트 시장을 보는 기준을 꽤 선명하게 바꿉니다. Gartner는 엔터프라이즈 AI 코딩 에이전트 시장이 "확장과 경쟁 재편"의 새 단계에 들어갔다고 말했습니다. 가장 눈에 띄는 문장은 수치입니다. 2027년까지 agentic coding을 쓰는 엔지니어링 팀의 65% 이상이 IDE를 선택적 표면으로 취급하고, 통제와 거버넌스와 검증을 자동화 플랫폼으로 옮길 것이라는 예측입니다.
이 문장을 "IDE가 사라진다"로 읽으면 과합니다. 개발자는 여전히 파일을 읽고, diff를 보고, 테스트 실패를 좁히고, 리뷰 코멘트를 남깁니다. IDE는 없어지기보다 여러 표면 중 하나가 될 가능성이 큽니다. 중요한 변화는 작업의 중심이 코드 편집 화면에서 에이전트 실행 계층으로 이동한다는 점입니다. 에이전트가 장시간 작업을 맡고, 여러 도구를 호출하고, 저장소와 클라우드 계정을 건드리고, PR과 배포 파이프라인까지 이어지면 기업이 묻는 질문도 바뀝니다. "어느 에디터가 편한가"가 아니라 "누가 이 자동화를 통제 가능한 업무 시스템으로 묶는가"가 됩니다.
Gartner의 발표는 이 전환을 하나의 시장 문장으로 압축합니다. AI 코딩 에이전트는 이제 planning, creating, reviewing code를 포함하는 SDLC 전반으로 확장되고 있습니다. 이것은 자동완성이나 채팅형 코딩 보조와 다릅니다. 사용자가 "이 함수 만들어줘"라고 요청하는 단계에서는 IDE 통합과 모델 응답 품질이 중심입니다. 하지만 사용자가 "이 인증 흐름을 정리하고, 관련 테스트를 고치고, 배포 영향까지 확인해줘"라고 맡기는 순간부터 문제는 실행 관리가 됩니다.
마법 같은 개발자 경험 다음의 경쟁
Gartner의 표현에서 흥미로운 부분은 "마법 같은 개발자 경험" 다음에 오는 단어들입니다. 발표는 시장 경쟁이 operational excellence, commercial maturity, enterprise readiness로 이동한다고 설명합니다. 개발자 경험과 모델 능력은 여전히 중요하지만, 그것만으로는 충분하지 않다는 뜻입니다. 기업 단위 도입에서는 governance, pricing, support, workflows, commercial maturity, market durability가 같이 평가됩니다.
이 변화는 최근 제품 발표들과 맞물립니다. Google은 2026년 5월 19일 Gemini API의 Managed Agents를 발표했습니다. 단일 API 호출로 Antigravity agent를 격리된 Linux 환경에 띄우고, reasoning, tool use, code execution, file management, web browsing을 수행하게 한다는 내용입니다. 또한 AGENTS.md와 SKILL.md 같은 마크다운 파일로 에이전트 정의를 관리하고, versionable files로 등록할 수 있다고 설명했습니다. 이것은 에이전트의 지시와 작업 방식이 저장소의 일부, 즉 리뷰와 배포의 대상이 된다는 신호입니다.
AWS도 비슷한 방향을 말합니다. 5월 6일 발표한 Agent Toolkit for AWS는 에이전트가 AWS를 다룰 때 낡은 지식에 의존하거나 복잡한 다중 서비스 workflow에서 실패하는 문제를 겨냥합니다. AWS는 40개 이상의 skills, fully-managed MCP server, IAM guardrails, CloudWatch와 CloudTrail observability, sandboxed code execution을 내세웠습니다. 이것은 "에이전트에게 AWS 콘솔을 열어준다"가 아니라 "에이전트가 AWS를 만질 때 어떤 경계와 로그와 절차를 적용할 것인가"에 대한 제품입니다.
UiPath의 5월 12일 발표도 같은 흐름입니다. UiPath for Coding Agents는 Claude Code와 OpenAI Codex 같은 코딩 에이전트를 기업 자동화 플랫폼에 연결하고, policy enforcement, audit trails, credential vaults, role-based access control, runtime controls를 기본 통제 계층으로 둔다고 설명합니다. 흥미로운 점은 UiPath가 특정 코딩 에이전트 하나를 밀기보다, 한 부서에서는 Claude Code를 쓰고 다른 부서에서는 Codex를 쓰는 상황을 전제한다는 점입니다. 이 관점에서는 모델과 에이전트는 바뀔 수 있고, 오래 남는 것은 오케스트레이션과 감사 계층입니다.
IDE가 선택지가 된다는 말의 실제 의미
IDE가 선택지가 된다는 말은 개발자 경험이 중요하지 않다는 뜻이 아닙니다. 오히려 IDE가 너무 많은 일을 혼자 떠안기 어렵다는 뜻에 가깝습니다. 초기 AI 코딩 도구는 에디터 안에서 빛났습니다. 자동완성, 코드 설명, 함수 생성, 테스트 작성은 파일 중심 UI와 잘 맞았습니다. 그러나 에이전트형 개발은 파일 중심 UI만으로 설명하기 어렵습니다.
에이전트는 문제를 쪼갭니다. 브랜치를 만들고, 의존성을 설치하고, 명령을 실행하고, 실패 로그를 읽고, 다른 파일을 고치고, 다시 테스트합니다. 때로는 외부 문서를 검색하고, 클라우드 리소스를 만들고, CI 상태를 확인하고, 리뷰 코멘트에 답합니다. 이 작업은 IDE 탭 하나보다 workflow run에 가깝습니다. 그래서 앞으로의 표면은 IDE, CLI, 브라우저 대시보드, 모바일 승인, PR 코멘트, 이슈 트래커, 자동화 플랫폼이 섞인 형태가 될 가능성이 큽니다.
Gartner의 65% 예측은 바로 이 표면 분산을 가리킵니다. 팀이 에이전트를 많이 쓰게 되면 사람은 편집 화면에 계속 앉아 있지 않습니다. 에이전트 작업을 큐에 넣고, 중간 산출물을 확인하고, 위험한 tool call을 승인하고, 결과 diff를 검토하고, 실패한 세션을 재시작합니다. 이때 IDE는 여전히 편리한 장소지만, 유일한 통제실은 아닙니다.
모델보다 어려운 것은 운영입니다
코딩 에이전트 시장은 지난 1년 동안 모델 이름을 중심으로 빠르게 움직였습니다. Claude Code, OpenAI Codex, Cursor, GitHub Copilot, Google Antigravity, Gemini CLI, xAI Grok Build가 저마다 더 긴 작업, 더 나은 diff, 더 많은 도구, 더 넓은 통합을 말했습니다. 하지만 기업 도입에서는 모델이 충분히 똑똑해진 뒤에도 다른 질문이 남습니다.
첫째, 권한입니다. 에이전트가 어떤 파일을 읽고 쓸 수 있습니까. 어떤 shell command를 실행할 수 있습니까. 클라우드 계정과 production secret에는 접근할 수 있습니까. 한 번 승인된 권한은 세션이 끝난 뒤 어떻게 회수됩니까. 에이전트가 여러 subtask를 만들면 그 하위 작업에도 같은 권한이 흘러갑니까.
둘째, 감사입니다. 누가 어떤 요청을 했고, 에이전트는 어떤 tool call을 했으며, 어떤 파일과 API를 건드렸습니까. 실패한 작업은 왜 실패했습니까. 사람이 승인한 변경과 에이전트가 자동으로 수행한 변경은 로그에서 구분됩니까. 규제 산업에서는 이 질문이 생산성보다 먼저 옵니다.
셋째, 비용입니다. 에이전트는 사람보다 토큰을 빠르게 씁니다. 자동완성은 짧고 잦은 호출이지만, 에이전트형 작업은 긴 컨텍스트, 반복 실행, 테스트 로그, 문서 검색, retry를 포함합니다. 구독형 가격이 이 사용 패턴을 감당하지 못하면 rate limit과 크레딧 분리가 생기고, 팀은 어떤 작업을 고가 모델에 맡길지 정책을 세워야 합니다.
넷째, 검증입니다. 에이전트가 "끝났습니다"라고 말하는 것과 실제로 끝난 것은 다릅니다. 테스트는 통과했습니까. 타입 검사는 돌았습니까. 마이그레이션이 필요한 파일을 놓치지 않았습니까. 보안 정책을 어기지 않았습니까. 변경이 작고 리뷰 가능한 단위로 남았습니까. 결국 에이전트 운영 플랫폼의 핵심 기능은 생성보다 완료 조건과 증거 관리가 될 수 있습니다.
Gartner 예측을 그대로 믿기보다 봐야 할 것
Gartner식 예측은 늘 조심해서 읽어야 합니다. "2027년 65%"라는 수치는 시장 방향을 설명하는 신호이지, 모든 팀에 그대로 적용되는 일정표가 아닙니다. 소규모 팀이나 개인 개발자에게는 여전히 IDE와 CLI 중심 경험이 가장 빠를 수 있습니다. 반대로 규제 산업, 대규모 플랫폼 팀, 클라우드 인프라 팀은 더 빨리 플랫폼형 운영 계층을 요구할 수 있습니다.
커뮤니티 반응도 단순하지 않습니다. Reddit의 기업 에이전트 관련 토론에서는 데모는 쉬워졌지만 실제 배포는 어렵다는 말이 반복됩니다. 누가 tool call을 승인했는지, 어떤 credential이 쓰였는지, 에이전트가 실제로 무엇을 건드렸는지 추적하지 못하면 보안팀의 질문 앞에서 멈춘다는 지적입니다. 반대로 Gartner 예측 자체를 과장으로 보는 시각도 있습니다. "agentic AI"라는 이름이 기존 자동화나 워크플로 제품의 재포장에 쓰인다는 비판도 여전히 유효합니다.
그래서 이 발표의 가치는 수치 하나보다 평가 기준에 있습니다. 좋은 코딩 에이전트를 고를 때 이제 개발팀은 다음 질문을 던져야 합니다. 이 도구는 우리 저장소 규칙을 얼마나 잘 읽습니까. 실행 환경은 어디입니까. 실패한 세션을 재현할 수 있습니까. 로그는 보존됩니까. 민감한 파일 접근을 막을 수 있습니까. 모델을 바꿔도 workflow와 감사 체계는 유지됩니까. 사용량 한도와 비용은 예측 가능합니까.
코딩 에이전트는 개발 도구이면서 운영 시스템이 됩니다
초기 코딩 보조 도구는 개발자의 손을 빠르게 만드는 제품이었습니다. 지금의 코딩 에이전트는 개발팀의 작업 시스템에 더 가까워지고 있습니다. 이 차이는 큽니다. 손을 빠르게 만드는 도구는 개인 취향과 생산성으로 평가됩니다. 작업 시스템은 권한, 책임, 비용, 장애, 감사, 장기 유지보수로 평가됩니다.
Google Managed Agents의 isolated Linux environment, AWS Agent Toolkit의 IAM guardrails와 CloudTrail observability, UiPath의 credential vault와 RBAC는 서로 다른 제품이지만 같은 방향을 가리킵니다. 에이전트가 기업 환경 안에서 실제 일을 하려면 모델 호출만으로는 부족합니다. 실행 경계, 도구 카탈로그, 검증 루프, 정책 엔진, 로그, 비용 관리가 함께 있어야 합니다.
이 관점에서 IDE는 더 이상 제품의 전부가 아닙니다. IDE는 사람이 에이전트를 부르는 입구 중 하나입니다. CLI는 자동화와 로컬 반복의 입구입니다. 브라우저 대시보드는 여러 세션을 보는 표면입니다. PR과 이슈는 검토와 책임의 표면입니다. 클라우드 샌드박스는 실행의 표면입니다. 모바일은 승인과 모니터링의 표면입니다. 코딩 에이전트 시장은 이 표면들을 누가 자연스럽고 안전하게 연결하느냐의 경쟁으로 이동하고 있습니다.
개발팀이 지금 확인해야 할 체크포인트
이 뉴스가 당장 모든 팀의 도구 선택을 바꾸지는 않습니다. 하지만 엔터프라이즈 개발팀이라면 파일럿 단계에서 확인해야 할 체크포인트는 분명해졌습니다.
먼저, 에이전트 사용을 개인 실험으로만 두지 말고 작업 유형별로 나눠야 합니다. 문서 수정, 테스트 보강, 버그 재현, 인프라 변경, 보안 수정은 위험도가 다릅니다. 각 작업 유형마다 허용되는 tool call, 승인 조건, 검증 명령, 리뷰 기준이 달라야 합니다.
다음으로, 에이전트가 남기는 산출물을 코드와 같은 수준으로 취급해야 합니다. AGENTS.md, SKILL.md, workflow prompt, policy file은 단순 설정이 아닙니다. 그것들은 에이전트가 조직 안에서 어떻게 행동할지 정하는 운영 문서입니다. 변경 이력과 리뷰가 필요합니다.
마지막으로, 벤더 선택 기준을 모델 점수 하나로 좁히지 말아야 합니다. 오늘 가장 좋은 모델이 내년에 그대로 우위일 가능성은 낮습니다. 반면 권한 모델, 감사 로그, 비용 구조, workflow 통합, 지원 체계는 조직에 오래 남습니다. Gartner가 말한 commercial maturity와 market durability가 여기서 의미를 갖습니다.
구매 절차도 달라질 가능성이 큽니다. 예전 코딩 보조 도구는 개발자 몇 명이 써보고 만족도를 비교한 뒤 좌석을 늘리는 방식으로 확산됐습니다. 코딩 에이전트는 그보다 많은 이해관계자를 끌어들입니다. 보안팀은 권한과 secret 접근을 봅니다. 플랫폼팀은 실행 환경과 네트워크 경계를 봅니다. 재무팀은 사용량 예측과 overage 구조를 봅니다. 법무와 컴플라이언스 팀은 로그 보존, 데이터 처리 지역, 모델 학습 사용 여부를 묻습니다. 개발자 경험이 좋더라도 이 질문들에 답하지 못하면 대규모 배포는 멈춥니다.
이 점에서 Gartner 발표는 벤더에게도 압박입니다. "우리 에이전트가 더 똑똑하다"는 주장만으로는 부족합니다. 어떤 작업은 자동 승인해도 되고, 어떤 작업은 사람이 중간에 봐야 하며, 어떤 작업은 아예 실행하지 못하게 해야 하는지 제품 안에서 표현할 수 있어야 합니다. 또한 실패한 세션을 나중에 조사할 수 있어야 합니다. 기업은 성공한 데모보다 실패한 작업의 설명 가능성을 더 오래 기억합니다.
Gartner의 65% 예측은 과감합니다. 하지만 방향 자체는 이미 여러 제품 발표에서 보입니다. 코딩 에이전트는 IDE 안의 똑똑한 기능에서, 조직의 소프트웨어 작업을 실행하는 운영 계층으로 이동하고 있습니다. 앞으로의 경쟁은 "누가 더 자연스럽게 코드를 써주는가"에서 끝나지 않습니다. 누가 에이전트의 장시간 작업을 안전하게 실행하고, 비용을 예측하고, 결과를 검증하고, 조직의 책임 체계 안에 넣을 수 있는지가 더 큰 승부가 됩니다.