Devlery
Blog/AI

Baidu DAA, 에이전트 시대의 새 지표를 꺼냈다

Baidu가 Create 2026에서 Daily Active Agents를 제안했습니다. 토큰 소비가 아니라 실제로 일하는 에이전트 수가 플랫폼 경쟁 지표가 됩니다.

Baidu DAA, 에이전트 시대의 새 지표를 꺼냈다
AI 요약
  • 무슨 일: Baidu가 Create 2026에서 Daily Active Agents를 AI 시대의 새 플랫폼 지표로 제안했습니다.
    • Robin Li는 토큰은 비용을 재는 입력 지표이고, 에이전트 시대에는 "일하고 결과를 내는 에이전트 수"를 봐야 한다고 말했습니다.
  • 제품 축: DuMate, Miaoda/MeDo, Baidu Yijing, Famou Agent 2.0, full-stack AI Cloud가 한 번에 발표됐습니다.
  • 개발자 의미: 코딩 에이전트 경쟁은 IDE 보조 기능을 넘어 disposable software와 agent infra 경쟁으로 이동합니다.
    • Baidu는 Miaoda 앱 코드의 90%가 Miaoda 자체로 생성됐고, Famou가 자동화 항만에서 10.21% 개선을 냈다고 밝혔습니다.
  • 주의점: DAA는 아직 Baidu가 제안한 프레임입니다. 실제 표준이 되려면 "활성"과 "결과"를 검증하는 공통 정의가 필요합니다.

Baidu가 2026년 5월 13일 Baidu Create 2026에서 흥미로운 단어를 꺼냈습니다. Daily Active Agents, 줄여서 DAA입니다. 모바일 인터넷 시대의 대표 지표가 Daily Active Users였다면, 에이전트 시대에는 매일 실제로 일하고 결과를 내는 에이전트 수를 봐야 한다는 주장입니다.

이 발표가 단순한 용어 놀이로 끝나지 않는 이유는 Baidu가 지표와 제품 포트폴리오를 동시에 내놨기 때문입니다. 일반 목적 에이전트 DuMate, 코딩 에이전트 Miaoda와 글로벌 버전 MeDo, 디지털 휴먼 플랫폼 Baidu Yijing, self-evolving agent Famou Agent 2.0, 대규모 에이전트 애플리케이션을 위한 full-stack AI Cloud가 같은 무대에서 묶였습니다. Baidu는 "모델을 얼마나 많이 호출했는가"가 아니라 "얼마나 많은 에이전트가 일을 처리했는가"를 말하고 싶어 합니다.

지금까지 AI 플랫폼 경쟁은 크게 세 가지 숫자로 설명됐습니다. 첫째는 모델 성능 점수입니다. MMLU, SWE-Bench, LMArena, GPQA 같은 벤치마크가 모델의 상대적 위치를 보여줬습니다. 둘째는 사용자 규모입니다. ChatGPT 주간 활성 사용자, Claude 구독자, Gemini 앱 사용자 같은 숫자가 소비자 AI의 확산을 설명했습니다. 셋째는 토큰 처리량입니다. API 사업에서는 사용량, 비용, 마진, 인프라 수요를 이해하는 데 토큰이 핵심 단위였습니다.

DAA는 이 셋과 다릅니다. 성능도 아니고 방문자 수도 아니며, 입력량도 아닙니다. Baidu CEO Robin Li는 토큰이 가치를 측정하지 않고 비용을 측정한다고 말했습니다. 같은 100만 토큰을 써도 어떤 에이전트는 보고서 초안만 만들고, 어떤 에이전트는 영업 캠페인을 실행하고, 어떤 에이전트는 생산 스케줄을 다시 짜서 실제 비용을 줄일 수 있습니다. DAA는 이 차이를 "에이전트가 일을 했는가"라는 출력 지표로 바꾸려는 시도입니다.

Baidu Create 2026 발표를 바탕으로 재구성한 DAA 지표 전환

왜 지금 DAA인가

Baidu가 DAA를 꺼낸 배경에는 AI 애플리케이션의 모호한 성공 지표 문제가 있습니다. 생성형 AI가 도입된 뒤 많은 조직은 사용량을 먼저 봤습니다. 몇 명이 챗봇을 쓰는가, 몇 번 질문하는가, 월별 토큰이 얼마나 늘었는가를 측정했습니다. 하지만 이 숫자는 효율 향상을 직접 말해주지 않습니다. 오히려 토큰 사용량이 늘었다는 말은 비용이 늘었다는 뜻일 수도 있습니다.

사용자 수도 부족합니다. 사람이 AI 도구에 들어와 질문했다는 사실과 실제 업무가 끝났다는 사실은 다릅니다. 특히 에이전트 제품은 사용자가 오래 머물수록 좋은 제품이 아닐 수 있습니다. 좋은 에이전트는 사용자의 체류 시간을 줄이고, 백그라운드에서 일을 끝내고, 필요한 승인 지점에서만 사람을 호출합니다. 이 경우 DAU는 제품 가치를 과소평가하거나 오해하게 만들 수 있습니다.

그래서 Baidu는 AI 플랫폼의 건강도를 "몇 명이 왔나"가 아니라 "몇 개의 에이전트가 결과를 냈나"로 보자고 제안합니다. 공식 발표에 따르면 Robin Li는 글로벌 DAA가 장기적으로 100억을 넘을 수 있다고 예측했습니다. 사람보다 에이전트가 많아지는 세계를 전제한 숫자입니다. 한 사람이 여러 에이전트를 갖고, 기업의 부서마다 수십에서 수천 개의 에이전트가 돌아가며, 일회성 소프트웨어와 워크플로가 계속 생성된다면 불가능한 상상은 아닙니다.

물론 이 숫자는 아직 시장 표준이 아닙니다. "활성 에이전트"가 무엇인지, "결과를 냈다"는 기준이 무엇인지, 에이전트가 하위 에이전트를 호출할 때 중복 집계는 어떻게 할지 정해진 것이 없습니다. 하지만 바로 그 점 때문에 DAA가 뉴스입니다. Baidu는 에이전트 시대의 단위를 먼저 정의하려고 합니다. 지표를 장악하면 제품 포지셔닝도 장악하기 쉬워집니다.

DuMate는 포털형 에이전트입니다

첫 번째 축은 DuMate입니다. Baidu는 Create 2026에서 DuMate 모바일 에디션을 발표했습니다. 공식 발표는 DuMate가 PC와 모바일 사이에서 실시간 동기화되고, 사용자가 언제 어디서든 작업을 시작할 수 있으며, 화면을 읽고, 소프트웨어를 조작하고, 파일을 처리하고, 비즈니스 시스템을 end-to-end로 연결할 수 있다고 설명합니다. Baidu Cloud의 DuMate 문서도 화면을 보고 소프트웨어를 조작하며 파일과 업무 시스템을 연결하는 데스크톱급 AI 에이전트라는 방향을 보여줍니다.

여기서 중요한 표현은 "unified gateway"입니다. Robin Li는 DuMate가 Baidu Search AI API, Miaoda 코딩 에이전트, Famou Agent를 통합한다고 설명했습니다. 즉 DuMate는 하나의 에이전트 앱이라기보다 Baidu 에이전트 포트폴리오의 입구에 가깝습니다. 검색, 코딩, 깊은 조사, 데이터 분석, 앱 생성 같은 작업을 하나의 상위 에이전트 경험으로 묶겠다는 전략입니다.

이는 OpenAI의 ChatGPT, Anthropic의 Claude, Google의 Gemini가 가는 방향과 닮았습니다. 프론티어 AI 앱은 더 이상 대화창만 제공하지 않습니다. 파일, 브라우저, 업무 앱, 코드 실행, 결제, 문서, 스프레드시트, 캘린더를 연결하는 작업 표면이 됩니다. DuMate의 차별점은 Baidu가 중국 내 검색, 클라우드, 엔터프라이즈, 로컬 앱 생태계를 갖고 있다는 점입니다. 글로벌 개발자에게는 낯설 수 있지만, 중국 시장에서는 검색과 클라우드 인프라를 등에 업은 에이전트 포털이 될 수 있습니다.

Miaoda와 MeDo는 일회성 소프트웨어 논리를 밀어붙입니다

두 번째 축은 코딩 에이전트 Miaoda입니다. Baidu는 Miaoda 앱과 엔터프라이즈 에디션을 발표했고, 누구나 한 줄의 코드 없이 애플리케이션을 만들 수 있다고 설명했습니다. 더 공격적인 주장은 Miaoda 앱 코드의 90%가 Miaoda 자체로 생성됐다는 대목입니다. 이는 제품 홍보 문구이기도 하지만, 코딩 에이전트가 자기 제품 개발 루프 안으로 들어왔다는 신호로 읽을 수 있습니다.

Robin Li는 코딩 에이전트가 개발 비용을 거의 0에 가깝게 압축하고, "disposable software"를 합리적인 선택으로 만든다고 말했습니다. disposable software는 특정 순간과 특정 목적을 위해 만들어지고, 오래 유지되지 않아도 되는 소프트웨어입니다. 예를 들어 일회성 이벤트 운영 대시보드, 한 캠페인만을 위한 내부 툴, 특정 고객 미팅을 위한 데이터 앱, 하루짜리 물류 시뮬레이터가 여기에 들어갈 수 있습니다.

이 개념은 개발자에게 불편하면서도 중요합니다. 전통적인 소프트웨어 공학은 유지보수, 확장성, 재사용성을 중시합니다. 하지만 생성 비용이 크게 낮아지면 모든 앱이 장기 제품일 필요는 없습니다. 문제를 해결하는 데 2시간 쓰려고 2주짜리 내부 도구를 만들 수는 없지만, 에이전트가 10분 만에 만들고 사용자가 검증할 수 있다면 계산이 달라집니다.

그렇다고 disposable software가 소프트웨어 공학을 폐기한다는 뜻은 아닙니다. 오히려 경계가 더 중요해집니다. 일회성 앱이 개인 파일만 읽고 끝나는지, 고객 데이터를 만지는지, 결제나 운영 시스템을 호출하는지에 따라 필요한 품질 기준이 달라집니다. Baidu가 Miaoda의 엔터프라이즈 에디션을 함께 내놓은 이유도 여기에 있습니다. 코딩 에이전트는 장난감 앱 제작기에서 벗어나면 곧 권한, 배포, 감사, 데이터 연결 문제를 만납니다.

글로벌 버전 MeDo도 눈여겨볼 지점입니다. Baidu는 MeDo를 통해 중국 내 Miaoda 경험을 해외 개발자에게도 열겠다고 밝혔습니다. Cursor, Replit, Lovable, Bolt, Claude Code, Codex가 이미 글로벌 코딩 에이전트 시장을 치열하게 나누는 상황에서 Baidu식 코딩 에이전트가 얼마나 침투할지는 아직 미지수입니다. 다만 Baidu는 "앱을 만드는 AI"보다 "에이전트 수가 폭증하는 생태계"라는 더 큰 이야기 안에 Miaoda를 배치하고 있습니다.

Baidu Yijing은 보이는 에이전트입니다

세 번째 축은 Baidu Yijing입니다. Huiboxing에서 리브랜딩된 이 플랫폼은 라이브 스트리밍, 비디오 제작, 실시간 인터랙티브 경험을 포괄하는 디지털 휴먼 플랫폼으로 설명됩니다. Robin Li는 디지털 휴먼을 "볼 수 있는 에이전트"라고 표현했습니다. 음성, 표정, 제스처가 붙으면 에이전트는 단순한 백엔드 자동화가 아니라 고객과 직접 만나는 인터페이스가 됩니다.

Baidu 발표에 따르면 Yijing은 스크립트 작성, 영상 제작, 지능형 편집이라는 세 가지 에이전트 기능을 갖고, 12개 언어와 native-level lip-sync 정확도를 지원합니다. 여기서 개발자 관점의 포인트는 디지털 휴먼이 생성형 영상 제품이 아니라 에이전트 배포 형태가 된다는 점입니다. 고객 상담, 커머스 라이브, 교육, 마케팅, 내부 안내, 현장 운영 지시가 모두 "말하고 보이는 에이전트"의 형태로 포장될 수 있습니다.

이는 AI 에이전트의 채널 경쟁과도 연결됩니다. 어떤 에이전트는 IDE 안에서 작동합니다. 어떤 에이전트는 Slack이나 Teams 안에서 승인 요청을 보냅니다. 어떤 에이전트는 브라우저를 조작합니다. Yijing은 영상과 음성으로 사용자를 만나는 채널입니다. Baidu가 DAA를 말할 때 에이전트는 코드 실행 프로세스만 뜻하지 않습니다. 눈에 보이는 디지털 직원, 콘텐츠 진행자, 판매 보조자까지 포함하는 더 넓은 단위입니다.

Famou는 산업 최적화 쪽의 증거입니다

네 번째 축은 Famou Agent 2.0입니다. Baidu는 Famou를 self-evolving agent로 설명하고, 생산 스케줄링, 공정 최적화, 물류 계획 같은 고부가 use case로 직접 접근 범위를 넓혔다고 밝혔습니다. 발표에서 가장 구체적인 숫자는 자동화 항만 사례입니다. Famou Agent가 선석 스케줄링, 장비 배정, 화물 우선순위에서 최적 해법을 찾아 이미 고도로 최적화된 baseline 위에서 10.21% 성능 개선을 냈다는 주장입니다.

이 수치는 검증 가능한 세부 조건이 더 필요합니다. 어떤 baseline인지, 성능의 정의가 처리량인지 비용인지 지연인지, 시뮬레이션인지 실제 운영인지에 따라 의미가 달라집니다. 그럼에도 Baidu가 이 사례를 전면에 둔 이유는 분명합니다. 에이전트가 생산성을 만든다는 주장은 사무 자동화보다 산업 운영에서 더 설득력을 얻습니다. 스케줄링과 물류는 작은 개선도 큰 비용 차이로 이어질 수 있기 때문입니다.

Famou Agent 2.0이 MLE-Bench의 가장 어려운 15개 과제 중 9개를 이겼다는 주장도 같은 방향입니다. Baidu는 단순 대화형 도우미보다 self-verification과 closed-loop execution을 강조합니다. 에이전트가 스스로 후보를 만들고, 검증하고, 실패를 반영하고, 다시 실행할 수 있다면 효율 향상은 선형이 아니라 지수적으로 커질 수 있다는 논리입니다.

이 지점에서 DAA는 더 선명해집니다. DAA가 단순히 "켜져 있는 봇 수"라면 의미가 약합니다. 하지만 Famou처럼 산업 운영에서 검증 가능한 개선을 만드는 에이전트가 늘어난다면 DAA는 생산성 지표에 가까워집니다. Baidu가 말하는 핵심은 "많은 사람이 AI를 쓴다"가 아니라 "많은 에이전트가 실제 운영 문제를 닫힌 루프로 해결한다"입니다.

제품/계층역할Baidu가 강조한 지표
DuMate검색, 코딩, 조사, 데이터 분석, 앱 생성을 연결하는 일반 목적 에이전트 게이트웨이화면 읽기, 소프트웨어 조작, 파일 처리, 업무 시스템 연결
Miaoda / MeDo코딩 지식 없이 앱을 만드는 코딩 에이전트와 글로벌 버전Miaoda 앱 코드의 90%를 자체 생성
Baidu Yijing라이브 스트리밍, 영상 제작, 인터랙션을 맡는 보이는 에이전트12개 언어와 native-level lip-sync
Famou Agent 2.0생산 스케줄링, 공정 최적화, 물류 계획을 수행하는 self-evolving agent자동화 항만 10.21% 개선, MLE-Bench hardest 15개 중 9개 승리
Baidu AI Cloud대규모 에이전트 앱을 위한 full-stack AI CloudKunlunxin 클러스터로 ERNIE 5.1 계열 모델 학습 지원

인프라 발표가 같이 나온 이유

Baidu는 제품만 발표하지 않았습니다. AI Cloud를 대규모 에이전트 애플리케이션을 위한 full-stack AI Cloud로 재포지셔닝한다고 밝혔습니다. Agent Infra와 AI Infra를 함께 업그레이드하고, Kunlunxin AI chip 기반 전용 클러스터가 ERNIE 5.1 시리즈 핵심 모델 학습을 지원했다고 설명했습니다. 5월 초 공개된 ERNIE 5.1이 LMArena의 텍스트와 검색 리더보드에서 중국 모델 중 1위를 기록했다는 주장도 붙었습니다.

이 조합은 중국 AI 기업의 특수한 조건을 보여줍니다. 미국 모델 기업은 NVIDIA GPU, hyperscaler cloud, 글로벌 SaaS 생태계를 중심으로 확장합니다. Baidu는 자체 검색, 클라우드, 칩, 모델, 앱 생태계를 한 묶음으로 제시합니다. 지정학적 제약과 중국 내 클라우드 경쟁을 고려하면, 에이전트 포트폴리오 발표는 곧 인프라 주권 발표이기도 합니다.

에이전트는 일반 챗봇보다 인프라 요구가 복잡합니다. 장기 작업을 추적해야 하고, 도구 호출을 조율해야 하며, 파일과 권한을 관리해야 하고, 실패한 작업을 재시도해야 합니다. 대규모 산업 현장에서는 관측성, 보안, 데이터 주권, 지연 시간, 비용 예측성도 필요합니다. Baidu가 full-stack이라는 단어를 쓰는 이유는 에이전트 사업이 모델 API 하나로 끝나지 않는다는 사실을 알고 있기 때문입니다.

DAA가 표준이 되려면 무엇이 필요할까

DAA는 매력적인 프레임이지만 아직 위험한 프레임이기도 합니다. 먼저 정의 문제가 있습니다. 에이전트가 하루에 한 번 알림을 보내면 active인가요? 사용자의 승인 없이 백그라운드 조사만 하면 active인가요? 하나의 상위 에이전트가 열 개의 하위 에이전트를 호출하면 DAA는 1인가요, 11인가요? 실패한 작업도 active에 들어가나요? 이런 질문이 정리되지 않으면 DAA는 새로운 vanity metric이 될 수 있습니다.

둘째는 결과 검증입니다. Baidu는 "일하고 결과를 전달하는 에이전트"를 말하지만, 결과의 품질은 산업마다 다릅니다. 코딩 에이전트라면 테스트 통과, 배포 성공, 회귀 없음, 유지보수 비용이 중요합니다. 영업 에이전트라면 매출 기여와 고객 경험이 중요합니다. 물류 에이전트라면 처리량, 비용, 안전, 지연 시간이 중요합니다. DAA가 플랫폼 지표가 되려면 단순 카운트가 아니라 도메인별 completion과 outcome을 함께 봐야 합니다.

셋째는 책임 소재입니다. 에이전트가 많아질수록 사람이 직접 한 일과 에이전트가 한 일이 섞입니다. 승인만 사람이 하고 판단은 에이전트가 했다면, 실패의 책임은 누구에게 있을까요? 엔터프라이즈 시장에서는 이 질문을 피할 수 없습니다. 그래서 최근 OpenAI Daybreak, Endor Labs AURI, Google Workspace AI governance, Red Hat Ansible 기반 agent execution 같은 뉴스가 모두 권한, 감사로그, 정책, 통제 계층으로 모입니다. DAA가 커질수록 governance도 커져야 합니다.

넷째는 경제성입니다. 토큰은 비용 지표라서 부족하다는 Baidu의 비판은 맞습니다. 하지만 에이전트도 결국 비용을 씁니다. 모델 호출, 검색, 툴 실행, 샌드박스, 브라우저 자동화, 워크플로 오케스트레이션, 저장소 접근, 사람 승인 시간이 모두 비용입니다. 좋은 DAA는 단순히 많은 에이전트가 아니라 비용 대비 결과를 내는 에이전트여야 합니다.

개발자에게 남는 질문

개발자와 AI 팀에게 이번 발표의 의미는 Baidu 제품을 당장 써야 한다는 이야기가 아닙니다. 더 중요한 것은 플랫폼 경쟁의 언어가 바뀌고 있다는 점입니다. 코딩 에이전트를 쓰는 팀은 이미 비슷한 질문을 하고 있습니다. 에이전트가 하루에 몇 개의 PR을 만들었는가, 몇 개가 머지됐는가, 몇 개가 되돌려졌는가, 테스트 실패를 얼마나 스스로 고쳤는가, 보안 정책 위반 없이 어디까지 실행했는가 같은 지표입니다.

Baidu의 DAA는 이 질문을 더 넓은 플랫폼 단위로 확장합니다. 업무 에이전트, 코딩 에이전트, 디지털 휴먼, 산업 최적화 에이전트, 클라우드 인프라가 모두 하나의 "활성 에이전트 경제"로 묶입니다. 이 관점에서는 AI 앱의 승자는 가장 많은 사용자를 오래 붙잡는 회사가 아니라, 가장 많은 일을 안정적으로 끝내는 에이전트 생태계를 가진 회사가 됩니다.

물론 Baidu가 이 프레임을 제안했다고 해서 시장이 그대로 받아들일지는 알 수 없습니다. OpenAI와 Anthropic은 각각 ChatGPT/Codex와 Claude/Cowork/Code를 통해 다른 지표를 만들 수 있습니다. Microsoft는 Agent 365와 Copilot 생태계에서 조직 단위 governance 지표를 밀 수 있습니다. Google은 Workspace와 Gemini API 안에서 작업 완료와 앱 연결성을 강조할 수 있습니다. 결국 DAA는 여러 회사가 자기 방식으로 변형할 가능성이 큽니다.

그럼에도 이번 발표는 기억해둘 만합니다. 2024년과 2025년의 질문이 "모델이 얼마나 똑똑한가"였다면, 2026년의 질문은 "그 모델이 어떤 일을 실제로 끝냈는가"로 이동하고 있습니다. Baidu는 그 변화를 DAA라는 이름으로 포장했습니다. 이름이 살아남을지는 모르지만, 방향은 분명합니다. AI 플랫폼의 다음 경쟁력은 토큰을 태우는 능력이 아니라, 에이전트를 일하게 만들고 그 결과를 측정하는 능력입니다.