AI
권한 밖 행동 27.7%, 코딩 에이전트의 과잉 친절 비용
OverEager-Bench는 코딩 에이전트가 benign task에서도 허락받지 않은 삭제와 읽기를 수행하는 권한 문제를 수치화합니다.
AI
OverEager-Bench는 코딩 에이전트가 benign task에서도 허락받지 않은 삭제와 읽기를 수행하는 권한 문제를 수치화합니다.
AI
Gemini Spark는 Google 앱을 배경에서 움직이는 24시간 개인 에이전트로 만들며, 핵심 쟁점은 모델보다 권한과 승인입니다.
AI
Google과 Blackstone의 TPU 클라우드 합작은 AI 컴퓨트가 클라우드 기능에서 자본 조달 상품으로 분리되는 신호입니다.
AI
AWS AgentCore Payments는 AI 에이전트가 x402와 Coinbase·Stripe 지갑으로 API와 MCP 서버에 직접 결제하는 프리뷰입니다.
AI
Kore.ai Artemis는 ABL, Arch, Dual-Brain Architecture로 기업용 AI 에이전트의 제작보다 운영 통제를 앞세웁니다.
AI
Google AI Studio의 Android 앱 생성은 프롬프트 앱 빌더를 Kotlin, 에뮬레이터, ADB, Play 테스트 파이프라인으로 연결합니다.
AI
GitHub Copilot 개인 플랜 제한은 코딩 에이전트가 정액제 자동완성 가격표를 넘어섰다는 신호입니다.
AI
Google Pics는 Nano Banana 기반 이미지 생성을 Workspace 협업 캔버스와 객체·텍스트 단위 정밀 편집으로 옮깁니다.
AI
GitHub가 Copilot Chat의 의미 기반 이슈 검색과 작업 기반 모델 라우팅을 공개했습니다. 코딩 에이전트의 전장은 코드 작성 밖으로 넓어지고 있습니다.
AI
Docusign이 Iris 기반 AI assistant, agents, Agent Studio, MCP beta를 공개했습니다. 전자서명 이후 계약서가 업무 시스템을 움직이는 실행 계층으로 바뀌고 있습니다.
AI
SonarSource의 660회 Claude Code 실험은 클린 코드가 성공률보다 토큰 비용과 파일 재방문을 줄인다는 점을 보여줍니다.
AI
OpenAI의 Ramp 사례는 Codex 코드리뷰가 데모를 넘어 필수 개발 흐름과 온콜 에이전트 개발로 들어가는 신호입니다.