Devlery

Blog

AI 뉴스와 코딩 에이전트, LLM, AI 인프라의 변화를 기록합니다.

권한 밖 행동 27.7%, 코딩 에이전트의 과잉 친절 비용

권한 밖 행동 27.7%, 코딩 에이전트의 과잉 친절 비용

OverEager-Bench는 코딩 에이전트가 benign task에서도 허락받지 않은 삭제와 읽기를 수행하는 권한 문제를 수치화합니다.

꺼진 노트북 뒤의 Spark, 개인 에이전트의 권한 시험대

꺼진 노트북 뒤의 Spark, 개인 에이전트의 권한 시험대

Gemini Spark는 Google 앱을 배경에서 움직이는 24시간 개인 에이전트로 만들며, 핵심 쟁점은 모델보다 권한과 승인입니다.

50억 달러 TPU 클라우드, Google이 빌린 Blackstone의 지갑

50억 달러 TPU 클라우드, Google이 빌린 Blackstone의 지갑

Google과 Blackstone의 TPU 클라우드 합작은 AI 컴퓨트가 클라우드 기능에서 자본 조달 상품으로 분리되는 신호입니다.

HTTP 402가 살아났다, AWS가 연 에이전트 지갑 실험

HTTP 402가 살아났다, AWS가 연 에이전트 지갑 실험

AWS AgentCore Payments는 AI 에이전트가 x402와 Coinbase·Stripe 지갑으로 API와 MCP 서버에 직접 결제하는 프리뷰입니다.

ABL 6개 패턴, Kore.ai가 노린 에이전트 통제권

ABL 6개 패턴, Kore.ai가 노린 에이전트 통제권

Kore.ai Artemis는 ABL, Arch, Dual-Brain Architecture로 기업용 AI 에이전트의 제작보다 운영 통제를 앞세웁니다.

프롬프트 하나가 Play 테스트로, Android 앱 생성의 새 관문

프롬프트 하나가 Play 테스트로, Android 앱 생성의 새 관문

Google AI Studio의 Android 앱 생성은 프롬프트 앱 빌더를 Kotlin, 에뮬레이터, ADB, Play 테스트 파이프라인으로 연결합니다.

몇 개 요청이 월 구독료를 넘는다, Copilot 가격표의 경고

몇 개 요청이 월 구독료를 넘는다, Copilot 가격표의 경고

GitHub Copilot 개인 플랜 제한은 코딩 에이전트가 정액제 자동완성 가격표를 넘어섰다는 신호입니다.

Google Pics, 프롬프트 복권에서 편집 캔버스로

Google Pics, 프롬프트 복권에서 편집 캔버스로

Google Pics는 Nano Banana 기반 이미지 생성을 Workspace 협업 캔버스와 객체·텍스트 단위 정밀 편집으로 옮깁니다.

이슈 검색까지 의미로, Copilot 에이전트의 새 작업 지도

이슈 검색까지 의미로, Copilot 에이전트의 새 작업 지도

GitHub가 Copilot Chat의 의미 기반 이슈 검색과 작업 기반 모델 라우팅을 공개했습니다. 코딩 에이전트의 전장은 코드 작성 밖으로 넓어지고 있습니다.

Docusign Agent Studio, 계약서가 실행 계층이 되는 순간

Docusign Agent Studio, 계약서가 실행 계층이 되는 순간

Docusign이 Iris 기반 AI assistant, agents, Agent Studio, MCP beta를 공개했습니다. 전자서명 이후 계약서가 업무 시스템을 움직이는 실행 계층으로 바뀌고 있습니다.

34% 줄어든 재방문, 클린 코드가 만든 에이전트 비용 차이

34% 줄어든 재방문, 클린 코드가 만든 에이전트 비용 차이

SonarSource의 660회 Claude Code 실험은 클린 코드가 성공률보다 토큰 비용과 파일 재방문을 줄인다는 점을 보여줍니다.

몇 시간 리뷰가 몇 분으로, Ramp가 Codex에 맡긴 병목

몇 시간 리뷰가 몇 분으로, Ramp가 Codex에 맡긴 병목

OpenAI의 Ramp 사례는 Codex 코드리뷰가 데모를 넘어 필수 개발 흐름과 온콜 에이전트 개발로 들어가는 신호입니다.