Devlery

Blog

개발에 대한 생각과 경험을 기록합니다.

프롬프트 인젝션 한 번으로 서버를 접수한다, CrewAI 4개 CVE가 드러낸 에이전트 보안의 민낯

CrewAI에서 프롬프트 인젝션을 시작으로 샌드박스 탈출, RCE, SSRF, 파일 읽기까지 체이닝되는 4개 CVE가 발견되었습니다. AI 에이전트 프레임워크의 구조적 보안 위기를 분석합니다.

Google 내부 AI 에이전트가 너무 인기라 접근을 제한했다, Agent Smith의 정체

Google의 자율 코딩 에이전트 Agent Smith가 프로덕션 코드의 25% 이상을 생성하며 18만 직원 사이에서 폭발적 인기를 얻었다. 비동기 실행과 모바일 제어로 코딩 어시스턴트 시대를 넘어선 내부 에이전트의 부상을 분석한다.

Bluesky Attie가 쏘아올린 질문, AI는 누구를 위해 알고리즘을 돌리는가

Bluesky가 Claude 기반 AI 앱 Attie를 출시해 자연어로 소셜 피드를 만들 수 있게 했습니다. 그러나 125,000건 차단이라는 폭발적 반발이 터졌습니다. AI와 오픈 프로토콜, 그리고 동의 아키텍처의 교훈을 분석합니다.

AI 에이전트가 1달러로 Docker를 뚫는다, SandboxEscapeBench의 불편한 진실

Oxford와 UK AISI의 SandboxEscapeBench에서 GPT-5와 Claude Opus 4.5가 50% 확률로 Docker 컨테이너 탈출에 성공했습니다. 건당 1달러로 가능한 이 위협이 AI 에이전트 보안의 재설계를 요구합니다.

AI 에이전트가 주당 1.2억 건을 결제한다, 7대 프로토콜 전쟁의 전체 그림

Alipay AI Pay가 주당 1.2억 건 결제를 돌파했고, Visa TAP부터 Google AP2까지 7개 프로토콜이 동시에 등장했습니다. $262B 시장의 실체와 다크웹 사기 450% 증가까지, 에이전틱 결제의 현재를 분석합니다.

Cline Kanban 출시로 본 멀티에이전트 오케스트레이션, 새로운 전쟁이 시작됐다

Cline이 CLI-agnostic 멀티에이전트 오케스트레이션 도구 Kanban을 출시했습니다. 에이전트 5개를 동시에 돌리는 시대, 개발자 워크플로우의 구조적 전환을 분석합니다.

Google Stitch 2.0이 Figma 주가를 12% 떨어뜨렸다, Vibe Design의 시작

Google이 AI 네이티브 디자인 캔버스 Stitch 2.0을 무료로 출시하며 Figma 주가가 12% 급락했습니다. Voice Canvas, Vibe Design, SDK/MCP 서버 통합으로 디자인 도구 시장의 판도가 바뀌고 있습니다.

Meta의 Manus가 데스크톱에 내려왔다, AI 에이전트 전쟁의 새 전선

Meta가 $2B에 인수한 Manus가 데스크톱 앱 My Computer를 출시했습니다. OpenClaw, Claude Cowork, Perplexity와 함께 데스크톱 AI 에이전트 4파전이 본격화되면서, 프라이버시와 편의성 사이의 트레이드오프가 핵심 쟁점으로 떠오르고 있습니다.

AI 에이전트 20개를 동시에 돌리다 막힌 개발자가 만든 무인 회사 운영체제

Paperclip은 여러 AI 에이전트를 하나의 회사처럼 조직화하는 오픈소스 오케스트레이션 플랫폼입니다. 3주 만에 GitHub 스타 4만 개를 돌파한 이 프로젝트가 AI 에이전트 인프라의 새로운 계층을 열고 있습니다.

OpenUI가 JSON을 밀어내고 있다, 생성형 UI 표준 전쟁의 서막

LLM이 UI를 직접 생성하는 시대가 열리고 있습니다. Thesys의 OpenUI가 JSON 대비 67% 토큰 절약과 3배 빠른 렌더링으로 생성형 UI의 새 표준을 제시하며, Vercel json-render, CopilotKit과 3파전을 벌이고 있습니다.

Intercom이 GPT-5.4와 Claude를 이기는 AI를 직접 만들었다, 버티컬 모델의 시대

Intercom이 60명의 AI 팀으로 개발한 Fin Apex 1.0이 고객 서비스 해결률에서 GPT-5.4(71.1%)와 Claude Opus 4.5(71.1%)를 73.1%로 능가했습니다. ARR $100M, 주 200만 건 해결. 버티컬 AI 모델 시대가 열렸습니다.

코딩 에이전트가 자유 소프트웨어를 부활시킬 수 있을까

HN 167포인트를 기록한 글이 던진 질문입니다. AI 코딩 에이전트가 소스 코드 접근권을 실질적 권리로 바꾸면서, SaaS 시대에 잊혔던 소프트웨어 자유가 다시 의미를 갖기 시작했습니다. 하지만 Tailwind의 80% 매출 하락이 보여주듯, 이 부활에는 대가가 따릅니다.

Shopify가 560만 매장을 ChatGPT에 연결했다, Instant Checkout 실패 후 AI 커머스의 재설계

OpenAI Instant Checkout이 12개 매장에서 멈춘 후, Shopify가 Agentic Storefronts로 560만 매장을 ChatGPT·Gemini·Copilot에 기본 연결했습니다. Universal Commerce Protocol과 함께 AI 커머스의 새로운 공식이 등장했습니다.

OpenAI Codex가 플러그인 마켓플레이스를 열었다, 코딩 에이전트는 이제 플랫폼이다

OpenAI가 Codex에 Slack, Figma, Notion 등 20개 이상의 플러그인을 탑재한 마켓플레이스를 출시했습니다. 코딩 에이전트가 IDE를 넘어 개발 워크플로우 전체를 장악하려는 플랫폼 전쟁이 시작됐습니다.

Visa가 AI 에이전트에 결제 능력을 부여했다, 유럽 21개 은행이 동시에 움직인 이유

Visa가 유럽 21개 금융사와 함께 Agentic Ready 프로그램을 런칭했습니다. Banco Santander는 AI 에이전트로 실제 구매를 완료했고, Mastercard, Stripe, Google이 각자의 표준을 내세우며 에이전틱 결제 인프라 전쟁이 시작되었습니다.

Cursor가 ripgrep을 1,300배 이긴 비결, GitHub Code Search의 로컬 부활

GitHub Code Search를 만든 Vicent Marti가 같은 sparse n-gram 기술을 Cursor에 로컬 적용했습니다. ripgrep 16.8초가 13ms로. AI 코딩 에이전트의 검색 병목이 해소되는 이유와 커뮤니티 반응을 분석합니다.

YC CEO가 공개한 Claude Code 가상 엔지니어링 팀, GitHub 50K 스타의 실체

Y Combinator CEO Garry Tan이 공개한 gstack이 GitHub 50K 스타를 돌파했습니다. 60일간 60만 줄의 코드, 15개 AI 페르소나로 구성된 가상 엔지니어링 팀. AI 코딩에서 프롬프트가 아닌 프로세스가 핵심이라는 메시지가 업계를 양극화시키고 있습니다.

ChatGPT 900M, Midjourney 추락, 에이전트 부상: a16z AI 앱 리포트가 말하는 것

a16z가 Top 100 AI 소비자 앱 6판을 발표했습니다. ChatGPT WAU 900M으로 세계 인구 10% 돌파, Midjourney는 Top10에서 46위로 추락, OpenClaw가 GitHub 최다 스타를 기록했습니다. AI 소비자 시장의 구조적 변화를 분석합니다.

Figma MCP 서버가 캔버스를 열었다, AI 에이전트가 디자인을 직접 그리는 시대

Figma가 MCP 서버 write-to-canvas 베타와 Skills 프레임워크를 출시했습니다. AI 코딩 에이전트가 Figma 캔버스에 직접 디자인을 생성하고 수정할 수 있게 되면서, 디자인과 코드 사이의 핸드오프가 근본적으로 변화합니다.

Replit이 6개월 만에 $9B가 됐다, 병렬 AI 에이전트의 힘

Replit이 $400M 시리즈 D로 $9B 밸류에이션을 달성했습니다. 6개월 전 $3B에서 3배 성장. Agent 4의 병렬 에이전트, 90% 머지 충돌 자동 해결, Zillow의 7,000개 앱 생성 사례까지. 바이브 코딩의 현재와 한계를 분석합니다.

Anthropic이 AI로 AI를 감시한다, Claude Code Auto Mode의 2단계 분류기

Anthropic이 Claude Code에 auto mode를 도입했습니다. AI 분류기가 매 행위를 실시간으로 판단하는 2단계 안전 시스템으로, 93%의 승인 피로를 없애면서 0.4% 오탐률을 달성했습니다. AI 에이전트 안전성의 새로운 패러다임을 분석합니다.

AI 에이전트는 왜 자기 코드를 칭찬할까, Anthropic의 GAN 영감 해법

Anthropic이 GAN에서 영감 받은 Planner-Generator-Evaluator 3-에이전트 아키텍처를 공개했습니다. 자기 칭찬 편향을 구조적으로 해결하고, $9 솔로 에이전트 대비 $200 풀 하네스가 완전 작동 앱을 만들어냅니다.

JetBrains Central이 연 새 전쟁터, AI 코딩은 이제 "거버넌스"가 핵심이다

JetBrains가 AI 코딩 에이전트 거버넌스 플랫폼 Central과 LLM-agnostic CLI 에이전트 Junie를 공개했습니다. 코드 생성 경쟁에서 에이전트 관리 경쟁으로의 구조적 전환을 분석합니다.

Claude가 당신의 Mac을 조종한다: Computer Use와 Dispatch가 바꿀 AI 에이전트의 현실

Anthropic이 Claude로 실제 macOS를 직접 제어하는 Computer Use를 출시했습니다. Dispatch와 결합해 스마트폰에서 지시하고 데스크톱에서 실행하는 원격 AI 비서 시스템의 의미를 분석합니다.

Arm이 43년 만에 직접 만든 칩, AGI CPU와 에이전트 시대의 CPU 부활

Arm이 43년 IP 라이선싱 역사를 깨고 최초의 자체 프로덕션 칩 AGI CPU를 발표했습니다. 136코어 3nm, Meta가 리드 파트너. AI 에이전트 시대에 CPU가 부활하는 이유를 분석합니다.

Mozilla가 만든 AI 에이전트용 Stack Overflow, Cq의 야심과 보안 딜레마

Mozilla AI가 코딩 에이전트 간 지식 공유 플랫폼 Cq를 오픈소스로 공개했습니다. Stack Overflow가 월 20만 질문에서 3,862개로 추락한 시대, 에이전트에게 집단 기억을 주려는 실험과 보안 우려를 분석합니다.

Karpathy의 선언: "인간이 AI 연구의 병목이다"

Andrej Karpathy가 630줄 Python으로 하룻밤에 100개 ML 실험을 자동 실행하는 Autoresearch를 공개했습니다. 20년 경험으로도 놓친 최적화를 AI가 찾아냈고, Shopify CEO는 19% 성능 향상을 보고했습니다.

Microsoft가 라이벌 Anthropic에게 Copilot의 두뇌를 맡긴 이유

Microsoft가 OpenAI가 아닌 Anthropic의 Claude로 Copilot Cowork를 구동합니다. 월 99달러 E7 티어와 함께 출시되며, 이는 AI 에이전트 시대의 멀티 모델 전략을 상징합니다.

Perplexity가 재정의한 "Personal Computer", 24시간 상시 AI 에이전트의 등장

Perplexity가 Mac Mini에서 24시간 상시 구동되는 AI 에이전트 Personal Computer를 출시했습니다. 월 200달러로 파일, 앱, 업무를 통합 관리하며 엔터프라이즈 버전은 4주 만에 3.25년치 작업을 완료했다고 주장합니다.

OpenClaw, GitHub 250K Stars AI 에이전트가 촉발한 보안 위기와 상품화 논쟁

오스트리아 개발자 1명이 만든 OpenClaw가 GitHub 역사상 가장 빠르게 성장하며 React를 추월했습니다. 하지만 135,000개 인스턴스가 해킹에 노출되고 중국은 금지와 보조금을 동시에 내놓는 모순이 벌어지고 있습니다.

Walmart이 ChatGPT 결제를 포기한 이유, AI 커머스의 전환율 참사와 교훈

Walmart의 ChatGPT Instant Checkout 전환율이 자사 웹사이트 대비 3배 낮았다는 데이터가 공개되었습니다. OpenAI는 전 머천트에서 Instant Checkout을 폐지했고, Walmart은 자체 챗봇 Sparky로 전환합니다. AI 커머스는 왜 실패했을까요.

Google AI Studio와 Antigravity가 여는 풀스택 바이브 코딩 시대

Google이 AI Studio에 Antigravity 코딩 에이전트와 Firebase를 통합해 브라우저에서 프롬프트만으로 풀스택 앱을 만드는 바이브 코딩 경험을 출시했습니다. AI 코딩 도구 전쟁의 판도가 어떻게 바뀌는지 분석합니다.

GPT-5.4 출시, AI가 처음으로 컴퓨터 사용에서 인간을 넘어섰다

OpenAI의 GPT-5.4가 OSWorld 벤치마크에서 75%를 기록하며 인간 전문가(72.4%)를 처음으로 초과했습니다. 네이티브 컴퓨터 사용, Tool Search, 1M 토큰 컨텍스트까지 — 3월 AI 모델 경쟁의 판도를 분석합니다.