Devlery

Blog

개발에 대한 생각과 경험을 기록합니다.

Qwen3.6-Plus가 Terminal-Bench에서 Claude를 꺾었다, 그런데 왜 클로즈드소스인가

Alibaba가 에이전틱 코딩 특화 모델 Qwen3.6-Plus를 공개했습니다. Terminal-Bench 2.0에서 Claude Opus 4.5를 넘어섰지만, 오픈소스 명가의 클로즈드소스 전환이라는 논란도 함께 가져왔습니다.

Google 내부 AI 에이전트가 너무 인기라 접근을 제한했다, Agent Smith의 정체

Google의 자율 코딩 에이전트 Agent Smith가 프로덕션 코드의 25% 이상을 생성하며 18만 직원 사이에서 폭발적 인기를 얻었다. 비동기 실행과 모바일 제어로 코딩 어시스턴트 시대를 넘어선 내부 에이전트의 부상을 분석한다.

Wikipedia가 44대 2로 AI 글쓰기를 금지했다, 지식 면역 반응의 시작

영어 Wikipedia 편집자들이 44대 2 압도적 투표로 LLM 기반 문서 작성을 공식 금지했습니다. AI 에이전트 TomWikiAssist의 무단 편집 사건, Habsburg AI 모델 붕괴 위험, 글로벌 Wikipedia의 연쇄 대응까지 분석합니다.

월 $20 생산성 도구인데 법적으로는 "오락 전용", Copilot 이용약관의 불편한 진실

Microsoft Copilot 이용약관에 "entertainment purposes only" 문구가 발견되며 AI 업계의 마케팅과 법적 면책 사이의 모순이 수면 위로 올라왔습니다. 4대 AI 서비스의 이용약관을 비교 분석합니다.

Claude Code 51만 줄이 NPM에서 유출되었다, 소스맵이 드러낸 비밀 로드맵

Anthropic의 Claude Code 전체 소스코드가 NPM 소스맵으로 두 번째 유출되었습니다. 512,000줄의 코드에서 다마고치 AI 펫 BUDDY, 상시 에이전트 KAIROS, Capybara 모델 등 미공개 로드맵이 발견되었습니다.

AI가 코드의 40%를 쓰면 누가 검증하나, Qodo $70M이 여는 시장

Qodo가 $70M Series B를 마감하며 AI 코드 검증 시장의 탄생을 선언했습니다. AI 생성 코드의 60%에 문제가 있고, 성능 비효율은 8배 높은 현실에서 검증이 새로운 인프라로 부상하고 있습니다.

개발자 84%가 AI를 쓰지만 46%는 믿지 않는다, 신뢰의 역설

Stack Overflow 49,000명 설문에서 AI 도구 채택률 84%와 불신률 46%가 동시에 사상 최고를 기록했습니다. METR과 Anthropic 연구가 밝힌 체감과 현실의 격차, 그리고 이 역설이 실무에 미치는 영향을 분석합니다.

AI Slopageddon, 오픈소스 메인테이너들이 AI에게 DDoS 당하고 있다

cURL이 버그 바운티를 폐쇄하고, Ghostty가 AI PR을 금지하고, Jazzband가 10년 만에 문을 닫았습니다. AI 생성 저품질 코드가 오픈소스 메인테이너의 주의력을 고갈시키는 구조적 위기, AI Slopageddon의 실체를 분석합니다.

Cline Kanban 출시로 본 멀티에이전트 오케스트레이션, 새로운 전쟁이 시작됐다

Cline이 CLI-agnostic 멀티에이전트 오케스트레이션 도구 Kanban을 출시했습니다. 에이전트 5개를 동시에 돌리는 시대, 개발자 워크플로우의 구조적 전환을 분석합니다.

Cursor가 3개월 만에 ARR $2B를 찍었다, AI 코딩 도구 시장의 빛과 그림자

Cursor의 ARR이 3개월 만에 $1B에서 $2B로 두 배 성장했습니다. JetBrains 20년 성과를 24개월에 5배 돌파한 성장의 이면에는 Kimi 논란, Copilot 광고 삽입, Windsurf 가격 반발이 공존합니다. $10B 시장으로 향하는 AI 코딩 도구 전쟁의 현주소를 분석합니다.

주니어 개발자 채용 67% 급감, 커리어 사다리의 가운데가 사라지고 있다

미국 엔트리레벨 테크 채용이 67% 급감하고 빅테크 신입 비중이 32%에서 7%로 추락했습니다. Anthropic RCT가 밝힌 AI 의존의 역설, 바벨 경제의 구조적 위기, 그리고 2030년 시니어는 어디서 올 것인가를 분석합니다.

Copilot은 PR에 광고를 넣고 Claude Code는 코드를 지웠다

GitHub Copilot이 PR에 광고를 삽입하고(HN 539pt), Claude Code가 10분마다 git reset --hard로 코드를 삭제(HN 234pt)하는 사건이 동시에 터졌습니다. AI 코딩 도구의 신뢰 위기가 시작되었습니다.

OpenUI가 JSON을 밀어내고 있다, 생성형 UI 표준 전쟁의 서막

LLM이 UI를 직접 생성하는 시대가 열리고 있습니다. Thesys의 OpenUI가 JSON 대비 67% 토큰 절약과 3배 빠른 렌더링으로 생성형 UI의 새 표준을 제시하며, Vercel json-render, CopilotKit과 3파전을 벌이고 있습니다.

코딩 에이전트가 자유 소프트웨어를 부활시킬 수 있을까

HN 167포인트를 기록한 글이 던진 질문입니다. AI 코딩 에이전트가 소스 코드 접근권을 실질적 권리로 바꾸면서, SaaS 시대에 잊혔던 소프트웨어 자유가 다시 의미를 갖기 시작했습니다. 하지만 Tailwind의 80% 매출 하락이 보여주듯, 이 부활에는 대가가 따릅니다.

OpenAI Codex가 플러그인 마켓플레이스를 열었다, 코딩 에이전트는 이제 플랫폼이다

OpenAI가 Codex에 Slack, Figma, Notion 등 20개 이상의 플러그인을 탑재한 마켓플레이스를 출시했습니다. 코딩 에이전트가 IDE를 넘어 개발 워크플로우 전체를 장악하려는 플랫폼 전쟁이 시작됐습니다.

Cursor가 ripgrep을 1,300배 이긴 비결, GitHub Code Search의 로컬 부활

GitHub Code Search를 만든 Vicent Marti가 같은 sparse n-gram 기술을 Cursor에 로컬 적용했습니다. ripgrep 16.8초가 13ms로. AI 코딩 에이전트의 검색 병목이 해소되는 이유와 커뮤니티 반응을 분석합니다.

YC CEO가 공개한 Claude Code 가상 엔지니어링 팀, GitHub 50K 스타의 실체

Y Combinator CEO Garry Tan이 공개한 gstack이 GitHub 50K 스타를 돌파했습니다. 60일간 60만 줄의 코드, 15개 AI 페르소나로 구성된 가상 엔지니어링 팀. AI 코딩에서 프롬프트가 아닌 프로세스가 핵심이라는 메시지가 업계를 양극화시키고 있습니다.

Replit이 6개월 만에 $9B가 됐다, 병렬 AI 에이전트의 힘

Replit이 $400M 시리즈 D로 $9B 밸류에이션을 달성했습니다. 6개월 전 $3B에서 3배 성장. Agent 4의 병렬 에이전트, 90% 머지 충돌 자동 해결, Zillow의 7,000개 앱 생성 사례까지. 바이브 코딩의 현재와 한계를 분석합니다.

AI 에이전트는 왜 자기 코드를 칭찬할까, Anthropic의 GAN 영감 해법

Anthropic이 GAN에서 영감 받은 Planner-Generator-Evaluator 3-에이전트 아키텍처를 공개했습니다. 자기 칭찬 편향을 구조적으로 해결하고, $9 솔로 에이전트 대비 $200 풀 하네스가 완전 작동 앱을 만들어냅니다.

JetBrains Central이 연 새 전쟁터, AI 코딩은 이제 "거버넌스"가 핵심이다

JetBrains가 AI 코딩 에이전트 거버넌스 플랫폼 Central과 LLM-agnostic CLI 에이전트 Junie를 공개했습니다. 코드 생성 경쟁에서 에이전트 관리 경쟁으로의 구조적 전환을 분석합니다.

GitHub Copilot이 당신의 코드로 AI를 학습시킨다, 4월 24일부터

GitHub이 Copilot Free/Pro/Pro+ 사용자의 코드 입력·출력·컨텍스트를 AI 모델 학습에 기본 사용한다고 발표했습니다. 옵트아웃 방식으로, 직접 끄지 않으면 동의한 것으로 간주합니다. 2,000만 개발자에게 영향을 미치는 이 정책 변경의 의미를 분석합니다.

Mozilla가 만든 AI 에이전트용 Stack Overflow, Cq의 야심과 보안 딜레마

Mozilla AI가 코딩 에이전트 간 지식 공유 플랫폼 Cq를 오픈소스로 공개했습니다. Stack Overflow가 월 20만 질문에서 3,862개로 추락한 시대, 에이전트에게 집단 기억을 주려는 실험과 보안 우려를 분석합니다.

AI 앱은 다 어디로 갔나? PyPI 80만 패키지가 말하는 불편한 진실

answer.ai가 PyPI 데이터를 분석한 결과, AI 도구의 생산성 혁명은 데이터에서 보이지 않습니다. AI가 만든 것은 더 많은 소프트웨어가 아니라, 더 많은 AI 소프트웨어뿐이었습니다.

Cursor의 자체 모델은 중국산이었다: Composer 2와 Kimi K2.5 논란의 전말

Cursor가 "자체 개발"로 발표한 Composer 2가 출시 3시간 만에 중국 Moonshot AI의 Kimi K2.5 기반임이 밝혀졌습니다. AI 코딩 도구 시장의 투명성과 미중 AI 지정학 이슈를 분석합니다.

Apple이 바이브 코딩 앱을 차단하면서 Xcode AI 에이전트는 허용한 이유

Apple이 Replit, Vibecode 등 바이브 코딩 앱의 App Store 업데이트를 차단하며 App Store 가이드라인 2.5.2를 근거로 내세웠습니다. 동시에 Xcode 26.3에는 Anthropic과 OpenAI의 AI 에이전트를 통합한 상황. 개발자 커뮤니티는 이중잣대를 지적합니다.

Google AI Studio와 Antigravity가 여는 풀스택 바이브 코딩 시대

Google이 AI Studio에 Antigravity 코딩 에이전트와 Firebase를 통합해 브라우저에서 프롬프트만으로 풀스택 앱을 만드는 바이브 코딩 경험을 출시했습니다. AI 코딩 도구 전쟁의 판도가 어떻게 바뀌는지 분석합니다.

OpenAI가 Python의 심장을 샀다: Astral 인수와 AI 코딩 플랫폼 전쟁

OpenAI가 ruff와 uv를 만든 Astral을 인수합니다. 월 1.26억 다운로드의 Python 핵심 인프라가 AI 코딩 에이전트 Codex에 통합되는 이 움직임이 개발자 생태계에 미칠 파장을 분석합니다.