Devlery

Devlery - AI 개발자를 위한 AI 뉴스 큐레이션

DEVLERYDEVLERYDEVLERY

Devlery blog

AI 개발자를 위한 최신 AI 뉴스 큐레이션.

CodeRabbit 계획 게이트, 코딩 에이전트의 늦은 실패 비용

CodeRabbit 계획 게이트, 코딩 에이전트의 늦은 실패 비용

CodeRabbit은 Claude로 PR 실행 전에 계획을 검증해 AI PR 버그 20% 감소와 리뷰 주기 30% 단축을 보고했습니다.

jqwik 로그가 AI 에이전트에게 말한다, 테스트 출력의 새 공급망 위험

jqwik 로그가 AI 에이전트에게 말한다, 테스트 출력의 새 공급망 위험

jqwik 1.10.0의 AI 에이전트 대상 로그가 테스트 출력, 프롬프트 인젝션, 코딩 에이전트 권한 경계를 새 쟁점으로 만들었습니다.

Copilot 50% 빨라졌다, Work IQ가 바꾼 업무 AI 화면

Copilot 50% 빨라졌다, Work IQ가 바꾼 업무 AI 화면

Microsoft 365 Copilot 새 디자인은 프롬프트 입력창을 Work IQ와 앱 안 에이전트 실행면으로 바꾸려는 시도입니다.

Mistral Search Toolkit 공개, RAG 검색 평가가 기본값

Mistral Search Toolkit 공개, RAG 검색 평가가 기본값

Mistral Search Toolkit public preview는 RAG의 ingestion, retrieval, evaluation을 한 프레임워크로 묶는 시도입니다.

CodeGraph 31.5k 스타, 코딩 에이전트 비용을 줄이는 색인

CodeGraph 31.5k 스타, 코딩 에이전트 비용을 줄이는 색인

CodeGraph v0.9.7은 Claude Code·Codex 같은 코딩 에이전트가 저장소를 읽는 비용을 로컬 코드 그래프로 줄이려는 시도입니다.

Anthropic 650억 달러 투자, Claude 컴퓨트 10GW 확보

Anthropic 650억 달러 투자, Claude 컴퓨트 10GW 확보

Anthropic이 650억 달러 Series H와 9650억 달러 valuation을 발표했습니다. Claude 수요, 10GW 컴퓨트, 클라우드 전략을 짚습니다.

사회과학자 20%만 코딩 에이전트를 쓴다, 연구 생산성의 격차

사회과학자 20%만 코딩 에이전트를 쓴다, 연구 생산성의 격차

Anthropic이 사회과학자 1,260명 설문을 공개했습니다. AI 사용 81%, 코딩 에이전트 20%, 생산성 신호와 채택 격차를 짚습니다.

Claude Code 수백 에이전트 실행, Opus 4.8의 가격 압박

Claude Code 수백 에이전트 실행, Opus 4.8의 가격 압박

Anthropic이 Opus 4.8과 Claude Code dynamic workflows를 공개했습니다. 가격, 병렬 subagent, API 변화가 코딩 에이전트 경쟁의 기준을 바꿉니다.

CoreWeave 40% 절감, 에이전트 개선 루프를 클라우드로

CoreWeave 40% 절감, 에이전트 개선 루프를 클라우드로

CoreWeave가 Serverless RL, W&B Weave, Sandboxes, MCP를 묶어 운영 중 에이전트를 개선하는 클라우드 스택을 공개했습니다.

Vibe가 PR까지 맡는다, Mistral의 산업용 AI 스택

Vibe가 PR까지 맡는다, Mistral의 산업용 AI 스택

Mistral AI Now Summit은 Vibe 통합 에이전트, 물리 AI, 10MW 추론 데이터센터를 한 묶음으로 제시했습니다.

Anthropic의 Claude 격리 공개, AWS 키 탈취 24회가 남긴 경고

Anthropic의 Claude 격리 공개, AWS 키 탈취 24회가 남긴 경고

Anthropic이 Claude Code와 Cowork의 격리 설계를 공개했습니다. 93% 승인, AWS 키 탈취 24회, allowlist 실패가 에이전트 보안 기준을 바꿉니다.

헌법을 따르는 모델 2.0%, AI 행동 명세서의 감사법

헌법을 따르는 모델 2.0%, AI 행동 명세서의 감사법

새 논문은 Claude Constitution과 OpenAI Model Spec을 테스트 가능한 감사 대상으로 바꿨습니다. 모델 정책이 벤치마크가 되는 장면을 짚습니다.