Devlery - AI 개발자를 위한 AI 뉴스 큐레이션
Devlery blog
AI 개발자를 위한 최신 AI 뉴스 큐레이션.
41개 커밋의 착시, Claude Code가 넓힌 개발자 경계
새 arXiv 논문은 Claude Code 채택 뒤 개발자의 언어와 저장소 폭이 넓어지는 신호를 보였지만, 인과 해석에는 큰 빈칸이 남아 있습니다.
47%에서 멈춘 SRE 에이전트, 쿠버네티스 장애의 현실선
Artificial Analysis ITBench-AA는 Kubernetes 장애 원인 분석에서 최고 모델도 46.7%에 머문다는 SRE 에이전트의 현실선을 보여줍니다.
선거 답변에 실시간 개표를 붙인다, OpenAI의 신뢰 레이어
OpenAI가 2026년 선거 세이프가드를 공개했습니다. AP 개표, 투표 정보, Codex Security, SynthID, 정치 편향 평가가 하나의 신뢰 스택으로 묶였습니다.
62만번 공격이 가른 모델 안전, 추론형의 35점 격차
TELUS Digital이 34개 AI 모델을 62만번 이상 공격한 안전 벤치마크를 공개했습니다. 추론형 모델, 작은 모델, 지속 테스트의 차이를 짚습니다.
90% PR을 에이전트가 만든다, Warp 오픈소스의 새 병목
OpenAI와 Warp 사례는 코딩 에이전트 경쟁이 코드 생성에서 오픈소스 검증, 관측성, 에이전트 오케스트레이션으로 옮겨감을 보여줍니다.
HTTP 402가 돌아왔다, AWS가 만든 에이전트 지갑의 통제선
AWS AgentCore Payments preview는 AI 에이전트 결제를 x402, 세션 예산, 자격 증명, 감사 로그의 인프라 문제로 바꿉니다.
2나노 칩렛으로 간 토큰 공장, Furiosa와 Broadcom의 우회로
FuriosaAI와 Broadcom의 3세대 추론 칩 협력은 에이전트 시대 병목이 GPU 밖의 토큰 밀도와 네트워크로 이동했음을 보여줍니다.
API 없는 앱까지 누른다, Copilot Studio GA의 자동화 경계
Microsoft Copilot Studio computer use GA는 UI 자동화 에이전트를 실험에서 기업 배포와 감사 로그의 문제로 옮깁니다.
한 번 호출하면 리눅스가 뜬다, Gemini 에이전트 API의 선
Google Managed Agents는 Gemini API를 모델 호출에서 샌드박스 실행 API로 넓히며 에이전트 운영층의 경계를 바꿉니다.
65% IDE 선택 시대, 코딩 에이전트 전쟁의 새 기준
Gartner의 기업용 AI 코딩 에이전트 분석과 Codex 리더 선정은 개발 도구 경쟁이 거버넌스와 비용 통제로 이동했음을 보여줍니다.
7천건 세금신고가 만든 루프, Codex 자기개선의 조건
OpenAI Tax AI 사례는 에이전트 자동화보다 프로덕션 트레이스, 평가 세트, 실무자 피드백이 더 중요하다는 신호입니다.
받은편지함부터 DCF까지, Codex가 코딩 밖으로 간 이유
Codex use cases가 inbox, 데이터, 재무, QA, 앱 자동화까지 확장됐습니다. 코딩 에이전트가 업무 운영층으로 이동하는 신호입니다.