Blog
AI 뉴스와 코딩 에이전트, LLM, AI 인프라의 변화를 기록합니다.
OpenAI가 Codex에 안전벨트를 채웠다, 에이전트 보안의 새 기준
OpenAI가 GPT-5.5-Cyber와 Codex 안전 운영 지침을 잇달아 공개했습니다. 코딩 에이전트 경쟁이 모델 성능에서 권한, 샌드박스, 감사로그로 이동하고 있습니다.
Claude Code 한도 2배 상향, 병목은 이제 컴퓨트다
Anthropic이 SpaceX Colossus 1 컴퓨트 계약과 함께 Claude Code 5시간 한도를 2배로 올렸습니다. AI 코딩 에이전트의 병목이 모델에서 인프라로 이동하고 있습니다.
Circle Agent Stack, AI 에이전트에게 지갑이 생겼다
Circle이 Agent Stack을 공개했습니다. 에이전트 월렛, x402, 나노페이먼트가 AI 에이전트 경제의 결제 계층으로 떠오르는 이유를 살펴봅니다.
Claude Code /goal 공개, 코딩 에이전트도 완료 조건을 갖는다
Claude Code 2.1.139에 /goal이 추가됐습니다. 에이전트가 언제 멈출지 별도 평가자가 판단하는 변화입니다.
Anthropic 금융 에이전트 10종, 챗봇 다음 전장은 업무 템플릿
Anthropic이 금융/보험용 Claude 에이전트 10종을 공개했습니다. 범용 챗봇을 넘어 규제 산업의 업무 운영층을 겨냥한 변화입니다.
OpenAI GPT-Realtime-2 공개, 음성 AI는 이제 업무를 처리한다
OpenAI가 GPT-5급 추론을 갖춘 GPT-Realtime-2와 실시간 번역·전사 모델을 공개했습니다. 음성 AI 경쟁이 음질에서 업무 수행 능력으로 이동하는 흐름을 살펴봅니다.
1만 명이 답했다, AI 코딩 도구의 승자는 만족도가 결정한다
JetBrains AI Pulse 설문에서 Claude Code가 만족도 91%와 NPS 54로 시장 1위를 기록했습니다. GitHub Copilot 성장이 정체된 사이, best-of-breed 시대가 도래하고 있습니다.
MiniMax M2.7이 스스로 진화했다, Opus 성능의 90%를 7% 가격에
MiniMax가 AI 모델이 자신의 학습 과정에 직접 참여하는 자기 진화 메커니즘의 M2.7을 오픈소스로 공개했습니다. 230B 파라미터 중 10B만 활성화하며 Claude Opus 4.6에 근접한 성능을 50배 이상 저렴한 가격에 제공합니다.
Claude Mythos Preview 공개, Anthropic이 "너무 위험한 AI"를 40개 기관에만 배포한 이유
Anthropic이 Claude Mythos Preview를 공개하면서 일반 배포를 거부했습니다. 모든 주요 OS에서 수천 개 제로데이를 발견한 이 모델은 Project Glasswing을 통해 방어적 보안 용도로만 제한 배포됩니다.
Stanford AI Index 2026이 확인한 역설: 53% 채택, 40점 투명성
Stanford HAI가 AI Index 2026을 발표했습니다. 생성형 AI는 3년 만에 인류 절반이 채택했지만, 모델 투명성은 58점에서 40점으로 추락했습니다. 에이전트 성공률 20%에서 77%로의 급등과 함께, 채택과 불투명성의 역설을 데이터로 분석합니다.

GLM-5.1이 SWE-Bench Pro 1위를 찍은 날, Meta는 오픈소스를 버렸다
중국 Z.ai가 744B MoE 모델 GLM-5.1을 MIT 라이선스로 공개하며 SWE-Bench Pro에서 Claude Opus 4.6과 GPT-5.4를 제치고 1위를 차지했습니다. 같은 주에 Meta가 클로즈드로 전환한 것과 극명한 대비를 이룹니다.
Meta Muse Spark 출시, 오픈소스의 상징이 문을 닫은 이유
Llama 4 실패 9개월 만에 Meta가 첫 프로프라이어터리 모델 Muse Spark을 출시했습니다. Alexandr Wang이 이끄는 MSL의 전략 전환과 개발자 생태계 충격을 분석합니다.