LLM

172개의 글

Google이 Gemini API Managed Agents 프리뷰를 공개했습니다. 샌드박스, 파일 상태, 비용, 네트워크 통제가 쟁점입니다.

OpenAI의 Braintrust Codex 사례는 고객 요청을 테스트, sandbox, preview branch, eval로 잇는 코딩 에이전트 운영 루프를 보여줍니다.

MongoDB가 Automated Voyage AI Embeddings와 LangGraph.js memory를 공개했습니다. 에이전트 운영 병목을 데이터 최신성, 기억, 검색으로 봅니다.

Anthropic의 650억 달러 Series H는 Claude 수요, Opus 4.8, 10GW급 컴퓨트 계약이 한 묶음이 된 사건입니다.

Datadog의 2026 AI Engineering 보고서는 production LLM 오류의 다수가 rate limit에서 시작된다고 봅니다. 운영 병목과 대응책을 짚습니다.

KDD Cup 2026 Data Agents가 700팀 이상 참여와 Docker 보안 심사로 Phase 1 결과를 미뤘습니다. 에이전트 평가의 운영 병목을 봅니다.

OpenRouter가 1억1300만 달러를 조달했습니다. 25조 주간 토큰과 400개 모델 뒤의 라우팅·비용·프라이버시 쟁점을 봅니다.

OpenAI가 ChatGPT에서 o3와 GPT-4.5 은퇴 일정을 공지했습니다. API와 제품 모델 선택표의 차이를 짚습니다.

Cohere가 Apache 2.0 Command A+를 공개했습니다. 218B MoE, 25B active, 2 x H100 배포 조건과 에이전트 성능을 짚습니다.

AWS가 SageMaker AI 모델 커스터마이징을 코딩 에이전트용 Skills로 열었습니다. SFT, DPO, RLVR, 평가, 배포가 노트북 산출물로 묶입니다.

Sierra가 Agent Studio 로컬라이징 사례를 공개했습니다. 900개 이상 파일, 배치 스크립트, linter, context window 실패를 짚습니다.

Lyft가 LangGraph와 LangSmith로 고객지원 에이전트 개발 기간을 약 6개월에서 2주로 줄인 운영 구조를 공개했습니다.