LLM

172개의 글

NVIDIA와 NAVER가 DSX 기반 AI factory를 55MW에서 기가와트로 키웁니다. HyperCLOVA X, NemoClaw, Seoul World Model의 실행 조건을 봅니다.

Cohere가 30B 중 3B만 활성화하는 Apache 2.0 코딩 모델 North Mini Code를 공개했습니다.

Google이 DiffusionGemma를 공개했습니다. 256토큰 canvas, vLLM 지원, 18GB VRAM 조건이 로컬 추론 병목을 어떻게 바꾸는지 봅니다.

Anthropic이 Fable 5와 Mythos 5를 공개했습니다. 같은 기반 모델을 안전장치, 제한 접근, 가격, 클라우드 보관 조건으로 나눴습니다.

Anthropic은 Claude가 production codebase 병합 코드의 80% 이상을 작성한다고 밝혔습니다. 작성 자동화 뒤의 검토 병목을 봅니다.

Claude의 6월 2일 모델 오류는 AI 에이전트 운영에서 retry, checkpoint, fallback 설계가 왜 제품 요구사항인지 드러냈습니다.

Microsoft MAI-Code-1-Flash가 Copilot에 들어왔습니다. 137B MoE, 5B active, 256K context와 AI Credits 비용을 짚습니다.

Google Gemma 4 12B가 16GB 노트북 로컬 실행, 오디오·비전 통합, LiteRT-LM OpenAI 호환 서버를 전면에 세웠습니다.

OpenAI가 ChatGPT Dreaming V3를 배포했습니다. 자동 메모리 합성은 개인화를 키우지만 삭제, 출처, 검토 UX를 더 어렵게 만듭니다.

Microsoft가 Aion 1.0 Plan, Edge Aion API, MXC를 묶어 Windows 로컬 에이전트 실행 경로를 공개했습니다.

Tether QVAC SDK 0.12.0이 Google TurboQuant를 구현해 긴 컨텍스트 로컬 AI의 KV 캐시 메모리 병목을 줄입니다.

OpenAI GPT-5.5, GPT-5.4, Codex가 Amazon Bedrock GA로 전환됐습니다. IAM, Region, Codex 기능 공백을 짚습니다.